我們收到過許多期望我們改進(jìn)對 Adobe Flash 文件索引問題的建議。今天,索引團(tuán)隊(duì)的軟件工程師 Ron Adler 和 Janis Stipins ,將就我們最近在 Flash 文件索引編制上取得的改進(jìn)與大家進(jìn)行更深入的探討和交流。
問:目前哪些 Flash 文件能更好地被谷歌索引到呢? 我們改善了對所有類型 SWF 文件中的文字內(nèi)容的索引能力,其中包括像按鈕或菜單這樣的 Flash “小工具”,獨(dú)立自成一體的 Flash 網(wǎng)站,以及所有介于兩者之間的 Flash 形式。
問:這些 Flash 文件中的哪些內(nèi)容能被谷歌更好地索引呢? 用戶在與您的 Flash 文件互動(dòng)過程中所看到的一切文本內(nèi)容都將得到更好地索引。如果您的網(wǎng)站包含 Flash ,其中的文字內(nèi)容會被 Google 用來生成您網(wǎng)站的摘要。同時(shí),出現(xiàn)在 Flash 文件中的文字可以用來匹配用戶在 Google 搜索框中輸入的搜索查詢。
除了索引 Flash 文件中的文本內(nèi)容,我們現(xiàn)在也能夠識別在 Flash 文件中的出現(xiàn)的 URL ,并且把這些鏈接納入搜索引擎機(jī)器人爬行的目標(biāo)隊(duì)列中,就像對待那些非 Flash 網(wǎng)頁中出現(xiàn)的 URL 一樣。例如,如果您的 Flash 應(yīng)用程序中包含指向您網(wǎng)站內(nèi)部頁面的鏈接,Google 現(xiàn)在能夠更好地發(fā)現(xiàn)并抓取您的網(wǎng)站。
問:那么 Flash 文件中包含的非文本內(nèi)容呢,比如圖片? 目前,我們只能識別和索引 Flash 文件中的文本內(nèi)容。如果您的 Flash 文件里只有圖片,我們將不能識別和索引出現(xiàn)在這些圖片中的任何文字。類似地,如果一個(gè) Flash 按鈕沒有任何附屬的文字的話,我們將無法對這類指向特定鏈接的 Flash 按鈕生成任何錨文本。
還應(yīng)注意到的是,我們無法索引 FLV 文件,比如在 YouTube 上播放的視頻,因?yàn)檫@些文件沒有包含任何文字元素。
問:Google 是怎樣識別 Flash 文件里的內(nèi)容呢? 我們開發(fā)出了一種算法,這種算法可以使 Google 機(jī)器人能夠模仿人類通過點(diǎn)擊按鈕、輸入內(nèi)容等方式來了解 Flash 文件。我們的算法能夠記住沿途它遇到的所有文字內(nèi)容,其后這些內(nèi)容都能被索引到。我們無法告訴您更多的保密細(xì)節(jié),但是我們可以告訴您,通過使用 Adobe 的新型可檢索性 SWF 數(shù)據(jù)庫,這種算法的有效性得到了進(jìn)一步提高。
問:我怎樣做才能使 Google 索引到我的 Flash 文件中出現(xiàn)的文本呢? 基本上,您不需要做任何事情。我們已經(jīng)取得的技術(shù)改進(jìn),使這項(xiàng)功能的實(shí)現(xiàn),無需網(wǎng)頁設(shè)計(jì)者或網(wǎng)站管理員做任何特別的操作。如果您的網(wǎng)站上有 Flash 內(nèi)容,我們會在現(xiàn)有技術(shù)能力的基礎(chǔ)上,盡最大能力對它們自動(dòng)進(jìn)行索引(詳見接下來的問題)。
也就是說,您應(yīng)該了解 Google 現(xiàn)在已經(jīng)可以識別那些展現(xiàn)在您網(wǎng)站訪問者面前的文字信息。如果你希望 Google 忽略一些次要內(nèi)容,如“版權(quán)”或“加載”等信息,您可以考慮把那些文本替換為圖片,這樣它們就不會被我們抓取到了。
問:在索引 Flash 文件上,Google 遇到的主要技術(shù)難題是什么? 目前的問題主要體現(xiàn)在三個(gè)方面,這也正是我們在努力解決的:
1、Googlebot 不能執(zhí)行某些類型的 JavaScript 程序。因此,如果您的網(wǎng)頁通過 JavaScript 加載 Flash 文件的話,Google 可能無法識別該 Flash 文件,在這種情況下,它將不會被索引到。
2、目前,我們還無法把那些通過您的 Flash 文件加載的外來內(nèi)容和您的 Flash 文件整合起來。也就是說,如果您的 Flash 文件加載了一個(gè) HTML文件,或一個(gè) XML 文件,或另一個(gè) SWF 文件等等,Google 將分別索引這些資源,但是它們將不會被認(rèn)為是您 Flash 文件內(nèi)容的一部分。
3、雖然我們能夠索引在網(wǎng)絡(luò)上出現(xiàn)的幾乎所有語種的 Flash ,但在識別用雙向語言書寫的 Flash 內(nèi)容還有一定困難。在這個(gè)問題解決之前,我們將無法識別和索引 Flash 文件中的希伯來文或阿拉伯文的內(nèi)容。
但是,在這些問題上我們也已經(jīng)取得了相當(dāng)?shù)倪M(jìn)展,所以,敬請期待我們進(jìn)一步的改進(jìn)! |