作為中文搜索引擎的兩大巨頭,百度和google在網(wǎng)站收錄方面,各自有著自己的側(cè)重點和收錄原則,對于大型網(wǎng)站(比如門戶新聞網(wǎng)站)以及其他更新量大的網(wǎng)站,百度和Google的索引速度都很快,基本上都能做到當天更新。但是對于一些更新量小的網(wǎng)站,兩者就有比較明顯的區(qū)別,Google對于高權(quán)重并提交Sitemaps和Ping的網(wǎng)站,索引速度可以達到分鐘級別,比如幾分鐘就可以在搜索排名中看到自己剛剛編寫的文章,但百度索引速度較慢,如果不是權(quán)重較高的站點,有可能一天、三天甚至更久才被收錄??傮w來講,百度對于網(wǎng)站首頁的關(guān)注以及權(quán)重給的似乎特別高,而Google對于最終的文章內(nèi)容頁面的關(guān)注多于百度。
作為全球最大的多語言搜索引擎,Google在發(fā)展歷史過程中已形成了自己的網(wǎng)頁收錄習(xí)慣,也建立起自己的一套標準。研究Goolge收錄網(wǎng)頁的習(xí)慣有利于更好地迎合Google搜索引擎的口味,達到提高網(wǎng)頁收錄量和收錄排名的目的。
Google PageRank能夠?qū)W(wǎng)頁的重要性做出客觀的評價,PageRank并不計算直接鏈接的數(shù)量,而是將從網(wǎng)頁A指向網(wǎng)頁B的鏈接解釋為由網(wǎng)頁A對網(wǎng)頁B所投的一票。這樣,PageRank會根據(jù)網(wǎng)頁B所收到的投票數(shù)量來評估該頁的重要性。谷歌的搜索引擎同時也分析網(wǎng)頁內(nèi)容,他并不采用單純掃描基于網(wǎng)頁的文本(網(wǎng)站發(fā)布商可以通過元標記控制這類文本)的方式,而是分析網(wǎng)頁的全部內(nèi)容以及字體、分區(qū)及每個文字精確位置等因素,Google同時還會分析相鄰網(wǎng)頁的內(nèi)容,以確保返回與用戶查詢最相關(guān)的結(jié)果。
百度對于新站一般都不會立刻收錄,并且在相當長的時間內(nèi)都不會收錄,當新網(wǎng)站在搜索引擎有了一個不錯且穩(wěn)定的表現(xiàn),并且有了較多的反向鏈接,會出現(xiàn)一個閥值。百度判斷其網(wǎng)站內(nèi)容的質(zhì)量,會開始收錄這個新站點內(nèi)容,這時候網(wǎng)站才會出現(xiàn)來自百度的流量。而百度似乎對于自己的網(wǎng)站(百度知道、百度空間、百度百科等)給予較高的權(quán)值,并且更青睞于那些更新頻繁的大型門戶網(wǎng)站,而對于反向鏈接似乎沒有給予太多的權(quán)重。
綜上所述,從網(wǎng)站收錄速度上來看,Google現(xiàn)在比百度要快,不過由于百度的用戶更多一些,所以網(wǎng)站搜索來源大多還是來自于百度,在搜索引擎中的份額約占70%左右。