前天晚上幾個朋友一起討論百度能不能抓到到css里面的內(nèi)容而展出了討論,胖子和啟程認為可以,但幾個技術(shù)出身的朋友說不可以,找了一下zac的書,沒有發(fā)現(xiàn),就進入到站長俱樂部進行查找,得到了答案。并花時間整理和收錄出來一些站長常見的問題,全部由百度工作人員lee解答。
1、百度是否能抓取CSS樣式表并識別分析?
百度是能夠抓取并分析CSS的。
2、百度5.20大更新,你有什么看法?
簡而言之:我們的系統(tǒng)在更新數(shù)據(jù)的過程中出了點狀況,問題被及時發(fā)現(xiàn)后,已經(jīng)于5月20日中午修復,目前還有部分內(nèi)容由于緩存等原因正在更新中,很快就會恢復正常。今后我們會加強相應(yīng)的保障機制,避免再次出現(xiàn)同類問題。同時也很抱歉讓大家造成一些誤解。
3、百度蜘蛛爬行不存在的路徑?
Baiduspider只抓取能從互聯(lián)網(wǎng)上找到的url,如果Baiduspider大量抓取你網(wǎng)站上不存在的url,可能有兩個原因:1)你網(wǎng)站內(nèi)有部分網(wǎng)頁指向其他網(wǎng)頁的url格式不正確。2)互聯(lián)網(wǎng)上有其他網(wǎng)站指向了你網(wǎng)站內(nèi)不存在的網(wǎng)頁。另外,Baiduspider抓取到不存在的網(wǎng)頁,服務(wù)器應(yīng)該返回404錯誤。
4、我在robots.txt中設(shè)置了禁止百度收錄我網(wǎng)站的內(nèi)容,為何還出現(xiàn)在百度搜索結(jié)果中?
如果其他網(wǎng)站鏈接了您robots.txt文件中設(shè)置的禁止收錄的網(wǎng)頁,那么這些網(wǎng)頁仍然可能會出現(xiàn)在百度的搜索結(jié)果中,但您的網(wǎng)頁上的內(nèi)容不會被抓取、建入索引和顯示,百度搜索結(jié)果中展示的僅是其他網(wǎng)站對您相關(guān)網(wǎng)頁的描述。
5、新域名在百度下的權(quán)重比舊域名高的情況下,將舊域名301重定向到了新域名會有什么影響?或者說百度下的301是將權(quán)重替換還是疊加的呢?
將舊域名301重定向到新域名,舊域名的權(quán)值會疊加到新域名上。
6、網(wǎng)站的gzip壓縮對網(wǎng)站的收錄和權(quán)重有沒有影響?
gzip對收錄和權(quán)重沒有影響。對搜索引擎唯一的影響,是抓取速度會快一些。
7、域名A曾經(jīng)301至域名B ,如果現(xiàn)在又將域名B301回A是否還能保持原來權(quán)重?
會,但會有一段時間的考查和權(quán)值轉(zhuǎn)移期。
8、百度的真正外鏈是什么命令,是否無法查詢?
百度目前沒有查詢外鏈的查詢命令,但我們已經(jīng)計劃在站長平臺中支持外鏈查詢。
9、標題長短對于網(wǎng)站權(quán)重的影響有多大?
正如同一個頁面上的導出鏈接越多,每個鏈接獲得的權(quán)重越小一樣,title上的關(guān)鍵詞越多,單個關(guān)鍵詞獲得的權(quán)重也會越低。這是很直觀的邏輯。但是,如果為追求某個關(guān)鍵詞的權(quán)重,極力壓縮標題長度,那么真正合乎該頁面的搜索需求,又很難被命中。所以,一般性的建議就是,實事求是的將頁面主旨反映在標題中即可。如果要做長青樹,不要在乎一時一刻的seo效果(那個很累、很煩),把網(wǎng)站的忠實用戶人氣做起來就成了。
10、修改頁面標題(如增加前綴或后綴)是否會影響網(wǎng)站排名?
title是極重要的內(nèi)容,大幅修改,只會帶來大幅波動,所以請慎重對待網(wǎng)頁標題。
11、修改首頁的description標簽,會不會受到懲罰?
這個肯定是多慮了,我們鼓勵大家通過description來撰寫網(wǎng)站的簡介,只是過于頻繁的修改,可能不會及時反饋在摘要中。
12、更換服務(wù)器是否對排名有影響?
原則上是不會的。除非新?lián)Q的服務(wù)器太糟糕,三天兩頭訪問失敗,或者服務(wù)器從國內(nèi)換到國外,這就很可能被和諧。
13、百度對重復內(nèi)容是如何處理的?
搜索引擎的排序出發(fā)點,是用戶的搜索體驗。雖說,很多時候尊重原創(chuàng)和用戶體驗是一致的,但是,畢竟也有一些案例,轉(zhuǎn)載的體驗會比原創(chuàng)更好,這時原創(chuàng)的排序未必會高于轉(zhuǎn)載者,但是,原創(chuàng)的應(yīng)該以另外一種方式被肯定,而不是簡單的被聚合掉。
14、我買了一個老域名,重新建站,權(quán)重會繼承嗎?
正常的域名轉(zhuǎn)手,域名會被當做一個全新的域名看待,前帳一筆勾銷。
15、百度對如何看待nofollow?
如果您不想搜索引擎追蹤此網(wǎng)頁上的鏈接,且不傳遞鏈接的權(quán)重,請將此元標記放入網(wǎng)頁的 HEAD 部分:meta name=”robots” content=”nofollow”;如果您不想百度追蹤某一條特定鏈接,百度還支持更精確的控制,請將此標記直接寫在某條鏈接上: a href=”signin.php” rel=”nofollow”>登錄/a
16、修改robots之后多久生效?
不同的站點略有不同,但通常會在幾天內(nèi)生效。根據(jù)筆者的經(jīng)驗,只要保持外鏈的增長和原創(chuàng)內(nèi)容的更新,大概是4天對于老站,而新站大概一個星期左右。
17、一個頁面有多個重復的鏈接,并且鏈接文字相同,搜索引擎在傳遞權(quán)重時,只傳遞一次權(quán)重,還是每個鏈接都要傳遞權(quán)重?另外,這幾個重復的鏈接獲得的權(quán)重一樣么?
重復的鏈接不會增加鏈接權(quán)重
18、百度是否能識別和處理純文本形式的鏈接(非標簽)?
可以,搜索引擎的spider需要及時發(fā)現(xiàn)和抓取互聯(lián)網(wǎng)上的鏈接,至于鏈接是什么形式,并不重要,也許有一天,我們還可以識別圖片里、語音里、視頻里或是其它形式的鏈接。
19、option標簽里面的鏈接可以被蜘蛛抓到么?
可以提取,效果等同于A標簽。
20、標題過長是否會對百度搜索不利?
這個自然是沒有限制的。很多人喜歡往標題里塞很多關(guān)鍵詞,以為那樣就全面開花,但很可能適得其反,這個原理跟在一個頁面上有多個超鏈接一樣。分一杯羹的人越多,每個人所得的羹越少。
21、百度什么時候更新?
沒有“更新前”和“更新后”,百度無時無刻不在更新。
22、假如競爭對手惡意群發(fā)我網(wǎng)站鏈接到非法站點,對我網(wǎng)站有影響嗎?
我們有很完善的識別算法,這些行為并不會導致你的網(wǎng)站受到影響。
23、很多人說.info和.hk等域名被降權(quán)了,是不是真的?
使用何種后綴的域名,對搜索引擎沒有直接的影響。但.com、.cn、.net等常見的域名后綴更容易記憶,增加用戶的判斷成本。
24、百度建議URL靜態(tài)化嗎?還是像Google一樣,不建議URL靜態(tài)化?對偽靜態(tài)怎樣看待?和真的靜態(tài)文件一樣嗎?
對URL的動靜態(tài),沒有歧視政策。
之所以以前有過提倡靜態(tài)的說法,是因為很多動態(tài)URL,帶了很多參數(shù),而實質(zhì)上內(nèi)容是一樣的。這個給spider以及站長都帶來不必要的麻煩。我們在這上邊花了不少精力。所以,總的原則就是,URL的動靜態(tài)無所謂,只是盡可能的避免重復即可。但是動態(tài)url也不要動態(tài)得太變態(tài),搞幾十個參數(shù),那會嚇著蜘蛛。醞釀中的sem指南,會有對url優(yōu)化方面的詳細說明。
25、搜索結(jié)果中顯示標題與實際標題不一致?
原因比較復雜,需要針對性分析。主要原因可能是tag title提取失敗,系統(tǒng)只好從其他地方取了一些文本作為標題。這種提取失敗的原因,有網(wǎng)頁設(shè)計層面的(比如全是flash或者ajax),也有robots封禁層面的(某些重要網(wǎng)頁雖然不抓取,但會保留url本身)。還有一些系統(tǒng)異常也會造成類似的現(xiàn)象。如果不符合一般性的預(yù)期,這類問題都可以直接提交至webmaster#baidu.com。會有工程師跟進的。
26、在百度快照里頁面沒有顯現(xiàn)完整,首頁底部(友情鏈接及版權(quán)信息那塊)代碼和頁面都沒在快照中出現(xiàn),那么友情鏈接對其他網(wǎng)站還有用嗎?
這種情況不會影響友情鏈接。另外,我們建議盡量將頁面大小控制在合適范圍內(nèi)。
27、以前百度顯示網(wǎng)頁體積的時候最大是125K,超過這個范圍快照顯示就不正常,是不是意味著網(wǎng)頁體積大于125K就對搜索引擎的抓取或收錄有影響了?
頁面大小和搜索引擎的抓取之間沒有直接關(guān)系。但我們建議網(wǎng)頁(包括代碼在內(nèi))不要過大,過大的網(wǎng)頁會有抓取截斷;而內(nèi)容部分,也不要過大,過大會被索引截斷。當然,抓取截斷的上限,會遠大于索引截斷的上限。
28、Google傾向于說每個網(wǎng)頁的導出鏈接不要超過100為宜,百度有沒有什么建議?
這個暫時沒什么建議。一般情況下,鏈接數(shù)量,會影響到這些鏈接從該頁面上所獲得的權(quán)重;少就多分一些,多就少分一些。
29、js代碼彈窗是否會影響自然排名?
任何對用戶體驗有增益或者減益的做法,其實會影響到用戶的"投票"行為。而這些投票行為,又會影響搜索引擎對這個網(wǎng)站的評價算法。所以,彈不彈窗并不重要呀,關(guān)鍵是這種彈窗會對用戶造成什么樣的影響。
30、百度針對連接上存在不存在有效期的問題,意思上是說,一個鏈接的權(quán)重會不會過一段時間后就會沒有了,或者逐漸降低?
如果各位站長要揣摩百度的策略細節(jié),我覺得不如站在用戶的角度,用一種合乎常理的邏輯去做推斷。比方鏈接時效性問題,實際是有利有弊。利在于,過去的投票,只反映被投票者在過去的價值,不見得能反映現(xiàn)時情況;弊在于,正常投票不大會重復投,過去投過了,現(xiàn)在就可能不投了,但不代表現(xiàn)在對被投票者的不認可。那么究竟應(yīng)該怎么做呢?呵呵。我也不清楚。
31、原創(chuàng)內(nèi)容不能被識別怎么辦?
這個,只能說百度的策略還不是很完善,我們也一直在改進。另外,從用戶體驗角度,有些轉(zhuǎn)載未必比原創(chuàng)差。比方一篇科技原創(chuàng)博文,被知名門戶網(wǎng)站的科技頻道轉(zhuǎn)載。如果這種轉(zhuǎn)載保留原創(chuàng)者姓名和出處鏈接,實際上對原創(chuàng)者是有利的,因為起到了更好的傳播效果。只是國內(nèi)的轉(zhuǎn)載,很多是掐頭去尾,使原創(chuàng)者比較受傷。
32、百度是否跟蹤JavaScript鏈接?
javascript的解析,是很多搜索引擎正在做的事情;同理,對flash的解析。畢竟有那么多應(yīng)用javascript或者flash的網(wǎng)站,其實并沒有意識到,他們的做法給搜索引擎的收錄和索引帶來的麻煩。所以,如果期望不被搜索引擎收錄的話,最直接的手段,還是寫robots文件。
33、鏈接點擊率是否計入排名算法,百度是否有會估算某網(wǎng)頁的某個反向鏈接被點擊次數(shù)(例如:從工具條、流量統(tǒng)計等工具得到的部分數(shù)據(jù))?比如是否把鏈接的點擊率計入算法之中?是否會利用這點來判斷哪些是隱藏鏈接?或者判斷外鏈的相關(guān)性等因素。
我只能說,一切有利于排序改進的因素,都有可能被搜索引擎嘗試應(yīng)用。
34、為什么蜘蛛每天爬n次,而收錄網(wǎng)頁只有一兩篇?
網(wǎng)頁抓取和建立索引是不等同的。這些網(wǎng)頁會經(jīng)過一些必要的chk過程之后才會被建入索引。
提醒大家考核搜索引擎優(yōu)化的效果,不要只關(guān)注流量,更應(yīng)關(guān)注轉(zhuǎn)化率文章。如果要做長青樹,不要在乎一時一刻的seo效果(那個很累、很煩),把網(wǎng)站的忠實用戶人氣做起來就成了。