網(wǎng)址規(guī)范化一直是困擾站長以及搜索引擎的一個(gè)問題。據(jù)估計(jì),網(wǎng)上有10%-30%的URL是內(nèi)容相同但URL不一樣的不規(guī)范化網(wǎng)址。這就造成幾個(gè)問題。比如:對(duì)站長來說,多個(gè)URL存在分散了頁面權(quán)重,不利于排名。對(duì)搜索引擎來說,浪費(fèi)資源,浪費(fèi)帶寬。搜索引擎發(fā)現(xiàn)多個(gè)網(wǎng)址內(nèi)容相同時(shí),不會(huì)懲罰,而會(huì)盡可能找出那個(gè)應(yīng)該是規(guī)范化的網(wǎng)址。但程序畢竟只是程序,可能出錯(cuò),挑出來的可能不是站長想要的那個(gè)規(guī)范化網(wǎng)址。
網(wǎng)站上網(wǎng)址規(guī)范化問題太嚴(yán)重的話,也可能影響收錄。一個(gè)權(quán)重不很高的域名,能收錄的總頁面數(shù)字是有限的。搜索引擎把資源花在收錄不規(guī)范的網(wǎng)址上,留下給真正不同內(nèi)容的資源就減少了。要解決URL規(guī)范化問題也有很多選項(xiàng),比如:在Google管理員工具中設(shè)置帶3W和不帶3W的,哪一個(gè)是規(guī)范化版本使用301轉(zhuǎn)向,把不規(guī)范化URL全部轉(zhuǎn)向到規(guī)范化URL確保使用的CMS系統(tǒng)只產(chǎn)生規(guī)范化網(wǎng)址確保網(wǎng)站上所有站內(nèi)鏈接都指向規(guī)范化網(wǎng)址在提交給搜索引擎的網(wǎng)站地圖中全部指定規(guī)范化網(wǎng)址但這些方法都各有局限。
Google管理員工具不適用于其他搜索引擎有的站長因?yàn)槟撤N原因做不了301轉(zhuǎn)向CMS系統(tǒng)大部分情況下不受自己控制內(nèi)部鏈接自己可以控制,但其他人鏈接到自己網(wǎng)站上就不受控制了總之,雖然有解決方法備選,但網(wǎng)址規(guī)范化到目前為止還是個(gè)不小的問題。前幾天Google,雅虎,微軟共同發(fā)布了一個(gè)新的標(biāo)簽canonical tag,用于解決網(wǎng)址規(guī)范化問題。簡單說,就是在HTML文件的頭部加上這樣一段代碼。
簡單說,這個(gè)標(biāo)簽相當(dāng)是一個(gè)頁面內(nèi)的301轉(zhuǎn)向。區(qū)別在于用戶并不被轉(zhuǎn)向,還是停留在不變網(wǎng)址上,而搜索引擎會(huì)把它當(dāng)作是301轉(zhuǎn)向處理,也就是說把頁面鏈接的權(quán)重都集中到代碼中指明的規(guī)范化網(wǎng)址上。另外有幾個(gè)細(xì)節(jié)站長需要注意:這個(gè)標(biāo)簽只是一種建議或暗示,而不是指令,它不像robots文件那樣是個(gè)指令。所以搜索引擎會(huì)很大程度上考慮這個(gè)代碼,但并不是百分之百,還會(huì)考慮其他情況來判斷規(guī)范化網(wǎng)址。這也防止站長有可能把網(wǎng)址弄錯(cuò)。這段代碼既可以使用絕對(duì)地址,也可以使用相對(duì)地址。通常還是建議使用絕對(duì)地址比較保險(xiǎn)。指定的規(guī)范化網(wǎng)址上的內(nèi)容,與其他使用這段代碼的非規(guī)范化網(wǎng)址內(nèi)容可以有一些不同,不一定完全一樣。
比如在電子商務(wù)網(wǎng)站上有很多按價(jià)錢、顏色,、尺寸升降排序,生成的URL全都不一樣,但內(nèi)容大體相同,只有細(xì)小區(qū)別,就可以使用這個(gè)標(biāo)簽。指定的規(guī)范化網(wǎng)址可以是不存在頁面,返回404,也可以是還沒有被收錄的頁面。但是不建議這么做,別沒事找事。這個(gè)標(biāo)簽適用于同一個(gè)域名內(nèi),包括二級(jí)域名。但不適用于不同域名之間,防止有人劫持。別把這個(gè)標(biāo)簽當(dāng)救命草,首先還是得把網(wǎng)站結(jié)構(gòu)做好,盡量避免出現(xiàn)URL規(guī)范化問題。這只是最后萬不得已的方法。敏感的人大概能從這個(gè)新標(biāo)準(zhǔn)里看到建立大量外部鏈接的機(jī)會(huì)。最后提一句,這個(gè)標(biāo)準(zhǔn)被3大搜索引擎Google,雅虎,微軟同時(shí)支持,為什么沒提百度呢?記得看到報(bào)道,從搜索量來看,百度是世界上第二大搜索引擎,為什么不帶著我們一起玩?
十堰SEO 十堰網(wǎng)站優(yōu)化 http://www.wxask.com