網(wǎng)站需要的文章頁面數(shù)量,往往不是數(shù)以萬計,而是百萬級別的,如何短期內(nèi)讓網(wǎng)站收錄翻倍或者翻數(shù)倍?第一種方法是增加內(nèi)容,第二種方法 是提升網(wǎng)站在搜索引擎里的“收錄率”。
如何快速增加網(wǎng)站內(nèi)容?
常見的辦法有三種:關(guān)鍵詞詞庫建設(shè)、Tag頁面生成、UGC頁面生成。
一般在規(guī)劃網(wǎng)站的時候,是根據(jù)產(chǎn)品的sku來生成頁面。關(guān)鍵詞詞庫的做法,是挖掘行業(yè)內(nèi)所有的通用詞、產(chǎn)品詞、競品詞和品牌詞,再根據(jù) 這些詞來生成頁面。以58同城為例,建網(wǎng)之初就把地域細(xì)化到縣城,根據(jù)乘法原理:縣級單位x通用詞X小領(lǐng)域分類x大領(lǐng)域分類生成頁面;大眾點評則把地域細(xì)化到某條馬路或者某個POL這樣根據(jù)乘法原理,過億的馬路就能產(chǎn)生數(shù)百億的頁面。
淘寶的關(guān)鍵詞詞庫數(shù)以億計,做返利平臺的項目的關(guān)鍵詞詞庫卻數(shù)以十億計。
挖詞這個工作,對于“資深SEO分析師”來說并不難,難的是如何“打標(biāo)簽”,使得生成的聚合頁面不被搜索引擎視為“垃圾頁面”,確保頁面的原創(chuàng)度和用戶體驗。
關(guān)鍵詞詞庫建設(shè),是以關(guān)鍵詞為核心,迅速生成億萬級別的頁面,那么,Tag聚合頁面,是以關(guān)鍵詞指數(shù)為核心,迅速生成千萬級別的Tag頁面。
Tag頁面可以理解成專題、列表頁,但對于Tag頁面的權(quán)重,從投票的原理講,Tag頁面有多個內(nèi)頁進(jìn)行投票,權(quán)重應(yīng)該高于文章頁,這也是幾乎所有門戶網(wǎng)站都做過的事情;從用戶體驗的角度考慮,Tag頁面有時候遠(yuǎn)不如文章頁更有參考價值。前不久百度打擊網(wǎng)站垃圾頁面,其中,備受打擊的主要是Tag頁面。
很多門戶類網(wǎng)站,先是批量釆集垃圾頁面,甚至不會去重,直接堆積在網(wǎng)站數(shù)據(jù)庫,然后根據(jù)關(guān)鍵詞生成Tag頁面。雖然文章對于搜索引擎來說是垃圾,但文章title或meta生成的Tag頁面對于搜索引擎來說就是原創(chuàng)。雖然搜索引擎對Tag頁面的權(quán)重越來越低,但相關(guān)度高、用戶體驗好的Tag頁面,仍然具有很高的投票能力。
Tag頁面生成的第一步是拓詞,方式與關(guān)鍵詞詞庫建設(shè)一樣。區(qū)別在于,需要制作不同的專題模板,而且首頁必須給一個入口。
以某保險類網(wǎng)站為例,先做一個標(biāo)簽頁,即入口頁。
1、Tag關(guān)鍵詞聚合頁后臺需求建議
(1)支持關(guān)鍵詞去重功能,當(dāng)某個關(guān)鍵詞在導(dǎo)入到后臺關(guān)鍵詞庫中后,再次導(dǎo)入關(guān)鍵詞無效,即新導(dǎo)入的重復(fù)關(guān)鍵詞不生成ID,也不生成新的頁面。
(2)每次能夠批量導(dǎo)入1-5000個關(guān)鍵詞,并給導(dǎo)入的每個新的不重復(fù)的關(guān)鍵詞生成單獨的ID
(3)在后臺會提示哪些導(dǎo)入的關(guān)鍵詞是重復(fù)的,并支持刪除重復(fù)關(guān)鍵詞的功能。
(4)后臺導(dǎo)入關(guān)鍵詞后,點擊生成頁面,能夠在后臺預(yù)覽到網(wǎng)站數(shù)據(jù)庫中生成的頁面信息。
(5)后臺能夠檢測到不同的關(guān)鍵詞生成結(jié)果頁時的內(nèi)容重復(fù)度,若多個關(guān)鍵詞之間的內(nèi)容出現(xiàn)了70%以上的重復(fù),則后臺會有對應(yīng)的提示,且這些出現(xiàn)重復(fù)ID的關(guān)鍵詞不生成頁面和URL。
(6)后臺需要設(shè)置超級管理員和普通用戶的用戶權(quán)限級別,普通用戶可以上傳關(guān)鍵詞和預(yù)覽生成頁面、查詢關(guān)鍵詞ID信息功能,但沒有發(fā)布上線關(guān) 鍵詞頁面的權(quán)限;超級管理員除了擁有普通用戶的所有權(quán)限外,還有點擊發(fā)布上線搜索關(guān)鍵詞的權(quán)限。
(7)導(dǎo)入的關(guān)鍵詞必須包含兩個中文字符或兩個英文字符才有資格生成搜索聚合頁,單個漢字或英文字母不支持導(dǎo)入到關(guān)鍵詞庫和生成頁面的資格。
(8)支持給關(guān)鍵詞生成的聚合頁自動或手動添加Tag標(biāo)簽,這些標(biāo)簽是為 后期調(diào)用含有相同標(biāo)簽的資訊文章、評論、專題、其他聚合頁使用。
(9)支持對關(guān)鍵詞聚合頁面的單個和批量的“增、刪、改”功能。
(10)支持導(dǎo)出現(xiàn)有搜索聚合頁關(guān)鍵詞庫中的全部或部分關(guān)鍵詞功能。
注:如果你的網(wǎng)站CMS沒有這些功能,也沒事,可以根據(jù)這種思路自己調(diào)整優(yōu)化,也可以查看我們錦繡大地SEO培訓(xùn)基地VIP課程,學(xué)習(xí)使用。
2、Tag聚合頁生成注意事項
(1)每個頁面最多生成40篇文章,最少生成10篇文章;低于10篇文章的不生成URL和頁面°
(2)每個生成的關(guān)鍵詞聚合頁之間的內(nèi)容重復(fù)度不能高于70%,高于70%的則后來導(dǎo)入的關(guān)鍵詞不生成URL和頁面。
(3)每個關(guān)鍵詞生成的文章標(biāo)題中必須完整包含一個以上相同詞根(詞根字符數(shù)大于或等于2,若數(shù)據(jù)庫中有中文和英文分詞詞根最好),此時也需要程序員在關(guān)鍵詞導(dǎo)入后,檢測生成的文章結(jié)果質(zhì)量。
(4)前期生成的關(guān)鍵詞聚合頁,必須有專門的人預(yù)覽檢查文章結(jié)果的匹配度;若生成的結(jié)果不夠精準(zhǔn),用戶體驗不佳,就容易造成垃圾頁面,導(dǎo)致被搜索引擎降權(quán)。
(5)搜索關(guān)鍵詞聚合頁面要求代碼最精簡化,不放置其他頻道或活動的廣告、JS控件、交互控件、框架內(nèi)容,不放置超過兩個以上的轉(zhuǎn)化和監(jiān)控代碼,一切以追求最高的打開速度和用戶體驗為準(zhǔn)則。
接下來必須符合關(guān)鍵詞聚合頁規(guī)則,如頁面聚合規(guī)則、標(biāo)簽規(guī)則、頁面內(nèi)容板塊對應(yīng)邏輯規(guī)則、頭部導(dǎo)航、面包屑、資訊頁面規(guī)則、相關(guān)專題規(guī)則、URL規(guī)則、title規(guī)則、meta規(guī)則等。關(guān)于規(guī)則的內(nèi)容,錦繡大地SEO培訓(xùn)基地有詳細(xì)的視頻介紹。
雖然我們千方百計地想產(chǎn)生高質(zhì)量的原創(chuàng)內(nèi)容,但如果搜索引擎不收錄,那么一切都是無用功。因為只有被搜索引擎收錄的頁面,才對網(wǎng)站具有投票的能力,所以,從這個角度來講,大型網(wǎng)站的SE0策略的核心其實是在做“收錄”,一切的工作都圍繞收錄產(chǎn)生。
與收錄有關(guān)的SEO因素,從重到輕有URL、入口、代碼優(yōu)化、外鏈、龍華服務(wù)器優(yōu)化等。
URL優(yōu)化包括很多,重要的大約有10項,根據(jù)重要性從高到低依次如下。
?死循環(huán):體現(xiàn)在列表頁A點擊到B,再從B點擊到A,結(jié)果發(fā)現(xiàn)第二次點擊回來的A與第一次點擊的A的URL完全不同了。這是收錄的大忌,因為蜘蛛一旦進(jìn)入死循環(huán),就永遠(yuǎn)陷入其中,爬不出來。
?死鏈接:假想一下,蜘蛛從網(wǎng)頁A爬到網(wǎng)頁B再到網(wǎng)頁C,結(jié)果B打不開,那么C自然就無法收錄。還有一種情況是,正文已經(jīng)刪除但URL還在,這類頁面可稱為“活死鏈接”,用戶體驗很爛,建議批量301。
?重復(fù)頁面:內(nèi)容一模一樣,URL不同。
如4個首頁問題,www.cjzzc.com、cjzzc.com、www.cjzzc.com/index.html、cjzzc.com/index.html, 4個URL指向同一個頁面;
URL命名規(guī)則里的大小寫問題,如 www.cjzzc.com/tools.html和www.cjzzc.com/TOOLS.html指向同一個頁面,須知在搜索引擎看來,大小寫表示兩個完全不同的網(wǎng)頁;
目錄問題,如 www.cjzzc.com/baidu 和 www.cjzzc.com/baidu/ 是兩個不同的頁面;翻頁問題,很多網(wǎng)站做列表頁時,翻頁的URL基本上不變,被蜘蛛默認(rèn)為同一頁面。
?層級:在建站時,喜歡根據(jù)嚴(yán)密的邏輯:“主頁-大分類主頁-頻道首頁-產(chǎn)品詞首頁-專題頁-文章頁",一般能做出6層以上, 搜索引擎會根據(jù)每一個網(wǎng)站的權(quán)重、更新情況給予蜘蛛爬行時間和次數(shù),如果層級太多,很可能蜘蛛在爬到第五層級時,根本爬不到第六層級,而第六層級往往有大量的“干貨”頁面。
所以,現(xiàn)在很多網(wǎng)站,在設(shè)置URL時干脆只其做2層結(jié)構(gòu):首頁和其他頁面,他頁面全部放在二級目錄下,URL 規(guī)則www.cjzzc.com/wailian.html
?翻頁規(guī)則:主要針對列表頁,當(dāng)翻頁過萬時,底部的翻頁規(guī)則建議做成 間隔是50> 100,甚至更多,如底部規(guī)則可以做成“1,2,3,4,5,10,20,30, 40,50",以此類推,當(dāng)蜘蛛爬到第五頁時,底部顯示就變成了 “6,7,8,9,15, 25,35,45,55”,這樣蜘蛛順著爬,可以很快將所有翻頁爬完。
?偽靜態(tài)/絕對地址:蜘蛛喜歡偽靜態(tài)/絕對地址,動態(tài)參數(shù)不要太多、太復(fù)雜,目前百度對動態(tài)URL己經(jīng)有了很好的處理,但是參數(shù)過多、過復(fù)雜的URL,有可能被蜘蛛認(rèn)為不重要而拋棄;不要添加蜘蛛難以解析的字符。
?蜘蛛陷阱:302跳轉(zhuǎn)>flash跳轉(zhuǎn)、flash頁面>session id、強制性使用cookies、要求登錄填寫驗證碼等。
?屏蔽蜘蛛:Disallow: /
?網(wǎng)站地圖:xml網(wǎng)站地圖,向百度提交最新sitemap
?大量彈窗和低質(zhì)量廣告頁面。
有些網(wǎng)站每天都能保持一定數(shù)量的原創(chuàng)文章更新,xml網(wǎng)站地圖或者龍華服務(wù)器日志顯示每天蜘蛛來的時間很短,或者期待新增的專題頁/文章頁能夠在搜索引擎有很好的排名,那么,在首頁增加入口是最好的辦法。
雖然xml網(wǎng)站地圖會讓網(wǎng)頁收錄,但收錄和能在搜索引擎用site命令檢索到是兩回事,檢索到了能夠有排名又是另一回事。一個網(wǎng)站,因為所有頁面都投票給首頁,所以首頁的權(quán)重最高,首頁給了入口,等于網(wǎng)站權(quán)重最高的頁面給“入口頁”進(jìn)行投票,入口頁的權(quán)重就瞬間提高;
此外,蜘蛛一般從首頁往其他層級頁面爬行,首頁給入口,意味著只要蜘蛛訪問網(wǎng)站,入口頁就會被爬到收錄。
蜘蛛給每一個網(wǎng)站,在一個時間階段內(nèi)的時間、蜘蛛數(shù)量是大致固定的。
同樣的時間,爬一個1萬行代碼的網(wǎng)頁,相當(dāng)于爬10個1000行代碼的網(wǎng)頁。所以,從理論上講,如果你現(xiàn)有的網(wǎng)頁代碼是1萬行,你能縮減到1000行以內(nèi),那么,同等的權(quán)重,蜘蛛抓取的網(wǎng)站應(yīng)該可以提升10倍。
頁面數(shù)量幾萬以內(nèi),代碼優(yōu)化的效果體現(xiàn)很慢,對于百萬、千萬級別的網(wǎng)站而言,代碼優(yōu)化的效果,不管是搜索引擎收錄量還是新增UV,都會起到不可思議的效果。
蜘蛛訪問網(wǎng)站的時間是有限的,如果蜘蛛抓取一個頁面需要正常速度的三五倍,甚至十倍,那么能抓取的頁面肯定是有限的。網(wǎng)站龍華服務(wù)器還有一個最大的問題是用戶體驗很差,對于今天“用戶體驗至上”的搜索引擎來說,不僅抓取受影響,而且排名會直線下跌。