網(wǎng)站需要的文章頁面數(shù)量,往往不是數(shù)以萬計,而是百萬級別的,如何短期內(nèi)讓網(wǎng)站收錄翻倍或者翻數(shù)倍?第一種方法是增加內(nèi)容,第二種方法 是提升網(wǎng)站在搜索引擎里的“收錄率”。
如何快速增加網(wǎng)站內(nèi)容?
常見的辦法有三種:關鍵詞詞庫建設、Tag頁面生成、UGC頁面生成。
一般在規(guī)劃網(wǎng)站的時候,是根據(jù)產(chǎn)品的sku來生成頁面。關鍵詞詞庫的做法,是挖掘行業(yè)內(nèi)所有的通用詞、產(chǎn)品詞、競品詞和品牌詞,再根據(jù) 這些詞來生成頁面。以58同城為例,建網(wǎng)之初就把地域細化到縣城,根據(jù)乘法原理:縣級單位x通用詞X小領域分類x大領域分類生成頁面;大眾點評則把地域細化到某條馬路或者某個POL這樣根據(jù)乘法原理,過億的馬路就能產(chǎn)生數(shù)百億的頁面。
淘寶的關鍵詞詞庫數(shù)以億計,做返利平臺的項目的關鍵詞詞庫卻數(shù)以十億計。
挖詞這個工作,對于“資深SEO分析師”來說并不難,難的是如何“打標簽”,使得生成的聚合頁面不被搜索引擎視為“垃圾頁面”,確保頁面的原創(chuàng)度和用戶體驗。
關鍵詞詞庫建設,是以關鍵詞為核心,迅速生成億萬級別的頁面,那么,Tag聚合頁面,是以關鍵詞指數(shù)為核心,迅速生成千萬級別的Tag頁面。
Tag頁面可以理解成專題、列表頁,但對于Tag頁面的權重,從投票的原理講,Tag頁面有多個內(nèi)頁進行投票,權重應該高于文章頁,這也是幾乎所有門戶網(wǎng)站都做過的事情;從用戶體驗的角度考慮,Tag頁面有時候遠不如文章頁更有參考價值。前不久百度打擊網(wǎng)站垃圾頁面,其中,備受打擊的主要是Tag頁面。
很多門戶類網(wǎng)站,先是批量釆集垃圾頁面,甚至不會去重,直接堆積在網(wǎng)站數(shù)據(jù)庫,然后根據(jù)關鍵詞生成Tag頁面。雖然文章對于搜索引擎來說是垃圾,但文章title或meta生成的Tag頁面對于搜索引擎來說就是原創(chuàng)。雖然搜索引擎對Tag頁面的權重越來越低,但相關度高、用戶體驗好的Tag頁面,仍然具有很高的投票能力。
Tag頁面生成的第一步是拓詞,方式與關鍵詞詞庫建設一樣。區(qū)別在于,需要制作不同的專題模板,而且首頁必須給一個入口。
以某保險類網(wǎng)站為例,先做一個標簽頁,即入口頁。
1、Tag關鍵詞聚合頁后臺需求建議
(1)支持關鍵詞去重功能,當某個關鍵詞在導入到后臺關鍵詞庫中后,再次導入關鍵詞無效,即新導入的重復關鍵詞不生成ID,也不生成新的頁面。
(2)每次能夠批量導入1-5000個關鍵詞,并給導入的每個新的不重復的關鍵詞生成單獨的ID
(3)在后臺會提示哪些導入的關鍵詞是重復的,并支持刪除重復關鍵詞的功能。
(4)后臺導入關鍵詞后,點擊生成頁面,能夠在后臺預覽到網(wǎng)站數(shù)據(jù)庫中生成的頁面信息。
(5)后臺能夠檢測到不同的關鍵詞生成結果頁時的內(nèi)容重復度,若多個關鍵詞之間的內(nèi)容出現(xiàn)了70%以上的重復,則后臺會有對應的提示,且這些出現(xiàn)重復ID的關鍵詞不生成頁面和URL。
(6)后臺需要設置超級管理員和普通用戶的用戶權限級別,普通用戶可以上傳關鍵詞和預覽生成頁面、查詢關鍵詞ID信息功能,但沒有發(fā)布上線關 鍵詞頁面的權限;超級管理員除了擁有普通用戶的所有權限外,還有點擊發(fā)布上線搜索關鍵詞的權限。
(7)導入的關鍵詞必須包含兩個中文字符或兩個英文字符才有資格生成搜索聚合頁,單個漢字或英文字母不支持導入到關鍵詞庫和生成頁面的資格。
(8)支持給關鍵詞生成的聚合頁自動或手動添加Tag標簽,這些標簽是為 后期調用含有相同標簽的資訊文章、評論、專題、其他聚合頁使用。
(9)支持對關鍵詞聚合頁面的單個和批量的“增、刪、改”功能。
(10)支持導出現(xiàn)有搜索聚合頁關鍵詞庫中的全部或部分關鍵詞功能。
注:如果你的網(wǎng)站CMS沒有這些功能,也沒事,可以根據(jù)這種思路自己調整優(yōu)化,也可以查看我們錦繡大地SEO培訓基地VIP課程,學習使用。
2、Tag聚合頁生成注意事項
(1)每個頁面最多生成40篇文章,最少生成10篇文章;低于10篇文章的不生成URL和頁面°
(2)每個生成的關鍵詞聚合頁之間的內(nèi)容重復度不能高于70%,高于70%的則后來導入的關鍵詞不生成URL和頁面。
(3)每個關鍵詞生成的文章標題中必須完整包含一個以上相同詞根(詞根字符數(shù)大于或等于2,若數(shù)據(jù)庫中有中文和英文分詞詞根最好),此時也需要程序員在關鍵詞導入后,檢測生成的文章結果質量。
(4)前期生成的關鍵詞聚合頁,必須有專門的人預覽檢查文章結果的匹配度;若生成的結果不夠精準,用戶體驗不佳,就容易造成垃圾頁面,導致被搜索引擎降權。
(5)搜索關鍵詞聚合頁面要求代碼最精簡化,不放置其他頻道或活動的廣告、JS控件、交互控件、框架內(nèi)容,不放置超過兩個以上的轉化和監(jiān)控代碼,一切以追求最高的打開速度和用戶體驗為準則。
接下來必須符合關鍵詞聚合頁規(guī)則,如頁面聚合規(guī)則、標簽規(guī)則、頁面內(nèi)容板塊對應邏輯規(guī)則、頭部導航、面包屑、資訊頁面規(guī)則、相關專題規(guī)則、URL規(guī)則、title規(guī)則、meta規(guī)則等。關于規(guī)則的內(nèi)容,錦繡大地SEO培訓基地有詳細的視頻介紹。
雖然我們千方百計地想產(chǎn)生高質量的原創(chuàng)內(nèi)容,但如果搜索引擎不收錄,那么一切都是無用功。因為只有被搜索引擎收錄的頁面,才對網(wǎng)站具有投票的能力,所以,從這個角度來講,大型網(wǎng)站的SE0策略的核心其實是在做“收錄”,一切的工作都圍繞收錄產(chǎn)生。
與收錄有關的SEO因素,從重到輕有URL、入口、代碼優(yōu)化、外鏈、大路鎮(zhèn)服務器優(yōu)化等。
URL優(yōu)化包括很多,重要的大約有10項,根據(jù)重要性從高到低依次如下。
?死循環(huán):體現(xiàn)在列表頁A點擊到B,再從B點擊到A,結果發(fā)現(xiàn)第二次點擊回來的A與第一次點擊的A的URL完全不同了。這是收錄的大忌,因為蜘蛛一旦進入死循環(huán),就永遠陷入其中,爬不出來。
?死鏈接:假想一下,蜘蛛從網(wǎng)頁A爬到網(wǎng)頁B再到網(wǎng)頁C,結果B打不開,那么C自然就無法收錄。還有一種情況是,正文已經(jīng)刪除但URL還在,這類頁面可稱為“活死鏈接”,用戶體驗很爛,建議批量301。
?重復頁面:內(nèi)容一模一樣,URL不同。
如4個首頁問題,www.cjzzc.com、cjzzc.com、www.cjzzc.com/index.html、cjzzc.com/index.html, 4個URL指向同一個頁面;
URL命名規(guī)則里的大小寫問題,如 www.cjzzc.com/tools.html和www.cjzzc.com/TOOLS.html指向同一個頁面,須知在搜索引擎看來,大小寫表示兩個完全不同的網(wǎng)頁;
目錄問題,如 www.cjzzc.com/baidu 和 www.cjzzc.com/baidu/ 是兩個不同的頁面;翻頁問題,很多網(wǎng)站做列表頁時,翻頁的URL基本上不變,被蜘蛛默認為同一頁面。
?層級:在建站時,喜歡根據(jù)嚴密的邏輯:“主頁-大分類主頁-頻道首頁-產(chǎn)品詞首頁-專題頁-文章頁",一般能做出6層以上, 搜索引擎會根據(jù)每一個網(wǎng)站的權重、更新情況給予蜘蛛爬行時間和次數(shù),如果層級太多,很可能蜘蛛在爬到第五層級時,根本爬不到第六層級,而第六層級往往有大量的“干貨”頁面。
所以,現(xiàn)在很多網(wǎng)站,在設置URL時干脆只其做2層結構:首頁和其他頁面,他頁面全部放在二級目錄下,URL 規(guī)則www.cjzzc.com/wailian.html
?翻頁規(guī)則:主要針對列表頁,當翻頁過萬時,底部的翻頁規(guī)則建議做成 間隔是50> 100,甚至更多,如底部規(guī)則可以做成“1,2,3,4,5,10,20,30, 40,50",以此類推,當蜘蛛爬到第五頁時,底部顯示就變成了 “6,7,8,9,15, 25,35,45,55”,這樣蜘蛛順著爬,可以很快將所有翻頁爬完。
?偽靜態(tài)/絕對地址:蜘蛛喜歡偽靜態(tài)/絕對地址,動態(tài)參數(shù)不要太多、太復雜,目前百度對動態(tài)URL己經(jīng)有了很好的處理,但是參數(shù)過多、過復雜的URL,有可能被蜘蛛認為不重要而拋棄;不要添加蜘蛛難以解析的字符。
?蜘蛛陷阱:302跳轉>flash跳轉、flash頁面>session id、強制性使用cookies、要求登錄填寫驗證碼等。
?屏蔽蜘蛛:Disallow: /
?網(wǎng)站地圖:xml網(wǎng)站地圖,向百度提交最新sitemap
?大量彈窗和低質量廣告頁面。
有些網(wǎng)站每天都能保持一定數(shù)量的原創(chuàng)文章更新,xml網(wǎng)站地圖或者大路鎮(zhèn)服務器日志顯示每天蜘蛛來的時間很短,或者期待新增的專題頁/文章頁能夠在搜索引擎有很好的排名,那么,在首頁增加入口是最好的辦法。
雖然xml網(wǎng)站地圖會讓網(wǎng)頁收錄,但收錄和能在搜索引擎用site命令檢索到是兩回事,檢索到了能夠有排名又是另一回事。一個網(wǎng)站,因為所有頁面都投票給首頁,所以首頁的權重最高,首頁給了入口,等于網(wǎng)站權重最高的頁面給“入口頁”進行投票,入口頁的權重就瞬間提高;
此外,蜘蛛一般從首頁往其他層級頁面爬行,首頁給入口,意味著只要蜘蛛訪問網(wǎng)站,入口頁就會被爬到收錄。
蜘蛛給每一個網(wǎng)站,在一個時間階段內(nèi)的時間、蜘蛛數(shù)量是大致固定的。
同樣的時間,爬一個1萬行代碼的網(wǎng)頁,相當于爬10個1000行代碼的網(wǎng)頁。所以,從理論上講,如果你現(xiàn)有的網(wǎng)頁代碼是1萬行,你能縮減到1000行以內(nèi),那么,同等的權重,蜘蛛抓取的網(wǎng)站應該可以提升10倍。
頁面數(shù)量幾萬以內(nèi),代碼優(yōu)化的效果體現(xiàn)很慢,對于百萬、千萬級別的網(wǎng)站而言,代碼優(yōu)化的效果,不管是搜索引擎收錄量還是新增UV,都會起到不可思議的效果。
蜘蛛訪問網(wǎng)站的時間是有限的,如果蜘蛛抓取一個頁面需要正常速度的三五倍,甚至十倍,那么能抓取的頁面肯定是有限的。網(wǎng)站大路鎮(zhèn)服務器還有一個最大的問題是用戶體驗很差,對于今天“用戶體驗至上”的搜索引擎來說,不僅抓取受影響,而且排名會直線下跌。