網站需要的文章頁面數量,往往不是數以萬計,而是百萬級別的,如何短期內讓網站收錄翻倍或者翻數倍?第一種方法是增加內容,第二種方法 是提升網站在搜索引擎里的“收錄率”。
如何快速增加網站內容?
常見的辦法有三種:關鍵詞詞庫建設、Tag頁面生成、UGC頁面生成。
一般在規(guī)劃網站的時候,是根據產品的sku來生成頁面。關鍵詞詞庫的做法,是挖掘行業(yè)內所有的通用詞、產品詞、競品詞和品牌詞,再根據 這些詞來生成頁面。以58同城為例,建網之初就把地域細化到縣城,根據乘法原理:縣級單位x通用詞X小領域分類x大領域分類生成頁面;大眾點評則把地域細化到某條馬路或者某個POL這樣根據乘法原理,過億的馬路就能產生數百億的頁面。
淘寶的關鍵詞詞庫數以億計,做返利平臺的項目的關鍵詞詞庫卻數以十億計。
挖詞這個工作,對于“資深SEO分析師”來說并不難,難的是如何“打標簽”,使得生成的聚合頁面不被搜索引擎視為“垃圾頁面”,確保頁面的原創(chuàng)度和用戶體驗。
關鍵詞詞庫建設,是以關鍵詞為核心,迅速生成億萬級別的頁面,那么,Tag聚合頁面,是以關鍵詞指數為核心,迅速生成千萬級別的Tag頁面。
Tag頁面可以理解成專題、列表頁,但對于Tag頁面的權重,從投票的原理講,Tag頁面有多個內頁進行投票,權重應該高于文章頁,這也是幾乎所有門戶網站都做過的事情;從用戶體驗的角度考慮,Tag頁面有時候遠不如文章頁更有參考價值。前不久百度打擊網站垃圾頁面,其中,備受打擊的主要是Tag頁面。
很多門戶類網站,先是批量釆集垃圾頁面,甚至不會去重,直接堆積在網站數據庫,然后根據關鍵詞生成Tag頁面。雖然文章對于搜索引擎來說是垃圾,但文章title或meta生成的Tag頁面對于搜索引擎來說就是原創(chuàng)。雖然搜索引擎對Tag頁面的權重越來越低,但相關度高、用戶體驗好的Tag頁面,仍然具有很高的投票能力。
Tag頁面生成的第一步是拓詞,方式與關鍵詞詞庫建設一樣。區(qū)別在于,需要制作不同的專題模板,而且首頁必須給一個入口。
以某保險類網站為例,先做一個標簽頁,即入口頁。
1、Tag關鍵詞聚合頁后臺需求建議
(1)支持關鍵詞去重功能,當某個關鍵詞在導入到后臺關鍵詞庫中后,再次導入關鍵詞無效,即新導入的重復關鍵詞不生成ID,也不生成新的頁面。
(2)每次能夠批量導入1-5000個關鍵詞,并給導入的每個新的不重復的關鍵詞生成單獨的ID
(3)在后臺會提示哪些導入的關鍵詞是重復的,并支持刪除重復關鍵詞的功能。
(4)后臺導入關鍵詞后,點擊生成頁面,能夠在后臺預覽到網站數據庫中生成的頁面信息。
(5)后臺能夠檢測到不同的關鍵詞生成結果頁時的內容重復度,若多個關鍵詞之間的內容出現(xiàn)了70%以上的重復,則后臺會有對應的提示,且這些出現(xiàn)重復ID的關鍵詞不生成頁面和URL。
(6)后臺需要設置超級管理員和普通用戶的用戶權限級別,普通用戶可以上傳關鍵詞和預覽生成頁面、查詢關鍵詞ID信息功能,但沒有發(fā)布上線關 鍵詞頁面的權限;超級管理員除了擁有普通用戶的所有權限外,還有點擊發(fā)布上線搜索關鍵詞的權限。
(7)導入的關鍵詞必須包含兩個中文字符或兩個英文字符才有資格生成搜索聚合頁,單個漢字或英文字母不支持導入到關鍵詞庫和生成頁面的資格。
(8)支持給關鍵詞生成的聚合頁自動或手動添加Tag標簽,這些標簽是為 后期調用含有相同標簽的資訊文章、評論、專題、其他聚合頁使用。
(9)支持對關鍵詞聚合頁面的單個和批量的“增、刪、改”功能。
(10)支持導出現(xiàn)有搜索聚合頁關鍵詞庫中的全部或部分關鍵詞功能。
注:如果你的網站CMS沒有這些功能,也沒事,可以根據這種思路自己調整優(yōu)化,也可以查看我們錦繡大地SEO培訓基地VIP課程,學習使用。
2、Tag聚合頁生成注意事項
(1)每個頁面最多生成40篇文章,最少生成10篇文章;低于10篇文章的不生成URL和頁面°
(2)每個生成的關鍵詞聚合頁之間的內容重復度不能高于70%,高于70%的則后來導入的關鍵詞不生成URL和頁面。
(3)每個關鍵詞生成的文章標題中必須完整包含一個以上相同詞根(詞根字符數大于或等于2,若數據庫中有中文和英文分詞詞根最好),此時也需要程序員在關鍵詞導入后,檢測生成的文章結果質量。
(4)前期生成的關鍵詞聚合頁,必須有專門的人預覽檢查文章結果的匹配度;若生成的結果不夠精準,用戶體驗不佳,就容易造成垃圾頁面,導致被搜索引擎降權。
(5)搜索關鍵詞聚合頁面要求代碼最精簡化,不放置其他頻道或活動的廣告、JS控件、交互控件、框架內容,不放置超過兩個以上的轉化和監(jiān)控代碼,一切以追求最高的打開速度和用戶體驗為準則。
接下來必須符合關鍵詞聚合頁規(guī)則,如頁面聚合規(guī)則、標簽規(guī)則、頁面內容板塊對應邏輯規(guī)則、頭部導航、面包屑、資訊頁面規(guī)則、相關專題規(guī)則、URL規(guī)則、title規(guī)則、meta規(guī)則等。關于規(guī)則的內容,錦繡大地SEO培訓基地有詳細的視頻介紹。
雖然我們千方百計地想產生高質量的原創(chuàng)內容,但如果搜索引擎不收錄,那么一切都是無用功。因為只有被搜索引擎收錄的頁面,才對網站具有投票的能力,所以,從這個角度來講,大型網站的SE0策略的核心其實是在做“收錄”,一切的工作都圍繞收錄產生。
與收錄有關的SEO因素,從重到輕有URL、入口、代碼優(yōu)化、外鏈、青島服務器優(yōu)化等。
URL優(yōu)化包括很多,重要的大約有10項,根據重要性從高到低依次如下。
?死循環(huán):體現(xiàn)在列表頁A點擊到B,再從B點擊到A,結果發(fā)現(xiàn)第二次點擊回來的A與第一次點擊的A的URL完全不同了。這是收錄的大忌,因為蜘蛛一旦進入死循環(huán),就永遠陷入其中,爬不出來。
?死鏈接:假想一下,蜘蛛從網頁A爬到網頁B再到網頁C,結果B打不開,那么C自然就無法收錄。還有一種情況是,正文已經刪除但URL還在,這類頁面可稱為“活死鏈接”,用戶體驗很爛,建議批量301。
?重復頁面:內容一模一樣,URL不同。
如4個首頁問題,www.cjzzc.com、cjzzc.com、www.cjzzc.com/index.html、cjzzc.com/index.html, 4個URL指向同一個頁面;
URL命名規(guī)則里的大小寫問題,如 www.cjzzc.com/tools.html和www.cjzzc.com/TOOLS.html指向同一個頁面,須知在搜索引擎看來,大小寫表示兩個完全不同的網頁;
目錄問題,如 www.cjzzc.com/baidu 和 www.cjzzc.com/baidu/ 是兩個不同的頁面;翻頁問題,很多網站做列表頁時,翻頁的URL基本上不變,被蜘蛛默認為同一頁面。
?層級:在建站時,喜歡根據嚴密的邏輯:“主頁-大分類主頁-頻道首頁-產品詞首頁-專題頁-文章頁",一般能做出6層以上, 搜索引擎會根據每一個網站的權重、更新情況給予蜘蛛爬行時間和次數,如果層級太多,很可能蜘蛛在爬到第五層級時,根本爬不到第六層級,而第六層級往往有大量的“干貨”頁面。
所以,現(xiàn)在很多網站,在設置URL時干脆只其做2層結構:首頁和其他頁面,他頁面全部放在二級目錄下,URL 規(guī)則www.cjzzc.com/wailian.html
?翻頁規(guī)則:主要針對列表頁,當翻頁過萬時,底部的翻頁規(guī)則建議做成 間隔是50> 100,甚至更多,如底部規(guī)則可以做成“1,2,3,4,5,10,20,30, 40,50",以此類推,當蜘蛛爬到第五頁時,底部顯示就變成了 “6,7,8,9,15, 25,35,45,55”,這樣蜘蛛順著爬,可以很快將所有翻頁爬完。
?偽靜態(tài)/絕對地址:蜘蛛喜歡偽靜態(tài)/絕對地址,動態(tài)參數不要太多、太復雜,目前百度對動態(tài)URL己經有了很好的處理,但是參數過多、過復雜的URL,有可能被蜘蛛認為不重要而拋棄;不要添加蜘蛛難以解析的字符。
?蜘蛛陷阱:302跳轉>flash跳轉、flash頁面>session id、強制性使用cookies、要求登錄填寫驗證碼等。
?屏蔽蜘蛛:Disallow: /
?網站地圖:xml網站地圖,向百度提交最新sitemap
?大量彈窗和低質量廣告頁面。
有些網站每天都能保持一定數量的原創(chuàng)文章更新,xml網站地圖或者青島服務器日志顯示每天蜘蛛來的時間很短,或者期待新增的專題頁/文章頁能夠在搜索引擎有很好的排名,那么,在首頁增加入口是最好的辦法。
雖然xml網站地圖會讓網頁收錄,但收錄和能在搜索引擎用site命令檢索到是兩回事,檢索到了能夠有排名又是另一回事。一個網站,因為所有頁面都投票給首頁,所以首頁的權重最高,首頁給了入口,等于網站權重最高的頁面給“入口頁”進行投票,入口頁的權重就瞬間提高;
此外,蜘蛛一般從首頁往其他層級頁面爬行,首頁給入口,意味著只要蜘蛛訪問網站,入口頁就會被爬到收錄。
蜘蛛給每一個網站,在一個時間階段內的時間、蜘蛛數量是大致固定的。
同樣的時間,爬一個1萬行代碼的網頁,相當于爬10個1000行代碼的網頁。所以,從理論上講,如果你現(xiàn)有的網頁代碼是1萬行,你能縮減到1000行以內,那么,同等的權重,蜘蛛抓取的網站應該可以提升10倍。
頁面數量幾萬以內,代碼優(yōu)化的效果體現(xiàn)很慢,對于百萬、千萬級別的網站而言,代碼優(yōu)化的效果,不管是搜索引擎收錄量還是新增UV,都會起到不可思議的效果。
蜘蛛訪問網站的時間是有限的,如果蜘蛛抓取一個頁面需要正常速度的三五倍,甚至十倍,那么能抓取的頁面肯定是有限的。網站青島服務器還有一個最大的問題是用戶體驗很差,對于今天“用戶體驗至上”的搜索引擎來說,不僅抓取受影響,而且排名會直線下跌。