網(wǎng)站需要的文章頁(yè)面數(shù)量,往往不是數(shù)以萬(wàn)計(jì),而是百萬(wàn)級(jí)別的,如何短期內(nèi)讓網(wǎng)站收錄翻倍或者翻數(shù)倍?第一種方法是增加內(nèi)容,第二種方法 是提升網(wǎng)站在搜索引擎里的“收錄率”。
如何快速增加網(wǎng)站內(nèi)容?
常見的辦法有三種:關(guān)鍵詞詞庫(kù)建設(shè)、Tag頁(yè)面生成、UGC頁(yè)面生成。
一般在規(guī)劃網(wǎng)站的時(shí)候,是根據(jù)產(chǎn)品的sku來(lái)生成頁(yè)面。關(guān)鍵詞詞庫(kù)的做法,是挖掘行業(yè)內(nèi)所有的通用詞、產(chǎn)品詞、競(jìng)品詞和品牌詞,再根據(jù) 這些詞來(lái)生成頁(yè)面。以58同城為例,建網(wǎng)之初就把地域細(xì)化到縣城,根據(jù)乘法原理:縣級(jí)單位x通用詞X小領(lǐng)域分類x大領(lǐng)域分類生成頁(yè)面;大眾點(diǎn)評(píng)則把地域細(xì)化到某條馬路或者某個(gè)POL這樣根據(jù)乘法原理,過億的馬路就能產(chǎn)生數(shù)百億的頁(yè)面。
淘寶的關(guān)鍵詞詞庫(kù)數(shù)以億計(jì),做返利平臺(tái)的項(xiàng)目的關(guān)鍵詞詞庫(kù)卻數(shù)以十億計(jì)。
挖詞這個(gè)工作,對(duì)于“資深SEO分析師”來(lái)說(shuō)并不難,難的是如何“打標(biāo)簽”,使得生成的聚合頁(yè)面不被搜索引擎視為“垃圾頁(yè)面”,確保頁(yè)面的原創(chuàng)度和用戶體驗(yàn)。
關(guān)鍵詞詞庫(kù)建設(shè),是以關(guān)鍵詞為核心,迅速生成億萬(wàn)級(jí)別的頁(yè)面,那么,Tag聚合頁(yè)面,是以關(guān)鍵詞指數(shù)為核心,迅速生成千萬(wàn)級(jí)別的Tag頁(yè)面。
Tag頁(yè)面可以理解成專題、列表頁(yè),但對(duì)于Tag頁(yè)面的權(quán)重,從投票的原理講,Tag頁(yè)面有多個(gè)內(nèi)頁(yè)進(jìn)行投票,權(quán)重應(yīng)該高于文章頁(yè),這也是幾乎所有門戶網(wǎng)站都做過的事情;從用戶體驗(yàn)的角度考慮,Tag頁(yè)面有時(shí)候遠(yuǎn)不如文章頁(yè)更有參考價(jià)值。前不久百度打擊網(wǎng)站垃圾頁(yè)面,其中,備受打擊的主要是Tag頁(yè)面。
很多門戶類網(wǎng)站,先是批量釆集垃圾頁(yè)面,甚至不會(huì)去重,直接堆積在網(wǎng)站數(shù)據(jù)庫(kù),然后根據(jù)關(guān)鍵詞生成Tag頁(yè)面。雖然文章對(duì)于搜索引擎來(lái)說(shuō)是垃圾,但文章title或meta生成的Tag頁(yè)面對(duì)于搜索引擎來(lái)說(shuō)就是原創(chuàng)。雖然搜索引擎對(duì)Tag頁(yè)面的權(quán)重越來(lái)越低,但相關(guān)度高、用戶體驗(yàn)好的Tag頁(yè)面,仍然具有很高的投票能力。
Tag頁(yè)面生成的第一步是拓詞,方式與關(guān)鍵詞詞庫(kù)建設(shè)一樣。區(qū)別在于,需要制作不同的專題模板,而且首頁(yè)必須給一個(gè)入口。
以某保險(xiǎn)類網(wǎng)站為例,先做一個(gè)標(biāo)簽頁(yè),即入口頁(yè)。
1、Tag關(guān)鍵詞聚合頁(yè)后臺(tái)需求建議
(1)支持關(guān)鍵詞去重功能,當(dāng)某個(gè)關(guān)鍵詞在導(dǎo)入到后臺(tái)關(guān)鍵詞庫(kù)中后,再次導(dǎo)入關(guān)鍵詞無(wú)效,即新導(dǎo)入的重復(fù)關(guān)鍵詞不生成ID,也不生成新的頁(yè)面。
(2)每次能夠批量導(dǎo)入1-5000個(gè)關(guān)鍵詞,并給導(dǎo)入的每個(gè)新的不重復(fù)的關(guān)鍵詞生成單獨(dú)的ID
(3)在后臺(tái)會(huì)提示哪些導(dǎo)入的關(guān)鍵詞是重復(fù)的,并支持刪除重復(fù)關(guān)鍵詞的功能。
(4)后臺(tái)導(dǎo)入關(guān)鍵詞后,點(diǎn)擊生成頁(yè)面,能夠在后臺(tái)預(yù)覽到網(wǎng)站數(shù)據(jù)庫(kù)中生成的頁(yè)面信息。
(5)后臺(tái)能夠檢測(cè)到不同的關(guān)鍵詞生成結(jié)果頁(yè)時(shí)的內(nèi)容重復(fù)度,若多個(gè)關(guān)鍵詞之間的內(nèi)容出現(xiàn)了70%以上的重復(fù),則后臺(tái)會(huì)有對(duì)應(yīng)的提示,且這些出現(xiàn)重復(fù)ID的關(guān)鍵詞不生成頁(yè)面和URL。
(6)后臺(tái)需要設(shè)置超級(jí)管理員和普通用戶的用戶權(quán)限級(jí)別,普通用戶可以上傳關(guān)鍵詞和預(yù)覽生成頁(yè)面、查詢關(guān)鍵詞ID信息功能,但沒有發(fā)布上線關(guān) 鍵詞頁(yè)面的權(quán)限;超級(jí)管理員除了擁有普通用戶的所有權(quán)限外,還有點(diǎn)擊發(fā)布上線搜索關(guān)鍵詞的權(quán)限。
(7)導(dǎo)入的關(guān)鍵詞必須包含兩個(gè)中文字符或兩個(gè)英文字符才有資格生成搜索聚合頁(yè),單個(gè)漢字或英文字母不支持導(dǎo)入到關(guān)鍵詞庫(kù)和生成頁(yè)面的資格。
(8)支持給關(guān)鍵詞生成的聚合頁(yè)自動(dòng)或手動(dòng)添加Tag標(biāo)簽,這些標(biāo)簽是為 后期調(diào)用含有相同標(biāo)簽的資訊文章、評(píng)論、專題、其他聚合頁(yè)使用。
(9)支持對(duì)關(guān)鍵詞聚合頁(yè)面的單個(gè)和批量的“增、刪、改”功能。
(10)支持導(dǎo)出現(xiàn)有搜索聚合頁(yè)關(guān)鍵詞庫(kù)中的全部或部分關(guān)鍵詞功能。
注:如果你的網(wǎng)站CMS沒有這些功能,也沒事,可以根據(jù)這種思路自己調(diào)整優(yōu)化,也可以查看我們錦繡大地SEO培訓(xùn)基地VIP課程,學(xué)習(xí)使用。
2、Tag聚合頁(yè)生成注意事項(xiàng)
(1)每個(gè)頁(yè)面最多生成40篇文章,最少生成10篇文章;低于10篇文章的不生成URL和頁(yè)面°
(2)每個(gè)生成的關(guān)鍵詞聚合頁(yè)之間的內(nèi)容重復(fù)度不能高于70%,高于70%的則后來(lái)導(dǎo)入的關(guān)鍵詞不生成URL和頁(yè)面。
(3)每個(gè)關(guān)鍵詞生成的文章標(biāo)題中必須完整包含一個(gè)以上相同詞根(詞根字符數(shù)大于或等于2,若數(shù)據(jù)庫(kù)中有中文和英文分詞詞根最好),此時(shí)也需要程序員在關(guān)鍵詞導(dǎo)入后,檢測(cè)生成的文章結(jié)果質(zhì)量。
(4)前期生成的關(guān)鍵詞聚合頁(yè),必須有專門的人預(yù)覽檢查文章結(jié)果的匹配度;若生成的結(jié)果不夠精準(zhǔn),用戶體驗(yàn)不佳,就容易造成垃圾頁(yè)面,導(dǎo)致被搜索引擎降權(quán)。
(5)搜索關(guān)鍵詞聚合頁(yè)面要求代碼最精簡(jiǎn)化,不放置其他頻道或活動(dòng)的廣告、JS控件、交互控件、框架內(nèi)容,不放置超過兩個(gè)以上的轉(zhuǎn)化和監(jiān)控代碼,一切以追求最高的打開速度和用戶體驗(yàn)為準(zhǔn)則。
接下來(lái)必須符合關(guān)鍵詞聚合頁(yè)規(guī)則,如頁(yè)面聚合規(guī)則、標(biāo)簽規(guī)則、頁(yè)面內(nèi)容板塊對(duì)應(yīng)邏輯規(guī)則、頭部導(dǎo)航、面包屑、資訊頁(yè)面規(guī)則、相關(guān)專題規(guī)則、URL規(guī)則、title規(guī)則、meta規(guī)則等。關(guān)于規(guī)則的內(nèi)容,錦繡大地SEO培訓(xùn)基地有詳細(xì)的視頻介紹。
雖然我們千方百計(jì)地想產(chǎn)生高質(zhì)量的原創(chuàng)內(nèi)容,但如果搜索引擎不收錄,那么一切都是無(wú)用功。因?yàn)橹挥斜凰阉饕媸珍浀捻?yè)面,才對(duì)網(wǎng)站具有投票的能力,所以,從這個(gè)角度來(lái)講,大型網(wǎng)站的SE0策略的核心其實(shí)是在做“收錄”,一切的工作都圍繞收錄產(chǎn)生。
與收錄有關(guān)的SEO因素,從重到輕有URL、入口、代碼優(yōu)化、外鏈、日本服務(wù)器優(yōu)化等。
URL優(yōu)化包括很多,重要的大約有10項(xiàng),根據(jù)重要性從高到低依次如下。
?死循環(huán):體現(xiàn)在列表頁(yè)A點(diǎn)擊到B,再?gòu)腂點(diǎn)擊到A,結(jié)果發(fā)現(xiàn)第二次點(diǎn)擊回來(lái)的A與第一次點(diǎn)擊的A的URL完全不同了。這是收錄的大忌,因?yàn)橹┲胍坏┻M(jìn)入死循環(huán),就永遠(yuǎn)陷入其中,爬不出來(lái)。
?死鏈接:假想一下,蜘蛛從網(wǎng)頁(yè)A爬到網(wǎng)頁(yè)B再到網(wǎng)頁(yè)C,結(jié)果B打不開,那么C自然就無(wú)法收錄。還有一種情況是,正文已經(jīng)刪除但URL還在,這類頁(yè)面可稱為“活死鏈接”,用戶體驗(yàn)很爛,建議批量301。
?重復(fù)頁(yè)面:內(nèi)容一模一樣,URL不同。
如4個(gè)首頁(yè)問題,www.cjzzc.com、cjzzc.com、www.cjzzc.com/index.html、cjzzc.com/index.html, 4個(gè)URL指向同一個(gè)頁(yè)面;
URL命名規(guī)則里的大小寫問題,如 www.cjzzc.com/tools.html和www.cjzzc.com/TOOLS.html指向同一個(gè)頁(yè)面,須知在搜索引擎看來(lái),大小寫表示兩個(gè)完全不同的網(wǎng)頁(yè);
目錄問題,如 www.cjzzc.com/baidu 和 www.cjzzc.com/baidu/ 是兩個(gè)不同的頁(yè)面;翻頁(yè)問題,很多網(wǎng)站做列表頁(yè)時(shí),翻頁(yè)的URL基本上不變,被蜘蛛默認(rèn)為同一頁(yè)面。
?層級(jí):在建站時(shí),喜歡根據(jù)嚴(yán)密的邏輯:“主頁(yè)-大分類主頁(yè)-頻道首頁(yè)-產(chǎn)品詞首頁(yè)-專題頁(yè)-文章頁(yè)",一般能做出6層以上, 搜索引擎會(huì)根據(jù)每一個(gè)網(wǎng)站的權(quán)重、更新情況給予蜘蛛爬行時(shí)間和次數(shù),如果層級(jí)太多,很可能蜘蛛在爬到第五層級(jí)時(shí),根本爬不到第六層級(jí),而第六層級(jí)往往有大量的“干貨”頁(yè)面。
所以,現(xiàn)在很多網(wǎng)站,在設(shè)置URL時(shí)干脆只其做2層結(jié)構(gòu):首頁(yè)和其他頁(yè)面,他頁(yè)面全部放在二級(jí)目錄下,URL 規(guī)則www.cjzzc.com/wailian.html
?翻頁(yè)規(guī)則:主要針對(duì)列表頁(yè),當(dāng)翻頁(yè)過萬(wàn)時(shí),底部的翻頁(yè)規(guī)則建議做成 間隔是50> 100,甚至更多,如底部規(guī)則可以做成“1,2,3,4,5,10,20,30, 40,50",以此類推,當(dāng)蜘蛛爬到第五頁(yè)時(shí),底部顯示就變成了 “6,7,8,9,15, 25,35,45,55”,這樣蜘蛛順著爬,可以很快將所有翻頁(yè)爬完。
?偽靜態(tài)/絕對(duì)地址:蜘蛛喜歡偽靜態(tài)/絕對(duì)地址,動(dòng)態(tài)參數(shù)不要太多、太復(fù)雜,目前百度對(duì)動(dòng)態(tài)URL己經(jīng)有了很好的處理,但是參數(shù)過多、過復(fù)雜的URL,有可能被蜘蛛認(rèn)為不重要而拋棄;不要添加蜘蛛難以解析的字符。
?蜘蛛陷阱:302跳轉(zhuǎn)>flash跳轉(zhuǎn)、flash頁(yè)面>session id、強(qiáng)制性使用cookies、要求登錄填寫驗(yàn)證碼等。
?屏蔽蜘蛛:Disallow: /
?網(wǎng)站地圖:xml網(wǎng)站地圖,向百度提交最新sitemap
?大量彈窗和低質(zhì)量廣告頁(yè)面。
有些網(wǎng)站每天都能保持一定數(shù)量的原創(chuàng)文章更新,xml網(wǎng)站地圖或者日本服務(wù)器日志顯示每天蜘蛛來(lái)的時(shí)間很短,或者期待新增的專題頁(yè)/文章頁(yè)能夠在搜索引擎有很好的排名,那么,在首頁(yè)增加入口是最好的辦法。
雖然xml網(wǎng)站地圖會(huì)讓網(wǎng)頁(yè)收錄,但收錄和能在搜索引擎用site命令檢索到是兩回事,檢索到了能夠有排名又是另一回事。一個(gè)網(wǎng)站,因?yàn)樗许?yè)面都投票給首頁(yè),所以首頁(yè)的權(quán)重最高,首頁(yè)給了入口,等于網(wǎng)站權(quán)重最高的頁(yè)面給“入口頁(yè)”進(jìn)行投票,入口頁(yè)的權(quán)重就瞬間提高;
此外,蜘蛛一般從首頁(yè)往其他層級(jí)頁(yè)面爬行,首頁(yè)給入口,意味著只要蜘蛛訪問網(wǎng)站,入口頁(yè)就會(huì)被爬到收錄。
蜘蛛給每一個(gè)網(wǎng)站,在一個(gè)時(shí)間階段內(nèi)的時(shí)間、蜘蛛數(shù)量是大致固定的。
同樣的時(shí)間,爬一個(gè)1萬(wàn)行代碼的網(wǎng)頁(yè),相當(dāng)于爬10個(gè)1000行代碼的網(wǎng)頁(yè)。所以,從理論上講,如果你現(xiàn)有的網(wǎng)頁(yè)代碼是1萬(wàn)行,你能縮減到1000行以內(nèi),那么,同等的權(quán)重,蜘蛛抓取的網(wǎng)站應(yīng)該可以提升10倍。
頁(yè)面數(shù)量幾萬(wàn)以內(nèi),代碼優(yōu)化的效果體現(xiàn)很慢,對(duì)于百萬(wàn)、千萬(wàn)級(jí)別的網(wǎng)站而言,代碼優(yōu)化的效果,不管是搜索引擎收錄量還是新增UV,都會(huì)起到不可思議的效果。
蜘蛛訪問網(wǎng)站的時(shí)間是有限的,如果蜘蛛抓取一個(gè)頁(yè)面需要正常速度的三五倍,甚至十倍,那么能抓取的頁(yè)面肯定是有限的。網(wǎng)站日本服務(wù)器還有一個(gè)最大的問題是用戶體驗(yàn)很差,對(duì)于今天“用戶體驗(yàn)至上”的搜索引擎來(lái)說(shuō),不僅抓取受影響,而且排名會(huì)直線下跌。