天天爽夜夜爽人人爽QC,久久久久久久久免费,久久艹人人

網(wǎng)站robots應(yīng)該怎么寫？

2017-10-13 標簽：常州網(wǎng)絡(luò)公司常州網(wǎng)站建設(shè)常州網(wǎng)絡(luò)推廣

一般來說，網(wǎng)站或多或少都存在一些對排名沒意義甚至有害的頁面。對于站長來說是不希望被搜索引擎檢索的。而robots.txt文件則承擔(dān)了站長這個意愿的表達功能。當蜘蛛訪問網(wǎng)站會優(yōu)先抓取robots.txt，遵循站長配置的規(guī)則不再抓取不利于SEO的內(nèi)容。

robots.txt文件位置

robots文件往往放置于根目錄下

robots.txt文件格式

Disallow:該項的值用于描述不希望被訪問的一組URL

Allow:該項的值用于描述希望被訪問的一組URL

User-agent:該項的值用于描述搜索引擎robot的名字

例如：

User-Agent:YisouSpider // 配置YisouSpider

Disallow: / // 不允許YisouSpider抓取網(wǎng)站任何內(nèi)容

User-Agent:* // 配置所有搜索引擎

Allow: / // 允許抓取網(wǎng)站任何內(nèi)容

更多

Disallow: /abc //禁止抓取含abc目錄及子目錄的所有頁面

robots.txt通配符的使用

“*” 匹配0或多個任意字符

“$” 匹配行結(jié)束符。

舉例：

Disallow: /*?* //禁止抓取網(wǎng)站中所有的動態(tài)頁面

Disallow: /*.htm$ // 禁止抓取所有以.htm為后綴的URL頁面 /abc.htm/index 不匹配

區(qū)別于Disallow: /*.htm // /abc.htm/index 也匹配

網(wǎng)站哪些內(nèi)容不建議被抓取

對于這個小白也懂的不多，一般取決于內(nèi)容是否利于SEO的原則。例如，我博客的搜索結(jié)果頁，沒做好優(yōu)化的tags頁都禁止抓取了。而對于企業(yè)站來說，如果不打算可以優(yōu)化公司名稱的關(guān)鍵詞，關(guān)于、聯(lián)系、企業(yè)新聞等一些內(nèi)容都可以考慮禁止

還有一點值得注意的事，有很多站長反饋說百度不遵循robots.txt協(xié)議，抓取不該抓取的內(nèi)容。筆者也感覺不是很靠譜，所以也可以考慮在一些頁面設(shè)置meta name=”robots“

百度的解釋理解起來或許有所偏差，如果有不對，大家可以指正、交流

支持與案例
查詞工具

關(guān)注創(chuàng)搜
掃描二維碼
關(guān)注公眾號

地址：常州市新北區(qū)高新科技園10號樓東樓2樓
電話：4008925101
郵箱：Service@0519see.com

亚洲欧美日韩精品永久在线_无码人妻一区二区三区AV_玖草影院_久久久久国产一级毛片_在线观看av黄色_亚洲成人1区2区