Robots協(xié)議詳解
禁止搜索引擎收錄的方法(robots.txt)
一
、什么是robots.txt文件?
搜索引擎通過一種程序robot(又稱spider)
,自動訪問互聯(lián)網(wǎng)上的網(wǎng)頁并獲取網(wǎng)頁信息。您可以在您的網(wǎng)站中創(chuàng)建一個純文本文件robots.txt
,在這個文件中聲明該網(wǎng)站中不想被robot訪問的部分,這樣
,該網(wǎng)站的部分或全部內(nèi)容就可以不被搜索引擎收錄了,或者指定搜索引擎只收錄指定的內(nèi)容。
二、robots.txt文件放在哪里?
robots.txt文件應(yīng)該放在網(wǎng)站根目錄下。舉例來說,當(dāng)robots訪問一個網(wǎng)站(比如http://www.abc.com)時,首先會檢查該網(wǎng)站中是否存在http://www.abc.com/robots.txt這個文件,如果機器人找到這個文件,它就會根據(jù)這個文件的內(nèi)容,來確定它訪問權(quán)限的范圍
。
網(wǎng)站 URL 相應(yīng)的 robots.txt的 URL
http://www.w3.org/ http://www.w3.org/robots.txt
http://www.w3.org:80/ http://www.w3.org:80/robots.txt
http://www.w3.org:1234/ http://www.w3.org:1234/robots.txt
http://w3.org/ http://w3.org/robots.txt
三
、robots.txt文件的格式
"robots.txt"文件包含一條或更多的記錄,這些記錄通過空行分開(以CR,CR/NL, or NL作為結(jié)束符)
,每一條記錄的格式如下所示:":"。
在該文件中可以使用#進行注解
,具體使用方法和UNIX中的慣例一樣
。該文件中的記錄通常以一行或多行User-agent開始
,后面加上若干Disallow行,詳細情況如下:
User-agent:
該項的值用于描述搜索引擎robot的名字
,在"robots.txt"文件中
,如果有多條User-agent記錄說明有多個robot會受到該協(xié)議的限制,對該文件來說
,至少要有一條User-agent記錄。如果該項的值設(shè)為*
,則該協(xié)議對任何機器人均有效
,在"robots.txt"文件中
,"User-agent:*"這樣的記錄只能有一條
。
Disallow :
該項的值用于描述不希望被訪問到的一個URL,這個URL可以是一條完整的路徑
,也可以是部分的,任何以Disallow開頭的URL均不會被robot訪問到。例如"Disallow: /help"對/help.html和/help/index.html都不允許搜索引擎訪問,而"Disallow:/help/"則允許robot訪問/help.html,而不能訪問/help/index.html。任何一條Disallow記錄為空,說明該網(wǎng)站的所有部分都允許被訪問,在"/robots.txt"文件中,至少要有一Disallow記錄。如果"/robots.txt"是一個空文件,則對于所有的搜索引擎robot,該網(wǎng)站都是開放的。
四、robots.txt文件用法舉例
例1. 禁止所有搜索引擎訪問網(wǎng)站的任何部分
下載該robots.txt文件 User-agent: *
Disallow: /
例2. 允許所有的robot訪問
(或者也可以建一個空文件 "/robots.txt" file)
User-agent: *
Disallow:
例3. 禁止某個搜索引擎的訪問
User-agent: BadBot
Disallow: /
例4. 允許某個搜索引擎的訪問
User-agent: baiduspider
Disallow:
User-agent: *
Disallow: /
例5. 一個簡單例子
在這個例子中,該網(wǎng)站有三個目錄對搜索引擎的訪問做了限制,即搜索引擎不會訪問這三個目錄。
需要注意的是對每一個目錄必須分開聲明,而不要寫成 "Disallow: /cgi-bin/ /tmp/"。
User-agent:后的* 具有特殊的含義,代表"any robot",所以在該文件中不能有"Disallow:
/tmp/*" or "Disallow: *.gif"這樣的記錄出現(xiàn).
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/
五、robots.txt文件參考資料
robots.txt文件的更具體設(shè)置,請參看以下資料:
· Web Server Administrator's Guide to the Robots Exclusion Protocol
· HTML Author's Guide to the Robots Exclusion Protocol
· The original 1994 protocol description, as currently deployed
· The revised Internet-Draft specification, which is not yet completed or implemented
在你的主頁中為Web Robot設(shè)計路標(biāo)
Internet越來越酷,WWW的知名度如日中天。在Internet上發(fā)布公司信息、進行電子商務(wù)已經(jīng)從時髦演化成時尚。作為一個WebMaster,你可能對HTML、Javascript、Java、 ActiveX了如指掌
,但你是否知道什么是WebRobot
?你是否知道Web Robot和你所設(shè) 計的主頁有什么關(guān)系?
Internet上的流浪漢--- Web Robot
有時你會莫名其妙地發(fā)現(xiàn)你的主頁的內(nèi)容在一個搜索引擎中被索引
,即使你從未與他 們有過任何聯(lián)系。其實這正是Web Robot的功勞。WebRobot其實是一些程序,它可以 穿越大量Internet網(wǎng)址的超文本結(jié)構(gòu),遞歸地檢索網(wǎng)絡(luò)站點所有的內(nèi)容。這些程序有時被叫“蜘蛛(Spider)” , “網(wǎng)上流浪漢(Web Wanderer)”,“網(wǎng)絡(luò)蠕蟲(web worms)”或Webcrawler。
一些Internet網(wǎng)上知名的搜索引擎站點(Search Engines)都 有專門的WebRobot程序來完成信息的采集,例如Lycos,Webcrawler,Altavista等,以及中文搜索引擎站點例如北極星,網(wǎng)易,GOYOYO等。WebRobot就象一個不速之客,不管你是否在意,它都會忠于自己主人的職責(zé),任勞任怨、不知疲倦地奔波于萬維網(wǎng)的空間,當(dāng)然也會光臨你的主頁,檢索主頁內(nèi)容并生成它所需要的記錄格式。或許有的主頁內(nèi)容你樂于世人皆知,但有的內(nèi)容你卻不愿被洞察、索引。難道你就只能任其“橫行”于自己主頁空間,能否指揮和控制WebRobot的行蹤呢?答案當(dāng)然是肯定的。只要你閱讀了本篇的下文,就可以象一個交通 警察一樣,布置下一個個路標(biāo),告訴WebRobot應(yīng)該怎么去檢索你的主頁,哪些可以檢索,哪些不可以訪問。其實Web Robot能聽懂你的話不要以為Web Robot是毫無組織,毫無管束地亂跑
。很多Web Robot軟件給網(wǎng)絡(luò)站點的 管理員或網(wǎng)頁內(nèi)容制作者提供了兩種方法來限制Web Robot的行蹤:
1. Robots Exclusion Protocol 協(xié)議
網(wǎng)絡(luò)站點的管理員可以在站點上建立一個專門格式的文件,來指出站點上的哪一部分 可以被robot訪問, 這個文件放在站點的根目錄下
,即robots.txt." target="_blank">http://.../robots.txt.
2. Robots META tag
一個網(wǎng)頁作者可以使用專門的HTML META tag
,來指出某一個網(wǎng)頁是否可以被索 引、分析或鏈接
。這些方法適合于大多數(shù)的Web Robot
,至于是否在軟件中實施了這些方法,還依賴于 Robot的開發(fā)者
,并非可以保證對任何Robot都靈驗
。如果你迫切需要保護自己內(nèi)容,則應(yīng)考慮采用諸如增加密碼等其他保護方法
。
使用Robots Exclusion Protocol協(xié)議
當(dāng)Robot訪問一個 Web 站點時
,比如http://www.sti.net.cn/,它先去檢查文件robots.txt"target="_blank">http://www.sti.net.cn/robots.txt
。如果這個文件存在
,它便會按照這樣的記錄格式去分析:
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/
以確定它是否應(yīng)該檢索站點的文件。這些記錄是專門給Web Robot看的,一般的瀏覽者大概永遠不會看到這個文件,所以千萬不要異想天開地在里面加入形似 類的HTML語句或是“How do you do? where areyou from?”之類假情假意的問候語。
在一個站點上只能有一個 "/robots.txt" 文件,而且文件名的每個字母要求全部是小寫。在Robot的記錄格式中每一個單獨的"Disallow"行表示你不希望Robot訪問的URL, 每個URL必須單獨占一行,不能出現(xiàn)"Disallow: /cgi-bin/ /tmp/"這樣的病句。同時在一個記錄中不能出現(xiàn)空行,這是因為空行是多個記錄分割的標(biāo)志。User-agent行指出的是Robot或其他代理的名稱。在User-agent行,'*' 表示一個特殊的含義---所有的robot。
下面是幾個robot.txt的例子:
在整個服務(wù)器上拒絕所有的robots:
User-agent: *
Disallow: /
允許所有的robots訪問整個站點:
User-agent: *
Disallow:
或者產(chǎn)生一個空的 "/robots.txt" 文件。
服務(wù)器的部分內(nèi)容允許所有的robot訪問
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /private/
拒絕某一個專門的robot:
User-agent: BadBot
Disallow: /
只允許某一個robot光顧:
User-agent: WebCrawler
Disallow:
User-agent: *
Disallow: /
最后我們給出 http://www.w3.org/站點上的robots.txt:
# For use by search.w3.org
User-agent: W3Crobot/1
Disallow:
User-agent: *
Disallow: /Member/ # This is restricted to W3C Members only
Disallow: /member/ # This is restricted to W3C Members only
Disallow: /team/ # This is restricted to W3C Team only
Disallow: /TandS/Member # This is restricted to W3C Members only
Disallow: /TandS/Team # This is restricted to W3C Team only
Disallow: /Project
Disallow: /Systems
Disallow: /Web
Disallow: /Team
使用Robots META tag方式
Robots META tag 允許HTML網(wǎng)頁作者指出某一頁是否可以被索引,或是否可以用來查找更多的鏈接文件。目前只有部分robot實施了這一功能。
Robots META tag的格式為:
象其他的META tag一樣,它應(yīng)該放在HTML文件的HEAD區(qū):
...
Robots META tag指令使用逗號隔開,可以使用的指令包括 [NO]INDEX 和[NO]FOLLOW
。INDEX指令指出一個索引性robot是否可以對本頁進行索引
;FOLLOW 指令指出robot是否可以跟蹤本頁的鏈接。缺省的情況是INDEX和FOLLOW
。例如:一個好的Web 站點管理員應(yīng)該將robot的管理考慮在內(nèi)
,使robot為自己的主頁服務(wù), 同時又不損害自己網(wǎng)頁的安全
。
四川新華電腦學(xué)院專業(yè)職業(yè)規(guī)劃師為你提供更多幫助【在線咨詢】
本站首頁?|?
新聞中心?|?
精彩視頻?|?
專業(yè)設(shè)置?|?
學(xué)院環(huán)境?|?
杰出校友?|?
就業(yè)服務(wù)?|?
名師風(fēng)采?|?
網(wǎng)站地圖?|?
法律申明
地址: 成都市新津區(qū)新科大道107號?郵編:611430?電話:028-65577666
蜀ICP備11014515號-1?www.shanghaibag.cc
主辦單位:安徽新華教育集團有限公司
成都新華電腦職業(yè)技能培訓(xùn)學(xué)校 版權(quán)所有 Copyright ? 2009-2015 scxh.cn. All Rights Reserved.
聲明:任何企業(yè)或個人不得以任何商業(yè)目的復(fù)制或傳遞本網(wǎng)站所載述的商標(biāo)
、文字、影像及圖形圖象
国产麻豆福利AV在线观看|
人马杂配mv的视频美国版
|
鸭王电影免费观看完整版普通话|
52avav我爱avhoe02|
女人裸体姓交片|
性大毛片视频|
狠狠爱 夜夜撸|
4虎影库|
人马畜禽人性英文|
国产精华最好的产品入口|
aaa黄|
你是不是没被c够|
羞羞答答成人网站在线|
欧洲无人区天空码头iv在哪|
a片免费观看|
少女吃春晚药第2集免费观看|
挺进大幂幂的滋润花苞御女天下|
仓井老师|
最好看的韩国电影在线观看|
俄罗斯大扔子视频观看|
有点毒校园pop1∨1H高|
砚床完整版在线观看|
caoporo 超碰免费视频|
《法国空乘5》|
让子弹飞大胸女|
无人区电影免费完整观看|
国内精品一线二线三线区别在哪里|
韩国又出大尺度新剧|
秋霞理论在一线免费|
97在线观看免费高清电视剧|
家有色邻动漫|
久久久久久久久久久国产|
妈妈的朋友1-5在观完整有限中字|
你懂的 网址|
《温柔善良的儿媳妇》的背景故事|
中文AV人妻AV无码中文视频|
手机在线观看无码日韩视频|
99re.久久热最新地址|
蘑菇视频在线观看mv看片|
亚瑟视频在线播放高清完整视频|
中文字幕伦视频二区|
温碧霞三圾片|
精品一区二区的区别|
a篇片在线观看网站|
色婷婷五月综合久久中文字幕|
国产精品人妻无码蜜桃|
人与牲功ZZZXXXOOOO|
丰满女邻居做爰BD在线电影|
添女人荫蒂全部过程|
东京不太热免费视频|
最近中文字幕电影免费mv|
麻花传剧原创mv在线看高清|
我要看夫妻性生视频|
色欲AV精品人妻一区二区|
少女たちよ在线观看动漫4|
暴躁少女csgo高清观看|
波多野结衣电影|
无码熟妇人妻AV在线影片软件|
丁香婷婷亚洲A片|
在线天堂新版最新版在线8|
国产人妻麻豆蜜桃色69|
私库av|
国产看真人毛片爱做A片|
天堂中文最新版在线中文|
中文在线地址|
yy6080久久伦理一区二区|
无人区高清完整版在线观看|
超爽久久久久精品A片啪啪|
老司机福利视频一区在线播放|
亚洲国产精品久久AA片|
欧美一区二区成人片|
亚洲精品无码久久久久苍井空|
gogogo高清在线播放韩国|
私人影院性播色播影院|
国产精品毛片完整版视频|
456亚洲人成视频|
17.c.28cm|
免费大片在线观看www|
丁香五月天缴情在线|
麻花传剧原创mv免费播放小米车|
暴躁小姐姐csgo最新剧情|
韩国三级朋友妈妈2017|
五十路息与子在线播放藤崎樱
|
24小时在线影院视频|
亚洲69国产成人无码电影|
两个?我一个bj40分钟宝宝
|
18girlsvideo日本|
按摩店的待遇5|
九九八十一视频在线观看|
9420高清完整版免费视频|
最近韩国日本观看MV在线看|
爱情不ng在线观看|
粗大的内捧猛烈进出的视频|
国产精品99久久AV波多野结衣|
今天免费视频在线观看|
国产午夜福利片|
最近2019年中文字幕免费|
久久这里只精品免费6|
免费观看视频的APP软件推荐一款好用的
|
9420看片免费观看|
大香伊蕉在人线国产最新
|
免费观看高清大片|
少妇极品熟妇人妻高清性色AV|
seerx性欧美老妇|
一个人免费看的高清电影在线观看
|
粉红理论第9集|
免费观看已满十八岁电视剧|
口爱50技巧视频|
九幺短视频软件安装免费|
《夜班护士》结局|
小草视频在线观看视频|
宣宣影视 理论片|
波多野结高清无码中文|
黄金网站APP在线看|
老公和小三一直不断我该怎么办|
床上108种扦插方法视频|
CHRISTMAS农村夫妻HO|
日本熟妇乱妇熟色在线电影|
姨妈18岁免费观看电视剧|
最新欧美伦禁片在线播放|
国产久久爱福利在线|
同妻俱乐部|
天津4s店员工与未成年视频|
成人AV视频免费观看|
xxx4567|
伦理片巨乳伦|
软件下载3.0.3免费vivo版破解大全苹果
|
tobu8日本高清视频|
禁忌乱偷在线观看全部|
欧美性做爰片免费|
4P被两个男人换着躁我小说|
床上72种扦插方法图片|
神马影院午夜|
苍井空电影大全|
www.yjmw.gov.cn|
波多野在线AV一区二区|
windows18-HD-20|
麻花星空mv高清在线播放|
亲嘴扔衣服的视频|
国产在线观看无码免费视频 |
免费观看已满十八岁动漫电视剧|
51无敌男同免费观看大全|
沉香如屑电视剧免费观看|
两个人日本免费完整版高清动漫|
高清一卡二卡三卡四免费|
h人妻|
老婆不在家一个人寂寞CSGO文案|
苍井空全集qvod|
无码AV精品人婕一区二区|
三体动画在线观看完整版|
樱桃视频观看免费高清视频|
哥哥太爱我了怎么办电影|
中文字幕无码亚洲一区二区三区|
老头恋老oldman东北老头|
欧美亚洲一区二区三区|
好姐妹高清在线观看韩国电影
|
ALHAMBRA四叶草|
国产乱国产乱老熟300部|
欧美丰满多毛少妇XXXXX性|
99久久精品视香蕉蕉|
自述吃了春晚药后有多疯狂|
伦子系列午睡沙发|
养儿子就是用来c的双男主|
成人毛片18女人毛片免费视频|
pansy中老年妈妈|
忘忧草社区视频在线播放|
啦啦啦中文字幕高清视频|
绿色qvod成人影院|
韩国三级朋友妈妈2017|
胸大被几个男人轮流玩|
大地电影高清完整版在线观看|
蘑菇视频网页版入口怎么打开|
星空无痕mv免费视频观看|
9·1免费版网站nbaoffice68|
小草在线观看视频免费|
东莞桑拿按摩店内实拍|
少妇性L交大片免费|
姐姐叫的好好听啊姐姐叫故事|
精品成人18成人免费视频|
亚洲超清中文字幕无码|
九一传媒制片厂传媒免费|
少女B站哔哩哔哩免费观看|
2020院线国产大片|
妈妈的朋友5文在线看|
仙踪林一区|
欧美伦理毛片在线看|
男生把困困放到女生困困视频高清|
A4YY午夜福利视频无码|
二人卧床疯狂打扑克视频|
单身男女高清免费观看视频|
乌克兰vodafonewifi巨大app|
成长免费视频播放|
苍井优子|
都市激情校园春色|
国产精品一区二区国产主播|
69精品国产人妻蜜桃国产毛片
|
免费看大片app|
中文无码乱人伦中文视频播放|
欧美+日本+国产|
成熟交bgmbgmbgm|
虫虫漫画官方页面免费漫画seo|
45岁沈阳阿姨叫的真好听
|
啦啦啦免费视频卡一卡二|
69在线|
国产成人午夜电影在线观看|
青柠在线观看免费高清视频下载|
50篇让你自慰到流水|
在线视频观看|
求能看片的网址2017|
在线国语视频在线观看影片|
成人免费看吃奶视频网站|
中日韩欧美免费看的惊悚片|
after高清在线观看|
日本无码亚洲高清视频|
索多玛120天剧情|
欧美日日WWw|
倩女幽魂刘亦菲吻戏|
少女免费观看版高清|
b站在线观看|
人性情感短片视频高清|
成人动漫图片|
臣卜扌喿扌圭辶畐的小说|
丈夫上班后妻子练瑜伽|
埃及猫小脏片链接|
全黄做爰毛片免费看|
日韩av电影|
福利社体验区在线观看|
大地影院MV高清在线观看|
暖暖 视频 在线 观看日本 高清|
免费看大片app|
2019天天吃天天香蕉|
exo妈妈mv高清视频播放|
中国极品少妇XXXXX|
不系纽扣的女孩|
漂亮妈妈在线观看完整版|
国色天香手机在线看|
大地资源网中文在线观看|
超清无码AV在线播放麻豆|
久久播电影网|
国产精品嫩草影院永久在线|
香伊焦人在线观看|
最大的高清色情在线网|
原神女角色无小内无爱心轮滑图片
|
粉色视频在线|
日韩无砖专区一中文字目|
农家俏寡妇电影在线观看免费|
妈妈的朋友8在观整有限中字|
HD100%VIDEO射精|
17Cc吃瓜网最新爆料新闻|
男生把困困放到女生困困里在线观看|
,分享轉(zhuǎn)載需注明來源本網(wǎng)站
中国免费看的片,中国好声音2022第二期,迪迦奥特曼国语全集高清,错爱电影,绿色椅子在线观看,电视剧嫉妒的密码,在线观看电影,爱我就别想太多电视剧免费版全集,南极大冒险国语,世界杯半决赛对阵表来了,寒战2 迅雷下载,富贵兵团国语,猫狗大战1国语版电影,全部演员的名字和照片,灵魂战车国语,精英律师 电视剧,一起来看流星雨免费版在线观看
本網(wǎng)站部分圖片來源于網(wǎng)絡(luò)
,若您的權(quán)利被侵害,請及時聯(lián)系我們