导航:首页 > 网络安全 > 如何防止网络收录

如何防止网络收录

发布时间:2025-07-29 03:01:11

1. 如何对付网络爬虫

网站建设好了,当然是希望网页被搜索引擎收录的越多越好,但有时候我们也会碰到网站不需要被搜索引擎收录的情况。比如,要启用一个新的域名做镜像网站,主要用于PPC的推广,这个时候就要想法屏蔽搜索引擎蜘蛛抓取和索引我们镜像网站的所有网页。因为如果镜像网站也被搜索引擎收录的话,很有可能会影响官网在搜索引擎的权重。以下列举了屏蔽主流搜索引擎爬虫(蜘蛛)抓取/索引/收录网页的几种思路。注意:是整站屏蔽,而且是尽可能的屏蔽掉所有主流搜索引擎的爬虫(蜘蛛)。1、通过robots.txt文件屏蔽可以说robots.txt文件是最重要的一种渠道(能和搜索引擎建立直接对话),给出以下建议:User-agent:BaispiderDisallow:/User-agent:GooglebotDisallow:/User-agent:Googlebot-MobileDisallow:/User-agent:Googlebot-ImageDisallow:/User-agent:Mediapartners-GoogleDisallow:/User-agent:Adsbot-GoogleDisallow:/User-agent:Feedfetcher-GoogleDisallow:/User-agent:Yahoo!SlurpDisallow:/User-agent:Yahoo!SlurpChinaDisallow:/User-agent:Yahoo!-AdCrawlerDisallow:/User-agent:YouBotDisallow:/User-agent:SosospiderDisallow:/User-agent:SogouspiderDisallow:/User-agent:SogouwebspiderDisallow:/User-agent:MSNBotDisallow:/User-agent:ia_archiverDisallow:/User-agent:TomatoBotDisallow:/User-agent:*Disallow:/2、通过metatag屏蔽在所有的网页头部文件添加,添加如下语句:3、通过服务器(如:Linux/nginx)配置文件设置直接过滤spider/robots的IP段。小注:第1招和第2招只对“君子”有效,防止“小人”要用到第3招(“君子”和“小人”分别泛指指遵守与不遵守robots.txt协议的spider/robots),所以网站上线之后要不断跟踪分析日志,筛选出这些badbot的ip,然后屏蔽之。

阅读全文

与如何防止网络收录相关的资料

热点内容
缅甸哪个地方用中国网络 浏览:157
网络好好手机却显示网络异常 浏览:404
网络上哪里写日记 浏览:141
怎么让手机移动网络信号变强 浏览:141
网络联通手机 浏览:561
怎么让路由器扩大网络 浏览:990
手机突然显示无法使用移动网络 浏览:654
电脑一直网络连接不了 浏览:953
口碑好的网络营销的五个手段 浏览:299
增强网络wifi信号的办法 浏览:880
为什么网络电视卡得很 浏览:460
雷士q3电脑网络怎么接线 浏览:394
网络小说中的亚国是哪个国家 浏览:533
如何确定设备网络稳定与流畅 浏览:333
负7网络用词是什么意思 浏览:968
海康威视网络远程监控设置 浏览:692
太空作战计算机网络作战是 浏览:789
怎么教孩子学会网络爽文 浏览:325
拉网络线哪个公司好点 浏览:295
电大计算机网络本科机考题库 浏览:53

友情链接