导航:首页 > 网络安全 > 如何防止网络收录

如何防止网络收录

发布时间:2025-07-29 03:01:11

1. 如何对付网络爬虫

网站建设好了,当然是希望网页被搜索引擎收录的越多越好,但有时候我们也会碰到网站不需要被搜索引擎收录的情况。比如,要启用一个新的域名做镜像网站,主要用于PPC的推广,这个时候就要想法屏蔽搜索引擎蜘蛛抓取和索引我们镜像网站的所有网页。因为如果镜像网站也被搜索引擎收录的话,很有可能会影响官网在搜索引擎的权重。以下列举了屏蔽主流搜索引擎爬虫(蜘蛛)抓取/索引/收录网页的几种思路。注意:是整站屏蔽,而且是尽可能的屏蔽掉所有主流搜索引擎的爬虫(蜘蛛)。1、通过robots.txt文件屏蔽可以说robots.txt文件是最重要的一种渠道(能和搜索引擎建立直接对话),给出以下建议:User-agent:BaispiderDisallow:/User-agent:GooglebotDisallow:/User-agent:Googlebot-MobileDisallow:/User-agent:Googlebot-ImageDisallow:/User-agent:Mediapartners-GoogleDisallow:/User-agent:Adsbot-GoogleDisallow:/User-agent:Feedfetcher-GoogleDisallow:/User-agent:Yahoo!SlurpDisallow:/User-agent:Yahoo!SlurpChinaDisallow:/User-agent:Yahoo!-AdCrawlerDisallow:/User-agent:YouBotDisallow:/User-agent:SosospiderDisallow:/User-agent:SogouspiderDisallow:/User-agent:SogouwebspiderDisallow:/User-agent:MSNBotDisallow:/User-agent:ia_archiverDisallow:/User-agent:TomatoBotDisallow:/User-agent:*Disallow:/2、通过metatag屏蔽在所有的网页头部文件添加,添加如下语句:3、通过服务器(如:Linux/nginx)配置文件设置直接过滤spider/robots的IP段。小注:第1招和第2招只对“君子”有效,防止“小人”要用到第3招(“君子”和“小人”分别泛指指遵守与不遵守robots.txt协议的spider/robots),所以网站上线之后要不断跟踪分析日志,筛选出这些badbot的ip,然后屏蔽之。

阅读全文

与如何防止网络收录相关的资料

热点内容
工地没有网络怎么设置 浏览:87
如何观察自己家的网络 浏览:994
长宁区网络营销会务策划大概费用 浏览:869
如何制止网络随意评价 浏览:208
网络营销策划分为多少层 浏览:850
监控网络异常怎么重设密码 浏览:463
typec接口能不能共享网络 浏览:618
网关连接电脑网络受限吗 浏览:26
有路由器怎么进网络 浏览:895
本地网络连接收不到数据包 浏览:691
手机评测网络测速 浏览:547
无线网络密钥怎么改呢 浏览:368
网络安全责任分配的原则 浏览:149
一打开软件网络速度就慢 浏览:888
模拟网络手机 浏览:698
如何开通移动宽带网络 浏览:704
6兆网络多少钱一月 浏览:421
思域手机网络连接 浏览:267
软件测试和网络哪个容易些 浏览:483
在哪里办网络电视 浏览:648

友情链接