導航:首頁 > 網路安全 > 如何防止網路收錄

如何防止網路收錄

發布時間:2025-07-29 03:01:11

1. 如何對付網路爬蟲

網站建設好了,當然是希望網頁被搜索引擎收錄的越多越好,但有時候我們也會碰到網站不需要被搜索引擎收錄的情況。比如,要啟用一個新的域名做鏡像網站,主要用於PPC的推廣,這個時候就要想法屏蔽搜索引擎蜘蛛抓取和索引我們鏡像網站的所有網頁。因為如果鏡像網站也被搜索引擎收錄的話,很有可能會影響官網在搜索引擎的權重。以下列舉了屏蔽主流搜索引擎爬蟲(蜘蛛)抓取/索引/收錄網頁的幾種思路。注意:是整站屏蔽,而且是盡可能的屏蔽掉所有主流搜索引擎的爬蟲(蜘蛛)。1、通過robots.txt文件屏蔽可以說robots.txt文件是最重要的一種渠道(能和搜索引擎建立直接對話),給出以下建議:User-agent:BaispiderDisallow:/User-agent:GooglebotDisallow:/User-agent:Googlebot-MobileDisallow:/User-agent:Googlebot-ImageDisallow:/User-agent:Mediapartners-GoogleDisallow:/User-agent:Adsbot-GoogleDisallow:/User-agent:Feedfetcher-GoogleDisallow:/User-agent:Yahoo!SlurpDisallow:/User-agent:Yahoo!SlurpChinaDisallow:/User-agent:Yahoo!-AdCrawlerDisallow:/User-agent:YouBotDisallow:/User-agent:SosospiderDisallow:/User-agent:SogouspiderDisallow:/User-agent:SogouwebspiderDisallow:/User-agent:MSNBotDisallow:/User-agent:ia_archiverDisallow:/User-agent:TomatoBotDisallow:/User-agent:*Disallow:/2、通過metatag屏蔽在所有的網頁頭部文件添加,添加如下語句:3、通過伺服器(如:Linux/nginx)配置文件設置直接過濾spider/robots的IP段。小註:第1招和第2招只對「君子」有效,防止「小人」要用到第3招(「君子」和「小人」分別泛指指遵守與不遵守robots.txt協議的spider/robots),所以網站上線之後要不斷跟蹤分析日誌,篩選出這些badbot的ip,然後屏蔽之。

閱讀全文

與如何防止網路收錄相關的資料

熱點內容
共享時代網路安全知識 瀏覽:615
華為老是顯示無線網路不可用 瀏覽:988
怎樣使用手機網路上網 瀏覽:109
手機如何跟步步高一起共用網路 瀏覽:190
華為wifi6路由器網路不穩定 瀏覽:352
惠普哪個鍵盤控制無線網路 瀏覽:813
貓咪網路信號差 瀏覽:584
移動網路對海外鏈接有限制 瀏覽:507
連接列印機需要輸入網路密碼 瀏覽:850
工地沒有網路怎麼設置 瀏覽:89
如何觀察自己家的網路 瀏覽:997
長寧區網路營銷會務策劃大概費用 瀏覽:871
如何制止網路隨意評價 瀏覽:210
網路營銷策劃分為多少層 瀏覽:852
監控網路異常怎麼重設密碼 瀏覽:463
typec介面能不能共享網路 瀏覽:618
網關連接電腦網路受限嗎 瀏覽:26
有路由器怎麼進網路 瀏覽:895
本地網路連接收不到數據包 瀏覽:691
手機評測網路測速 瀏覽:547

友情鏈接