導航:首頁 > 網路安全 > 如何防止網路收錄

如何防止網路收錄

發布時間:2025-07-29 03:01:11

1. 如何對付網路爬蟲

網站建設好了,當然是希望網頁被搜索引擎收錄的越多越好,但有時候我們也會碰到網站不需要被搜索引擎收錄的情況。比如,要啟用一個新的域名做鏡像網站,主要用於PPC的推廣,這個時候就要想法屏蔽搜索引擎蜘蛛抓取和索引我們鏡像網站的所有網頁。因為如果鏡像網站也被搜索引擎收錄的話,很有可能會影響官網在搜索引擎的權重。以下列舉了屏蔽主流搜索引擎爬蟲(蜘蛛)抓取/索引/收錄網頁的幾種思路。注意:是整站屏蔽,而且是盡可能的屏蔽掉所有主流搜索引擎的爬蟲(蜘蛛)。1、通過robots.txt文件屏蔽可以說robots.txt文件是最重要的一種渠道(能和搜索引擎建立直接對話),給出以下建議:User-agent:BaispiderDisallow:/User-agent:GooglebotDisallow:/User-agent:Googlebot-MobileDisallow:/User-agent:Googlebot-ImageDisallow:/User-agent:Mediapartners-GoogleDisallow:/User-agent:Adsbot-GoogleDisallow:/User-agent:Feedfetcher-GoogleDisallow:/User-agent:Yahoo!SlurpDisallow:/User-agent:Yahoo!SlurpChinaDisallow:/User-agent:Yahoo!-AdCrawlerDisallow:/User-agent:YouBotDisallow:/User-agent:SosospiderDisallow:/User-agent:SogouspiderDisallow:/User-agent:SogouwebspiderDisallow:/User-agent:MSNBotDisallow:/User-agent:ia_archiverDisallow:/User-agent:TomatoBotDisallow:/User-agent:*Disallow:/2、通過metatag屏蔽在所有的網頁頭部文件添加,添加如下語句:3、通過伺服器(如:Linux/nginx)配置文件設置直接過濾spider/robots的IP段。小註:第1招和第2招只對「君子」有效,防止「小人」要用到第3招(「君子」和「小人」分別泛指指遵守與不遵守robots.txt協議的spider/robots),所以網站上線之後要不斷跟蹤分析日誌,篩選出這些badbot的ip,然後屏蔽之。

閱讀全文

與如何防止網路收錄相關的資料

熱點內容
緬甸哪個地方用中國網路 瀏覽:157
網路好好手機卻顯示網路異常 瀏覽:404
網路上哪裡寫日記 瀏覽:141
怎麼讓手機移動網路信號變強 瀏覽:141
網路聯通手機 瀏覽:561
怎麼讓路由器擴大網路 瀏覽:990
手機突然顯示無法使用移動網路 瀏覽:654
電腦一直網路連接不了 瀏覽:953
口碑好的網路營銷的五個手段 瀏覽:299
增強網路wifi信號的辦法 瀏覽:880
為什麼網路電視卡得很 瀏覽:460
雷士q3電腦網路怎麼接線 瀏覽:394
網路小說中的亞國是哪個國家 瀏覽:533
如何確定設備網路穩定與流暢 瀏覽:333
負7網路用詞是什麼意思 瀏覽:968
海康威視網路遠程監控設置 瀏覽:692
太空作戰計算機網路作戰是 瀏覽:789
怎麼教孩子學會網路爽文 瀏覽:325
拉網路線哪個公司好點 瀏覽:295
電大計算機網路本科機考題庫 瀏覽:53

友情鏈接