网站目录 » 资讯 » 互联网络 » 行业资讯 » 文章详细

如何识别百度真假蜘蛛?百度蜘蛛大全&识别百度蜘蛛小技巧

来源:网络 浏览次数:138次 发布时间:2022-07-19

一、123开头IP段蜘蛛


  123.125.66.* 代表百度蜘蛛预备抓取。


  123.125.68.* 每天这个IP段蜘蛛来的最多,其余IP段较少的话示意网站被降权或者进入沙盒。


  123.125.71.* 低权重蜘蛛,抓取内页收录的,但是权重较低,文章内页不会很快被放出来。


  123.181.108.77 低权重蜘蛛,抓取内页收录的,但是权重较低,文章内页不会很快被放出来。


  121.14.89.* 此蜘蛛为考察蜘蛛,此IP段蜘蛛来光顾基本上是网站无排名!(以上笔者从未见到过)






二、网站异常Ip段:


  203.208.60.*:此ip段为异常蜘蛛,通常由于网站服务器问题或其他违规行为会引起它来爬取


  210.72.225.*,此ip段为日常巡逻蜘蛛,只要网站没有问题,没有违规操作就行。(以上笔者从未见到过)






三、220和116开头IP段蜘蛛


  220.181.68.*:每天这个IP段只增不减很有大概进沙盒或K站。


  220.181.7.*:代表百度蜘蛛IP拜访,预备抓取你工具。


  220.181.108.*,此ip段为权重蜘蛛,如果此蜘蛛频繁光顾,那么网站收录会有提高。如果频繁光顾网站却不收录,那么要注意是否网站质量不高,内容是否很差。


  220.181.108.95:这个是百度抓取首页的公用IP,如是220.181.108段的话,网站会每天隔夜快照。




 
  220.181.108.92:同上98%抓取首页,大概还会抓取其他(不是指内页)220.181段属于权重IP段此段爬过的文章或首页根本24小时放出来。


  220.181.108.91:属于综合的,重要抓取首页和内页或其他,属于权重IP段,爬过的文章或首页根本24小时放出来。


  220.181.108.75:重点抓取更新文章的内页到达90%,8%抓取首页,2%其他。权重IP段,爬过的文章或首页根本24小时放出来。


  116.179开头的百度蜘蛛、与220开头的蜘蛛功能类似、目测属于权重蜘蛛。






四、其余百度蜘蛛


  159.226.50.*


  180.76.5.*


  220.181.158.107






  百度图片蜘蛛


  123.15.**.**






  百度渲染蜘蛛


  111. *(如下图)






  百度竞价蜘蛛


  61.135.165.134


  117.34.74.66


  118.122.188.194


  119.63.196.9


  125.39.78.185






2022.02.07更新


百度蜘蛛IP段判断


优质段






  116.179.32.*:新版百度蜘蛛,高权重段,一般抓取文章页。IP段位于山西阳泉联通。百度云计算阳泉中心位于世界最大中文搜索引擎百度公司创始人李彦宏的家乡山西省阳泉经济开发区东区。






  220.181.108.75:重点抓取更新文章的内页达到90%,8%抓取首页,2%其他。权重IP 段,爬过的文章或首页基本24小时放出来。






  220.181.108.77:专用抓首页IP权重段,一般返回代码是304 0 0 代表未更新。






  220.181.108.80:专用抓取首页IP权重段,一般返回代码是304 0 0 代表未更新。






  220.181.108.82:抓取tag页面。






  220.181.108.83:专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。






  220.181.108.86:专用抓取首页IP权重段,一般返回代码是304 0 0 代表未更新。






  220.181.108.89:专用抓取首页IP权重段,一般返回代码是304 0 0 代表未更新。






  220.181.108.91:属于综合的,主要抓取首页和内页或其他,属于权重IP 段,爬过的文章或首页基本24小时放出来。






  220.181.108.92:同上98%抓取首页,可能还会抓取其他 (不是指内页),属于权重IP段此段爬过的文章或首页基本24小时放出来。






  220.181.108.94:专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。






  220.181.108.93:重点抓取内页,爬过的文章或首页基本24小时放出来。






  220.181.108.95:这个是百度抓取首页的专用IP,如是220.181.108段的话,基本来说你的网站会天天隔夜快照,绝对错不了的。






  220.181.108.97:专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。






  220.181.108.115:重点抓取内页,爬过的文章或首页基本24小时放出来。






  220.181.108.119:专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。






  220.181.108.156 重点抓取内页,爬过的文章或首页基本24小时放出来。






  220.181.108.158:重点抓取内页,爬过的文章或首页基本24小时放出来。






  220.181.108.184:重点抓取内页,爬过的文章或首页基本24小时放出来。






  220.181.108.180:重点抓取内页,爬过的文章或首页基本24小时放出来。






  220.181.108.*:主要是抓取首页占80%,内页占30%,这此爬过的文章或首页,绝对24小时内放出来和隔夜快照的!一般成功抓取返回代码都是 200 0 0返回304 0 0代表网站没更新,蜘蛛来过,如果是 200 0 64别担心这不是K站,可能是网站是动态的,所以返回就是这个代码。






普通段






  60.172.229.61:代表百度蜘蛛IP造访,准备抓取你东西,抓取网页的百度蜘蛛。






  61.129.45.72:代表百度蜘蛛IP造访,准备抓取你东西,抓取网页的百度蜘蛛。






  61.135.162.*:代表百度蜘蛛IP造访,准备抓取你东西,抓取网页的百度蜘蛛。






  61.135.168.*:抓取图片的百度蜘蛛。






  121.14.89.* :这个ip段作为度过新站考察期,很少。通常有它光顾的时候,网站基本上是没有排名的。






  123.15.**.**:百度图片爬虫。






  123.125.66.*:代表百度蜘蛛IP造访,准备抓取你东西,抓取网页的百度蜘蛛。






  123.125.71.* 抓取内页收录的,权重较低,爬过此段的内页文章暂时被收录但不放出来,因不是原创或采集文章。






  124.166.232.*:可能为新版新站专属百度蜘蛛。






  125.90.88.*:广东茂名市电信也属于百度蜘蛛IP 主要造成成分,是新上线站较多,还有使用过站长工具,或SEO综合检测造成的,没有多大用。






  159.226.50.* :百度蜘蛛。






  180.76.5.*:百度蜘蛛北京联通。






  180.76.5.87:百度蜘蛛北京电信。






  210.72.225.*:这个ip段不间断巡逻各站,就是路过一下。






  220.181.7.*:代表百度蜘蛛IP造访,准备抓取你东西,抓取网页的百度蜘蛛。






垃圾段






百度自家






  61.135.186.* :百度联盟爬虫,百度统计。






  61.135.165.134:百度竞价蜘蛛北京联通。






  61.135.169.*:百度公司内部专用IP;






  111.206.198.*:百度渲染蜘蛛,专门抓取js、css和图片用的,百度站长工具落地着陆页检测IP。






  111.206.221.*:百度渲染蜘蛛,专门抓取js、css和图片用的,百度站长工具落地着陆页检测IP。






  117.34.74.66:百度竞价蜘蛛西安市电信。






  118.122.188.194:百度竞价蜘蛛。






  119.63.196.9:百度竞价蜘蛛。






  123.125.67.* :百度站长工具的IP sitemap。






  125.39.78.185:百度竞价蜘蛛天津联通。






  203.119.241.*:百度主动推送的IP。






  220.181.51.*:百度站长工具的IP sitemap。






  220.181.108.120:抓取/robots.txt。






  220.181.108.146:抓取/robots.txt。






沙盒






  123.125.68.*:这个蜘蛛经常来,别的来的少,表示网站可能要进入沙盒了,或被者降权。






  180.76.15.*:降权蜘蛛,有这个ip说明网站不会在收录了,一直到这个ip段消失。






  220.181.68.*:每天这个IP 段只增不减很有可能进沙盒或K站。






其他






  42.194.242.213:搜外滴滴友链抓取专用蜘蛛。






  61.147.98.146:站长工具模仿的百度蜘蛛。






  61.188.39.16:站长工具模仿的百度蜘蛛。






  113.98.254.245:站长工具模仿的百度蜘蛛。






  117.21.220.245:站长工具模仿的百度蜘蛛。






  117.28.255.42:站长工具模仿的百度蜘蛛。






  121.10.141.* :114站长工具箱。






  124.248.34.52:搜外站长工具蜘蛛。






  180.149.130.*:伪装百度蜘蛛IP。






  222.77.187.33:该IP为站长站友链检测伪蜘蛛IP位于福建省福州市。

相关文章