本站所有内容仅限用于学习和研究目的,如有侵权请邮件与我们联系处理!
世上事本无难易,为之则易!

网站首页 蜘蛛池 蜘蛛池技术 正文

自用便于统计360蜘蛛的php代码

曹操 2021-06-28 蜘蛛池技术 2383 ℃ 0 评论 1106字 free 收藏

前段有时间有分享过《将蜘蛛统计为txt展示的php代码》和《自用便于统计百度蜘蛛的php代码》方便用户使用文本文档的方式查看相关搜索引擎蜘蛛来爬取的url链接,方便查询快照是否收录。

今年做360快照秒收的人也比较多,此时准备一个将360spider抓取的url链接保存为txt就显得尤为重要,我们可以将爬取的链接到IIS7下便捷的一键查询是否收录以及收录数量。

操作方法

在服务器根目录新建:spider.php,代码如下:

<?php
function get_naps_bot()
{
	$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
if (strpos($useragent, '360spider') !== false){
	return '360Spider';
}
return false;
}
function nowtime(){
	$date=gmdate("Y-n-j H:i:s",time()+8*3600);
	return $date;
}
$searchbot = get_naps_bot();
if ($searchbot) {
	$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
	$url=$_SERVER['HTTP_HOST'] . $_SERVER['REQUEST_URI'];
	$file="spiderlogs.txt";
	$time=nowtime();
	$data=fopen($file,"a");
	fwrite($data,"Time:$time robot:$searchbot URL:$url\n");
	fclose($data);
}
?>

在泛目录的index.php/404.php/sitemapphp的等相关蜘蛛会访问到的文件中插入:

include'spider.php';

查看蜘蛛统计的话,访问:您的域名/spiderlogs.txt


Tags:网络爬虫蜘蛛池程序蜘蛛统计

必看说明

  • 本站中所有被研究的素材与信息全部来源于互联网,版权争议与本站无关。
  • 本站文章或仅为文本内容原创,非程序原创。如有侵权、不妥之处,请联系站长第一时间删除。敬请谅解!
  • 本站所有内容严格遵守国家法律的条例,所有研究的算法技术均来源于搜索引擎公开默认允许用户研究使用的接口。
  • 阅读本文及获取资源前,请确保您已充分阅读并理解《访问曹操SEO网站需知:行为准则》。
  • 本站分享的任何工具、程序仅供学习参考编写架构,仅可在本地的虚拟机内断网测试,严禁联网运行或上传搭建!
  • 任何资源必须在下载后24个小时内,从电脑中彻底删除。不得传播或者用于其他任何用途!否则一切后果用户自负!
  • 转载请注明 : 文章转载自  曹操SEO 自用便于统计360蜘蛛的php代码
  • 本文标题:《自用便于统计360蜘蛛的php代码》
  • 本文链接:https://www.ccooc.cn/1461.html

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

网站分类
近期评论
文章归档
标签列表
站点信息
  • 文章总数:2017
  • 页面总数:7
  • 分类总数:46
  • 标签总数:339
  • 评论总数:8850
  • 浏览总数:5142710