本站所有内容仅限用于学习和研究目的,如有侵权请邮件与我们联系处理!
世上事本无难易,为之则易!

网站首页 站长资讯 正文

网站日志分析

曹操 2017-10-26 站长资讯 1699 ℃ 0 评论 3753字 free 收藏

  
网站日志,顾名思义就是记录网站运营的情况以及访问者记录的文件,那么,这么记录是由空间日志自动生成的,通俗点讲就是我们的空间有一个功能,可以记录访问者一些访问信息,并生成一个日志,我们下载下来分析查看就可以了。 
1、那么日志在哪里下载呢?

    首先我们购买空间的时候一定要买这种带日志的空间。以万网空间举例:先找到空间的控制面板,文件管理里面就有网站日志下载,直接点击下载就OK了。有很多朋友用的不是万网空间,找不到服务器日志放在哪的时候,有一个非常快的方法,就是问你们的空间商。 


2、服务器日志记录的具体内容

    谁?什么时间段访问了我的网站?访问到了哪里?访问的结果是什么? 


3、服务器日志的作用: 
①通过IIS日志可以了解蜘蛛对网站的基本爬取情况,可以知道蜘蛛的爬取轨迹和爬取量,通过我们的IIS日志,外链的多和少和网站蜘蛛的爬取量是有直接影响的,我们所说的链接诱饵就是如果你做了一个外链,蜘蛛在爬取这个外链页面并把页面放出来时,蜘蛛可以通过你留的这个链接来爬取你的网站,而IIS日志正是会记录下蜘蛛的这次爬取行动。 
②网站的更新频率也和IIS日志中蜘蛛抓取的频率有关,一般来说更新频率越高,蜘蛛的抓取频率越高,而我们网站的更新不仅仅只是新内容的添加同时还有我们的微调操作。 
③我们可以根据IIS日志的反应情况,对我们的空间的某些事情和问题提前进行预警,因为服务器如果出问题的话在IIS日志中会第一时间反映出来,要知道服务器的稳定速度和打开速度两者都会直接影响我们的网站。 
④通过IIS日志我们可以知道网站的那些页面是很受蜘蛛欢迎的,而哪些页面是蜘蛛连碰都不去碰的,同时我们还能发现有一些蜘蛛由于是过度爬取对我们的服务器资源损耗是很大的,我们要进行屏蔽工作。 
⑤通过IIS日志可以清晰的知道用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪些页面,是否成功。 


4、网站日志一些参数: 
date:发出请求时候的日期。 
time:发出请求时候的时间。注意:默认情况下这个时间是格林威治时间,比我们的北京时间晚8个小时,下面有说明。 
c-ip:客户端IP地址。 
cs-username:用户名,访问服务器的已经过验证用户的名称,匿名用户用连接符-表示。 
s-sitename:服务名,记录当记录事件运行于客户端上的Internet服务的名称和实例的编号。 
s-computername:服务器的名称。 
s-ip:服务器的IP地址。 
s-port:为服务配置的服务器端口号。 
cs-method:请求中使用的HTTP方法,GET/POST。 
cs-uri-stem:URI资源,记录做为操作目标的统一资源标识符(URI),即访问的页面文件。 
cs-uri-query:URI查询,记录客户尝试执行的查询,只有动态页面需要URI查询,如果有则记录,没有则以连接符-表示。即访问网址的附带参数。 
sc-status:协议状态,记录HTTP状态代码,200表示成功,403表示没有权限,404表示找不到该页面,具体说明在下面。 
sc-substatus:协议子状态,记录HTTP子状态代码。 
sc-win32-status:Win32状态,记录Windows状态代码。 
sc-bytes:服务器发送的字节数。 
cs-bytes:服务器接受的字节数。 
time-taken:记录操作所花费的时间,单位是毫秒。 
cs-version:记录客户端使用的协议版本,HTTP或者FTP。 
cs-host:记录主机头名称,没有的话以连接符-表示。注意:为网站配置的主机名可能会以不同的方式出现在日志文件中,原因是HTTP.sys使用Punycode编码格式来记录主机名。 
cs(User-Agent):用户代理,客户端浏览器、操作系统等情况。 
cs(Cookie):记录发送或者接受的Cookies内容,没有的话则以连接符-表示。 
cs(Referer):引用站点,即访问来源。 
HTTP协议状态码的含义,协议状态sc-status,是服务器日记扩展属性的一项。下面是各状态码含义列表: 
“100”:Continue客户必须继续发出请求 
“101”:witchingProtocols客户要求服务器根据请求转换HTTP协议版本200交易成功 
“200”:OK交易成功 
“201”:Created提示知道新文件的URL 
“202”:Accepted接受和处理、但处理未完成 
“203”:Non-AuthoritativeInformation返回信息不确定或不完整 
“204”:NoContent请求收到,但返回信息为空 
“205”:ResetContent服务器完成了请求,用户代理必须复位当前已经浏览过的文件 
“206”:PartialContent服务器已经完成了部分用户的GET请求 
“300”:MultipleChoices请求的资源可在多处得到 
“301”:MovedPermanently删除请求数据 
“302”:Found在其他地址发现了请求数据 
“303”:SeeOther建议客户访问其他URL或访问方式 
“304”:NotModified客户端已经执行了GET,但文件未变化 
“305”:UseProxy请求的资源必须从服务器指定的地址得到 
“306”前一版本HTTP中使用的代码,现行版本中不再使用 
“307”:TemporaryRedirect申明请求的资源临时性删除 
“400”:BadRequest错误请求,如语法错误 
“401”:Unauthorized请求授权失败 
“402”:PaymentRequired保留有效ChargeTo头响应 
“403”:Forbidden请求不答应 
“404”:NotFound没有发现文件、查询或URl 
“405”:MethodNotAllowed用户在Request-Line字段定义的方法不答应 
“406”:NotAcceptable根据用户发送的Accept拖,请求资源不可访问 
“407”:ProxyAuthenticationRequired类似401,用户必须首先在代理服务器上得到授权 
“408”:RequestTime-out客户端没有在用户指定的饿时间内完成请求 
“409”:Conflict对当前资源状态,请求不能完成 
“410”:Gone服务器上不再有此资源且无进一步的参考地址 
“411”:LengthRequired服务器拒绝用户定义的Content-Length属性请求 
“412”:PreconditionFailed一个或多个请求头字段在当前请求中错误 
“413”:RequestEntityTooLarge请求的资源大于服务器答应的大小 
“414”:Request-URITooLarge请求的资源URL长于服务器答应的长度 
“415”:UnsupportedMediaType请求资源不支持请求项目格式 
“416”:Requestedrangenotsatisfiable请求中包含Range请求头字段,在当前请求资源范围内没有range指示值,请求也不包含If-Range请求头字段 
“417”:ExpectationFailed服务器不满足请求Expect头字段指定的期望值,假如是代理服务器, 
“500”:InternalServerError服务器产生内部错误 
“501”:NotImplemented服务器不支持请求的函数 
“502”:BadGateway服务器暂时不可用,有时是为了防止发生系统过载 
“503”:ServiceUnavailable服务器过载或暂停维修 
“504”:GatewayTime-out关口过载,服务器使用另一个关口或服务来响应用户,等待时间设定值较长 
“505”:HTTPVersionnotsupported服务器不支持或拒绝支请求头中指定的HTTP版本


Tags:网站维护

必看说明

  • 本站中所有被研究的素材与信息全部来源于互联网,版权争议与本站无关。
  • 本站文章或仅为文本内容原创,非程序原创。如有侵权、不妥之处,请联系站长第一时间删除。敬请谅解!
  • 本站所有内容严格遵守国家法律的条例,所有研究的算法技术均来源于搜索引擎公开默认允许用户研究使用的接口。
  • 阅读本文及获取资源前,请确保您已充分阅读并理解《访问曹操SEO网站需知:行为准则》。
  • 本站分享的任何工具、程序仅供学习参考编写架构,仅可在本地的虚拟机内断网测试,严禁联网运行或上传搭建!
  • 任何资源必须在下载后24个小时内,从电脑中彻底删除。不得传播或者用于其他任何用途!否则一切后果用户自负!
  • 转载请注明 : 文章转载自  曹操SEO 网站日志分析
  • 本文标题:《网站日志分析》
  • 本文链接:https://www.ccooc.cn/97.html

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

网站分类
近期评论
文章归档
标签列表
站点信息
  • 文章总数:2021
  • 页面总数:7
  • 分类总数:46
  • 标签总数:340
  • 评论总数:8895
  • 浏览总数:5175133