WordPress知识分享

什么是网站日志_如何分析网站日志_发现恶意IP如何屏蔽拉黑

什么是网站日志

网站日志也叫web日志,是对网站访问用户的访问情况做记录,类似视频录像一样的意思。每天我们的访问不但有访客,还有搜索引擎蜘蛛访问,网站日志就可以有效记录所有访客的访问情况,访客的来源,什么时间点来访问,访问了哪些页面,用什么浏览器,什么操作系统等等,网站日志能够把这些数据都记录下来。对于搜索引擎蜘蛛抓取,会记录它是百度蜘蛛,还是google蜘蛛或360蜘蛛,是什么时间过来抓取了哪些页面,抓取的返回值是什么等等这些数据都记录到网站日志文件里。如果我们能很好的读取和分析网站日志就可以换一个角度观察网站的情况,进而解决网站存在的一些问题。

什么是网站日志
什么是网站日志

分析网站日志的目的

一般来说有以下几个目的:

  • 新建网站发布后一段时间没看到搜索引擎收录,这个时候需要下载网站日志分析搜索引擎是否抓取过内容,是不是我们自己的原因屏蔽了蜘蛛抓取等;
  • 原来网站排名还不错后来发现异常了,就要下载网站日志志看看搜索引擎这段时间过来抓取网站情况是否正常;
  • 发现网站被攻击或入侵,下载网站日志分析攻击IP的详细情况,攻击时间,攻击方式,攻击特征等;

如何获取网站日志

网站日志去哪里下载?
  • 虚拟主机一般都去查找 /wwwlogs/ 这一类的目录,名气差不多都有 logs 字样;
  • 服务器、主机会在 /www/wwwlogs/这一类的目录中看到网站日志,比如宝塔面板就是这个目录下,在宝塔面板>安全,右侧的上方看到 Web日志就是了;
  • 虚拟主机和服务器要下载网站日志到本地,我们一般使用 ftp软件,宝塔面板也可以直接在上面提到的路径中下载;
  • 如果遇到网站日志尺寸过大,几百M甚至超过 1G了,可以用 宝塔面板的日志切割功能分成小尺寸文件再下载;

如何分析网站日志

要想分下网站日志,我们还需要一款日志分析软件。找了几款软件都不太好用,最后搜索到了一款 logviewer pro的小软件,用起来还不错。

用这个软件直接打开网站日志文件就行了,也不会限制文件大小,看到的就是一行行的日志记录,如下图所示。是不是看着头皮发麻,感觉无从下手啊,老魏在下面会拿出具体例子来分析,你看了之后会觉得还不是那么难以理解的。

查看网站日志
查看网站日志

从上图中拿出一行来分析如下:

14.18.183.126 – – [06/Sep/2020:16:41:42 +0800] “GET /13264.html HTTP/1.1” 200 10177 “-” “Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.0; Trident/5.0; Trident/5.0)”

IP地址,访问时间精确到秒,+0800是访问者所在时区,get是抓取方式,/13264.html是访问页面地址,http是访问协议,200是http状态码代表访问成功。10177是被访问页面大小。Mozilla后面是访问者浏览器信息、操作系统信息等等。

以上信息我们不用全都分析,只取自己需要的那部分内容综合分析就行了。

再举个例子 ,还是上图中的一行拿过来

  • 203.208.60.98 – – [06/Sep/2020:16:42:09 +0800] “GET /21283.html HTTP/1.1” 200 9337 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”
  • 在2020年9月6日16:42:09秒的时候 IP为 203.208.60.98的google蜘蛛抓取了 /21283.html页面,抓取成功,页面大小9KB

同样的百度蜘蛛,360蜘蛛,头条蜘蛛都会留下类似的日志痕迹。每一家蜘蛛留下的记号都不相同,但是都有自己品牌的名字。

如何分辨真假搜索引擎蜘蛛

当然了有很多是假的搜索引擎蜘蛛,所以我们要学会分析真假蜘蛛。

Windows系统按下键盘 视窗+R,在弹窗输入 cmd命令。在如下图的命令行中输入

nslookup 203.208.60.98

命令和IP地址之间有空格。

这样就得到了下图所示的服务器名称,里面有 googlebot字样,再结合网络上搜索到的这个 IP段是google蜘蛛的结果,综合判断这是真的google蜘蛛。

老魏提醒:

  • 很多恶意IP会挂羊头卖狗肉,实际上是有攻击目的,或者采集,大家要注意分辨;
  • 恶意攻击会采用代理IP方式攻击,所以有时候你看到的IP未必是访问者的真实IP;
如何分辨真假搜索引擎蜘蛛
如何分辨真假搜索引擎蜘蛛

网站日志http状态码

网站日志分析http状态码很重要吗?是的,就刚才我们举例子第一张截图中能看到http状态码,有200或304,意思是搜索引擎蜘蛛或用户来访问网站的结果如何。

  • 200代表抓取成功;
  • 304自从上次请求后,请求的网页未修改过。服务器返回此响应时,不会返回网页内容;
  • 404代表抓取时这个链接不存在,所以给访问者就返回404;

Http状态码特别多,200,300,400或500都可以细分出很多常见状态码数字。我们只要大概的知道这几个常见数字代表什么含义:200代表成功抓取,404代表错误链接,500代表服务器出错。大体知道这几个数字含义就行了,不用记住所有的。而如果想要了解更多http状态码含义可以问度娘搜索一下。

如果你的网站日志中总是出现 404错误代码,就要去查查这些页面都发生什么情况了,为什么总是提示 404,这样就有助于我们改进网站问题。

发现恶意IP如何屏蔽拉黑

遇到恶意 IP可以添加到服务器防火墙IP黑名单中,比如使用安全狗等软件。你也可以在 宝塔面板防火墙中屏蔽恶意IP。

宝塔防火墙有系统防火墙(网络层面)和付费防火墙(软件层面),网络层面大于软件层面,可以这么理解:网络层面是在外层最先接触到访问流量,如果你在这里限制了那么这些IP是无法访问服务器的。软件层面是服务器中的某个web应用,付费防火墙仅限制对这个web应用的访问与否。

拉黑IP难免会遇到“误伤”的时候,从IP黑名单中删除就行了。

老魏提示:

如果是CC攻击的话,拉黑是没用的,不影响下次继续用这个“代理IP”攻击。所以要添加到服务器防火墙中,比如安全狗,宝塔面板防火墙等。用防火墙来屏蔽CC攻击。

扩展阅读:  宝塔面板网站防火墙如何使用

老魏总结

对于大部分新手、小白来说,分析网站日志是一个挺费“眼神儿”和累脑子的工作。平时网站没什么问题的时候也可以多看看网站日志,那里面能发现很多“外表”无法发现的东西。当发现网站异常情况后就要从网站日志中分析问题所在,及时做出相应处理,保障网站的正常运转。

赞(1)
文章名称:《什么是网站日志_如何分析网站日志_发现恶意IP如何屏蔽拉黑》
文章链接: https://www.vpsss.net/23304.html
版权声明:本站资源仅供个人学习交流,禁止转载,不允许用于商业用途,否则法律问题自行承担。
图片版权归属各自创作者所有,图片水印出于防止被无耻之徒盗取劳动成果的目的。
分享到

相关推荐

  • 如何使用WordPress调试插件
  • 如何手动开启设置WordPress调试模式
  • 如何清除浏览器缓存文件
  • Updating Failed Could Not Insert Post Into The Database 解决方法
  • 再谈网站使用CDN对网站的好处
  • 禁用 WordPress 的 wp-cron 定时任务及面板替代
  • PbootCMS网站搬家记录
  • WordPress用户名枚举漏洞的解决过程

天下网标王沈阳百度营销推广网站优化临漳县网站优化鸡西网站优化厂家河北家纺行业网站优化推广怎么样靠谱网站优化贵阳如何优化网站排名金山区企业网站优化价格费用奉节网站优化哪家好网站关键字优化在哪信阳网站关键词优化排名优化工具助力外贸网站推广呼和浩特网站seo优化方案诸城网站优化黄浦网站优化佛山网站排名优化外包公司推广网站的优化龙华网站推广优化花溪区网站优化营销石家庄瓷砖行业网站优化推广特点小曹娥网站优化淘宝店网站优化策划发帖与网站优化有什么共性网站优化保持实时更新网站被k 怎么优化宜兴网站优化多少钱洛阳网站优化服务网站推广优化丶金苹果专业冖巴南区网站优化增城公司网站优化推广费用武汉优化网站关键词香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

天下网标王 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化