会剖析网站日志的优化才是好优化,也是最基础的一步,经过剖析确诊能够了解到网站的健康状况,使用这些数据更有利于开展网站SEO优化。
经过网站日志能够清楚的得知用户在什么IP、什么时刻、用什么操作系统、什么浏览器、什么分辨率显示器的情况下拜访了你网站的哪个页面,是否拜访成功。关于专业从事搜索引擎优化工作者而言,网站日志能够记载各搜索引擎蜘蛛机器人匍匐网站的详细情况,例如:哪个IP的百度蜘蛛机器人在哪天拜访了网站多少次,拜访了哪些页面,以及拜访页面时回来的HTTP状况码。
常见的蜘蛛名称:
Baiduspider:百度蜘蛛
Baiduspider-Image:百度图片蜘蛛
Googlebot:谷歌机器人
Googlebot-Image:谷歌图片机器人
360Spider:360蜘蛛
sogou spider:搜狗蜘蛛
一、网站日志的作用
1、经过网站日志能够了解蜘蛛对网站的基本爬取情况,能够知道蜘蛛的爬取轨道和爬取量。
2、网站的更新频率也和网站日志中蜘蛛抓取的频率有关,一般来说更新频率越高,蜘蛛的抓取频率越高,而咱们网站的更新不仅仅只是新内容的添加一起还有咱们的微调操作。
3、咱们能够依据网站日志的反响情况,对咱们的空间的某些事情和问题提前进行预警,由于服务器假如出问题的话在网站日志中会第一时刻反映出来,要知道服务器的安稳速度和翻开速度两者都会直接影响咱们的网站。
4、经过网站日志咱们能够知道网站的那些页面是很受蜘蛛欢迎的,而哪些页面是蜘蛛连碰都不去碰的,一起咱们还能发现有一些蜘蛛由于是过度爬取对咱们的服务器资源损耗是很大的,咱们要进行屏蔽工作。
二、如何下载网站日志
1、首要咱们的空间要支撑网站日志下载,这一点是很重要的,在购买空间时候需事前了解下是否支撑日志下载,由于有的服务商是不供给这项服务的,假如支撑的话空间后台一般都有日志WebLog日志下载这个功能把它下载到根目录在用FTP传到本地就能够,服务器的话能够设置将日志文件下载到指定途径。
2、这儿有个很重要的问题,网站日志强烈建议设置成每小时生成一次,小型的企业站和页面内容较少的网站能够设置成一天,它默认是一天,假如内容多或者大型站设置成一天生成一次,那么一天只生成一个文件,这个文件会相当的大,咱们有时电脑翻开是会形成死机,设置的话找空间商协调设置即可。
三、网站日志数据剖析
1、网站日志中数据量过大,所以咱们一般需求借助网站日志剖析东西来检查。常用的日志剖析东西有:光年日志剖析东西、web logexploer、WPS表格等117.26.203.167 - - [02/May/2011:01:57:44 -0700] \"GET/index.php HTTP/1.1\"500 19967 \"-\" \"Mozilla/4.0 (compatible; MSIE 8.0;Windows NT 5.1; Trident/4.0;AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar)\"剖析:
117.26.203.167拜访ip;
02/May/2011:01:57:44 -0700拜访日期 -时区;GET/index.php HTTP/1.1依据HTTP/1.1协议抓取(域名下)/index.php这个页面(GET表明服务器动作);500服务器呼应状况码;服务器呼应状况码通常状况码有以下几种:200,301,302,304,404,500等。200代表用户成功的获取到了所请求的文件,假如是搜索引擎,则证明蜘蛛在这次匍匐中顺利的发现了一些新的内容。而301则代表用户所拜访的某个页面url现已做了301重定向(永久性)处理,302则是暂时性重定向。404则代表所拜访的页面现已不存在了,或者说拜访的url根本就是个过错的。500则是服务器的过错。
19967表明抓取了19967个字节;
Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0;AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar表明拜访者使用火狐浏览器及AlexaToolbar等拜访端信息;2、假如你的日志里格局不是如此,则代表日志格局设置不同。
3、很多日志里能够看到 200 0 0和200 0 64则都代表正常抓取。
4、抓取频率是经过检查每日的日志里百度蜘蛛抓取次数来获悉。抓取频率并没有一个规范的时刻表或频率数字,咱们一般经过多日的日志比照来判别,当然,咱们希望百度蜘蛛每日抓取的次数越多越好。
5、有时候咱们的途径不一致出现带斜杠和不带斜杠的问题,蜘蛛会自动识别为301跳转到带斜杠的页面,这儿咱们就发现了搜索引擎是能够判别咱们的目录的,所以咱们要对咱们的目录进行一致。
6、咱们剖析日志剖析时刻长了,咱们能够看出蜘蛛的抓取规则,同一目录下面的单个文件的抓取频率间隔和不同目录的抓取频率间隔都能够看出来,这些抓取频率间隔时刻是蜘蛛依据网站权重和网站更新频率来自动确认的。
7、蜘蛛关于咱们的页面的抓取是分等级的,是依据权重依次递减的,一般顺序为主页、目录页、内页。
四、经过网站日志咱们能知道什么?
1、咱们买的空间是否能够安稳?
2、蜘蛛对咱们的那些页面比较喜欢而对哪些不喜欢?
3、蜘蛛什么时候抓取咱们的网站频频,咱们需求什么时候更新内容?
所以不管是新站仍是老网站,不管你做百度仍是Google咱们都能经过网站日志剖析出来搜索引擎蜘蛛抓取的情况;假如网站长时刻收录有问题,那么咱们也能够比照网站日志中的搜索引擎蜘蛛行为,来了解网站是哪方面出了问题;假如网站被封,或者被K,咱们都能够经过观察网站日志的情况来了解原因出在什么地方。咱们要看的网站日志的剖析和确诊就像给网站看病一样,咱们经过网站日志的剖析,能够简单明了的就知道网站的健康状况,能够利于咱们更好的做网站优化,所以关于真实的SEO高手而言,剖析蜘蛛日志是最直观,最有效的额。
本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/67096.html
如有侵犯您的合法权益请发邮件951076433@qq.com联系删除