搜索引擎爬虫的用户体验更新策略
所谓用户体验的网页更新策略,是指搜索引擎认为网页参与度有一定的搜索量词排名,前三页是用户频繁访问的页面。那么,对于这类页面,应该优先进行抓取和更新。
但是对于用户来说,3页之后的网页占了非常少的访问者,以后再更新也不是没有道理。因此,采用了网页抓取和更新策略。
这个策略让我们知道一些关键词靠前的网页经常被爬虫抓取。那么值得考虑的是,网站也会有一些细节页面、聚合页面甚至文章页面参与错别字的排名。这是否意味着这次的页面抓取量也不错?
为了解决这个问题,葛平在SEO优化前通过分析访问日志确定了这个答案,80%的情况都是如此。但这类页面的出现频率远低于首页、频道页等更接近首页、路径更短的页面。
但是,我们仍然可以优化我们的详细页面/文章页面,以在这种页面中显示最新的内容,并为最新的内容集合增加爬行门户。
搜索引擎中爬虫抓取网页的抽样聚类策略
说到这个策略,我们来看看字面上的“采样和聚类”。抽样是指从网站上抽取一些样本进行观察,而聚类是根据对这些样本的观察得出一定的结论后应用于这一类型。
我们的网站都是由不同的类型组成的,比如列表页、产品详情页、文章页、渠道页、聚合页等。这些都是不同的类型。搜索引擎从中间选择一些样本,观察后得到一个更新周期,适用于整个类型的方法是抽样聚类的网页抓取更新策略。
例如,搜索引擎从列表页面示例中找到了A列表页面。通过分析观察,发现A列表页面可以每两天爬一次。然后还有B、C、D三个和A列表页类型相同的列表页,因为它们有相同的模板和导航,第一页下面的模块也是指这四个列表页。然后它们是同类的,所以B、C、D列表页和A列表页一样,都是在2天内捕获的。
好了,今天的葛平SEO优化分享到此结束,希望对大家有所帮助。如有疑问,请留言QQ: 707468216【拉你进深圳SEO精英团】。
看过这篇文章的人也很喜欢:
如何让网站内容快速被百度蜘蛛抓取收录?
搜索引擎的爬取爬取规则是什么?
网站SEO如何让百度蜘蛛快速抓取和收集内容?
如何加快百度收录新站?
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/160534.html