网站质量和网页质量是搜索引擎优化中经常提到的搜索引擎优化术语。但具体来说,我相信大多数SEO都不明白搜索引擎是如何判断网页和网站质量的。主要原因是这些算法是搜索引擎公司的核心机密,而搜索引擎公司很少披露关于这些算法的任何线索。但是,通过对搜索引擎原理和搜索引擎主要网页质量分析技术的研究。
基于网页链接关系的分析方法,能够被更多网页链接的热门网页不仅是更重要的网页,也是高质量的网页。事实证明,这种方法比较成功。例如,谷歌的PageRank方法使用这种方法对网页进行加权。
这种方法之所以有效,主要是因为网络环境的特殊性。可以说,网络上没有全面的质量控制,所以网页不具备类似于发布环境的权威评价特征(在发布环境中,相关文档可以通过同行评议等方式被他人认可,从而呈现高质量),因此网络用户需要用其他方法来判断网站的专业能力和可信度。其中,常用的方法是链接网页的人数和链接网页的质量。显然,链接网页的人越多,或者链接网页的质量越高,当前网页的质量就能体现得越高。比如大学、图书馆或者有价值的网站链接的网站,通常都是一些高质量的网站。同时,每个网页都愿意与其他网页建立链接关系,因为在没有整体网页质量控制的情况下,网页可以通过建立到高质量网页的链接来显示自己的内容。另一方面,到源网页的链接希望得到用户对当前网页的认可,这在一定程度上可以解释为什么网页超链接在web环境中非常流行。
然而,尽管这种方法易于实现,许多搜索引擎系统可以提供基于网页超链接关系的分析技术,并将其应用于网页推荐服务,但仍存在许多问题。比如上面的评价标准是基于一个基本前提,那就是链接数量多的网页,也就是热门的网页一定是高质量的网页。然而,仍然存在许多问题。比如那些在搜索结果中排名靠后的冷门网页,不太可能被用户访问;相反,那些非常受欢迎的网页更容易被更多的用户访问,因为它们有更多的链接和更高的排名,所以它们变得越来越受欢迎,可以显示更高的质量,这导致了所谓的“致富致富”现象。这显然是不公平的,尤其是对于一些高质量的现有网页和一些新的高质量网页,不太可能吸引太多的链接用户。
这种方法使用网站流量来评估网站的页面质量,例如Alexa。它通过比较网站的流量来对网站进行排名。同时也指链节点数和用户评论数。但是热门主题的网站通常流量比较大,所以Alexa没有提供不同主题网站的排名,这还是不完整的。也有学者提出了基于不同话题的网站流量排名方法,但话题范围比较广。
由于上述方法的不足,有学者提出网页质量可以表示为随机用户愿意访问本网站网页寻找特定信息的概率,如主题实验系统。与基于网页链接关系的评价指标不同,这个指标是基于这样一个假设,即如果用户在浏览后短时间内建立了到网页的超链接,则可以认为该网页的质量较高,因此可以向所有用户显示所有网页。通过了解用户是否在短时间内与他们建立了超链接,我们可以计算出用户对他们的喜爱程度,从而获得网页的质量。显然,虽然用户在网页上建立超链接的行为不一定能反映网页的质量,但如果面对的是大多数用户,这种统计汇总信息会客观地反映网页的质量。因此,这种定义方法可以称为基于用户访问模型的方法。
由于网页质量也与网页本身的受欢迎程度有关,传统的基于网页链接关系的评价方法也间接考虑了网页质量。网页的质量是通过其受欢迎程度来衡量的,受欢迎程度可以通过喜欢网页的用户数量来确定,而通过网页中的链接数量来间接衡量,因此链接数量与网页质量指数成正比。但是,它为所有网页提供了相同的面向用户的机会,因此新网页不可能获得比原始流行网页更多的链接。从这个角度来看,传统的基于网页链接关系的评价方法仍然没有充分考虑网页的质量。它只利用网页在某个时间点的链接关系来判断。在基于用户访问模型的网页质量定义中,我们注重短时间内建立链接的特点。因此,我们必须测量动态时间间隔内网页链接关系的变化。换句话说,网页的受欢迎程度可以定义为用户在某个时间点对网页的喜欢程度,而网页的质量定义为用户在单位时间内找到网页时对网页的喜欢程度。
显然,网页质量与网页人气之间存在正相关关系,但也有一些因素会影响网页被访问的概率。网页的质量可以看作是网页的一个客观指标,不会随时间而变化。因此,在确定网页质量时,网页的受欢迎程度主要取决于网页被访问的概率。
当然,这个指标的设计也不能说没有问题。会产生话题偏差。比如话题的人气和质量。一般来说,如果一个网页的主题是一个比较流行的主题,那么这个网页的质量相对来说要比那些只讲过时主题的网页要高。然而,从网页质量的角度来看,这似乎很正常。毕竟,衡量网页真实质量的方法是考虑网页主题的内容。同时,搜索引擎通常会将要排序的页面限制在返回结果的小范围内。作为同一个用户查询的返回结果,这些页面在语义上基本相似,所以这些页面的相对大小还是有可比性的。因此,在网络信息搜索中
环境中,这种直接衡量网页质量的指标更为适用。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/136255.html