《了解搜索引擎原理》内容与关键词相关性

| 已有人阅读此文| 作者:徐小坏 |

在搜索引擎抓取到页面之后通过用户搜索词计算出前一千个相关结果,最后相关性计算的初始页面子集的选择,必须依靠其他特征而不是相关性,其中最主要的就是页面权重。由于所有匹配文件都已经具备了最基本的相关性(这些文件都包含所有查询关键词),搜索引擎通常会用非相关性的页面特征选出一个初始子集。不懂抓取的可以阅读《搜索引擎蜘蛛抓取页面原理

选出初始子集后,对子集中的页面计算关键词相关性。

计算相关性是排名过程中最重要的一步。相关性计算是搜索引擎算法中最令 SEO 感兴趣的部分。

seo博客

影响相关性的主要因素包括几方面。

关键词常用程度经过分词后的多个关键词,对整个搜索字符串的意义贡献并不相同。

越常用的词对搜索词的意义贡献越小,越不常用的词对意义贡献越大。举个例子,假设用户输入的搜索词是“我们冥王星”。“我们”这个词常用程度非常高,在很多页面上会出现,它对“我们冥王星”这个搜索词的辨识程度和意义相关度贡献就很小。

找出那些包含“我们”这个词的页面,对搜索排名相关性几乎没有什么影响,有太多页面包含“我们”这个词。而“冥王星”这个词常用程度就比较低,对“我们冥王星”这个搜索词的意义贡献要大得多。那些包含“冥王星”这个词的页面,对“我们冥王星”这个搜索词会更为相关。

常用词的极致就是停止词,对页面意义完全没有影响。所以搜索引擎对搜索词串中的关键词并不是一视同仁地处理,而是根据常用程度进行加权。不常用的词加权系数高,常用词加权系数低,排名算法对不常用的词给予更多关注。我们假设 A、B 两个页面都各出现“我们”及“冥王星”两个词。但是“我们”这个词在 A 页面出现于普通文字,“冥王星”这个词在 A 页面出现于标题标签中。B 页面正相反,“我们” 出现在标题标签中,而“冥王星”出现在普通文字中。

那么针对“我们冥王星”这个搜索词, A 页面将更相关。

词频及密度一般认为在没有关键词堆积的情况下,搜索词在页面中出现的次数多,密度比较高,说明页面与搜索词越相关。当然这只是一个大致规律,实际情况未必如此,所以相关性计算还有其他因素。

出现频率及密度只是因素的一部分,而且重要程度越来越低。关键词位置及形式像在索引部分中提到的,页面关键词出现的格式和位置都被记录在索引库中。关键词出现在比较重要位置,如标题标签、黑体、H1 等,说明页面与关键词越相关。这一部分就是页面 SEO 所要解决的。关键词距离切分后的关键词完整匹配出现,说明与搜索词最相关。

比如搜索“减肥方法”时,页面上连续完整出现“减肥方法”四个字是最相关的。

如果“减肥”和“方法”两个词没有连续匹配出现,出现的距离近一些,也被搜索引擎认为相关性稍微大一些。链接分析及页面权重除了页面本身的因素,页面之间的链接和权重关系也影响关键词的相关性,其中最重要的是锚文字。

页面有越多以搜索词为锚文字的导入链接,说明页面的相关性越强。链接分析还包括了链接源页面本身的主题,锚文字周围的文字等

PS:欢迎转载本站文章,但是,希望您注明来源,并留下原文链接地址。http://www.aizyw.cn/seo/50.html


喜欢请分享到:

0

  • 什么是泛解析?怎么做泛解析?
  • 百度极光算法上线,倡导各位资源方重视网站落地页时间规范
  • 各大搜索引擎网站提交入口
  • 没想到《猎场》里面的胡歌竟然这么重视seo优化
  • 2018年最新黑帽SEO作弊方法详解
  • 网站SEO优化公式解析,简单又非常重要的公式
  • SEO综合工具:5118大数据平台!
  • 百度seo优化网站排名基础
  • 《了解搜索引擎原理》页面去重,去停止词,消除噪声算法
  • 崔鹏瀚SEO:2017-2018年国内搜索引擎市场份额分析报告