搜索引擎是如何判断网页的相关性的呢
(1)把用户提交的搜索词分成词A 和词B。
(2) 同时使用词A 和词B 在索引库中进行检索,并提出所有包含词A 或者词B 的文件,
组成文件集合L。
(3)在文件集合L 中把同时包含词A和词B的文件优先提出来组成文件集合M排在前面,
把只包含词A或词B的文件排在后面。
(4) 继续对文件集合M进行分析,把完全包含用户搜索词的文档提出来组成文件集合N,并排在前面,把内容中没有完全匹配搜索词的文件排在后面。
(S) 再根据搜索词在网页中出现的次数、位置、密度和形式等对文件集合N中的文件进行排序。
(6) 搜索引擎还会分析文件的外链数量、质量和锚文本,根据锚文本辅助分析文件和关键词的相关度、外链的数量和质量来确定文件的重要程度,以进行排序调整。