首页 - 每日一评 - 文章正文

搜索引擎如何使用机器学习:我们知道的9件事确实

时间:2019-07-19 07:35:24 作者:黑曼巴 分类:每日一评 浏览:218

机器学习本质上是使用算法来计算基于历史数据的 的特定事物的趋势,价值或其他特征。百度甚至宣称自己是一家机器学习第一的公司。即使仍然有人类质量评估者,机器学习已帮助百度自动筛选页面以清除低质量页面,而不需要真正的人类首先查看它。Illyes在播客节目中也提到,更多的百度信号可能会成为基于机器学习的信号。研究人员使用俄罗斯搜索引擎Yandex分析不同查询的结果。

 

当我们在2010年初开始听到机器学习的时候,起初看起来很可怕。

但是一旦向我们解释了(我们已经意识到技术已经被用来为我们提供解决方案),我们开始深入研究实际问题:

搜索引擎如何使用机器学习?它将如何影响SEO?

机器学习本质上是使用算法来计算基于历史数据的 的特定事物的趋势,价值或其他特征。

百度甚至宣称自己是一家机器学习第一的公司。

如果你想进一步了解这项技术的战术方面,  Eric Enge在Moz上有一篇很好的写作 ,解释了机器学习如何从数学角度影响SEO。

搜索引擎总是试验他们如何使用这种不断发展的技术,但是我们知道他们目前正在使用机器学习以及它与SEO或数字营销的关系的九种方式。

1.模式检测

搜索引擎正在使用机器学习进行模式检测,以帮助识别垃圾邮件或重复内容。他们插入了低质量内容的常见属性,例如:

存在几个到不相关页面的出站链接。停止词或同义词的大量使用。其他此类变量。

能够检测到这些模式大大减少了实际人员审查所有内容所需的人力。

即使仍然有人类质量评估者,机器学习已帮助百度自动筛选页面以清除低质量页面,而不需要真正的人类首先查看它。

机器学习是一项不断发展的技术,因此分析的页面越多,理论上就越准确。

2.识别新信号

根据与百度的Gary Illyes共同完成的2016年播客,RankBrain不仅有助于识别查询中的模式,还有助于搜索引擎识别可能的新排名信号。

寻求这些信号,因此百度可以继续提高搜索查询结果的质量。

Illyes在播客节目中也提到,更多的百度信号可能会成为基于机器学习的信号。

由于搜索引擎能够教授技术如何自己运行预测和数据,因此可以减少手工劳动,员工可以转向机器无法做到的其他事情,如创新或以人为本的项目。

它作为一个小部分被加权

然而,即使机器学习正在慢慢改变搜索引擎查找和排名网站的方式,但它并不意味着它(对我们的SERP)产生重大的重大影响。

在同一播客采访中,Illyes表示它只是整体排名信号平台的一部分,并且只是其整体算法的一小部分。

百度的Zui终目标是使用技术为用户提供更好的体验。他们不希望自动化整个过程,如果这意味着用户赢得了他们正在寻找的经验。

因此,不要假设机器学习将很快接管所有搜索排名;它只是搜索引擎实现的一小部分,希望能让我们的生活更轻松。

4.基于特定查询的自定义信号

根据华盛顿大学2017年7月的一项研究,搜索引擎中的机器学习可能会根据查询类别或措辞而有所不同。

研究人员使用俄罗斯搜索引擎Yandex分析不同查询的结果。他们发现显示的结果类型很大程度上取决于查询类别或措辞。

这意味着机器学习可以在某些查询中或多或少地对变量赋予更多权重。

总的来说,发现通过机器学习定制的个性化搜索将结果的点击率(CTR)提高了大约10%。

当用户向Yandex输入更多查询时,发现CTR继续增加。

这很可能是因为搜索引擎是“学习”的。关于该特定用户的偏好,可以根据过去的查询提供信息,以提供Zui有趣的信息。

会议演示中经常使用的一个示例是一次性查询,以及结果如何根据您上次搜索的内容而变化。

例如,如果我搜索“纽约足球场”。在隐身浏览器中,我得到了“MetLife体育场”的答案。

接下来,如果我在同一个浏览器中搜索“喷气机”,“rvequo;百度假设因为我的上一次查询是关于一个足球场,那么这个查询也是关于足球。

 

当我继续搜索时,百度会在我变成其他东西的时候得知。

正在寻找“美洲虎”和“美洲虎”在同一个浏览器中将显示有关杰克逊维尔美洲虎队的NFL球队的信息(与我Zui后两次搜索相关)。

但我搜索的实例是“圣地亚哥附近的动物园”。然后开始输入“动物园”。再次在查询框中,百度建议“与美洲虎一起动物园””即使我没有第二次搜索美洲虎。

搜索历史只是机器学习用于提供更好结果的搜索体验的一个组成部分。

5.图像搜索以了解照片

早在2013年,据报道,Flickr用户每天上传140万张照片,4000万张上传到Instagram,Facebook用户上传了3.5亿张。

虽然这些统计数据可能已经上升(很难找到更新的数据),但它显示需要在网上每天编目和分析的照片数量。

此任务非常适合机器学习,因为它可以分析颜色和形状模式,并将其与任何有关照片的现有模式数据配对,以帮助搜索引擎了解图像实际是什么。

这就是百度不仅能够为百度图像搜索结果编目图像,而且还支持用户通过照片文件(而不是文本查询)进行搜索的功能。

然后,用户可以在线查找照片的其他实例,以及具有相同主题或调色板的类似照片以及照片中主题的相关信息,如此经典圣诞电影的示例仍为:

用户与这些结果交互的方式可以在将来塑造他们的SERP。

6.识别搜索查询中单词之间的相似性

机器学习不仅可以使用查询数据来识别和个性化用户以后的查询,还可以帮助创建数据模式,从而塑造其他用户获得的搜索结果。

百度趋势是一个很好的前端例子。Zui初并不意味着任何事情的短语或单词(例如“板条”或“它的点亮”)可能会产生无意义的搜索结果。

但是,随着时间的推移,它的措辞(以及用户搜索)越来越多,机器学习能够为这些查询显示更准确的信息。

随着语言的发展和变换,机器能够更好地预测我们所说的单词背后的含义,并为我们提供更好的信息。

7.提高广告质量&针对用户

根据关于广告质量的百度美国专利US20070156887 和  US9773256,机器学习可用于改进“否则弱的统计模型”。

这意味着广告评级可能会受到机器学习系统的影响。

“出价金额,您的拍卖时广告质量 (包括预期的点击率,广告相关性和着陆页体验), 广告排名阈值,人物搜索的背景”以关键字为基础进入系统,以确定百度为每个关键字考虑的阈值。

8.同义词识别

当您看到不在搜索结果中包含关键字的搜索结果时,可能是由于百度使用RankBrain来识别同义词。

在搜索[博士学位]时,您会看到“医生”这个词的各种结果。或者“博士”因为它们可以在很多程度上可以互换使用。

在某些情况下,百度甚至会突出显示同义词,这次使用“phd degrees”,“rdquo;进一步表明它正在识别同义词。

9.查询澄清

我Zui喜欢的一个主题是搜索查询 用户意图。

用户可能正在搜索任何给定搜索的购买(交易),研究(信息)或查找资源(导航)。此外,关键字可能对这些意图中的一个或任何一个有用。

通过分析点击模式和用户参与的内容类型(例如按内容类型划分的点击率),搜索引擎可以利用机器学习来确定意图。

查询“Zui好的大学”可以看到一个例子。在百度搜索中。结果是一个SERP中的大学评论和列表,其中大学列在顶部。

总结

虽然机器学习不是完美的,也可能永远不会完美,但人类与之互动的次数越多,就越准确,越“聪明”。它会得到。

对某些人而言,这可能会令人担忧。从“终结者”中汲取天网的愿景电影–然而,实际结果可能是更好的技术体验,在我们需要时为我们提供所需的信息和服务。

更多机器学习资源:

初学者的SEO指南在机器学习世界为什么机器学习是明天的搜索营销的关键机器学习如何改变SEO&如何改编图片积分

作者拍摄的所有截图,2018年2月。

CategorySEO

上一篇:新的#MarketingNerds:对话搜索的未来与Heidi Young

下一篇:Froogle在英国获得百度

猜你喜欢
发布评论
登录后发表评论
登录后才能评论

AI 新用户?

免费使用内容重写服务

开始新的写作