首页 - 每日一评 - 文章正文

百度宣布AI的进步

时间:2019-07-23 12:25:07 作者:黑曼巴 分类:每日一评 浏览:275

百度最近发布了两种与自然语言处理相关的新算法。百度的目标是将搜索转换为能够理解问题并像人类一样回答问题的计算机。只是因为百度发布研究…值得注意的是,百度对研究论文和专利的模板立场可以这样解释,“只是因为百度发表研究论文或专利并不意味着百度实际上正在使用它。”这里是百度如何解释它的错误:“直觉是如果句子具有相似的响应分布,则语义在语义上是相似的。

 

百度Zui近发布了两种与自然语言处理相关的新算法。其中一人声称了解如何回答问题的新技术水平。百度的目标是将搜索转换为能够理解问题并像人类一样回答问题的计算机。百度本身说这些算法只是开始。

只是因为百度发布研究…

值得注意的是,百度对研究论文和专利的模板立场可以这样解释,“只是因为百度发表研究论文或专利并不意味着百度实际上正在使用它。”

通过答案理解问题

第一个算法标题为“从对话中学习语义文本相似度”。该算法通过研究响应来学习如何理解问题,以此来理解问题的真正含义。这里是百度如何解释它的错误:

“直觉是如果句子具有相似的响应分布,则语义在语义上是相似的。例如,“你多大了?””和“ldquo;你的年龄是多少?”都是关于年龄的问题,可以通过类似的回答来回答,例如“我20岁””相比之下,虽然“你好吗?”并且“你多大了?””包含几乎相同的单词,它们具有非常不同的含义并导致不同的反应。“

该算法使用Reddit和其他来源对会话细微差别进行训练,以便能够从实际对话中理解问题的含义。

它更容易理解长问题之间的相似之处。但对于简短的问题,它变得更难。该研究声称能够训练机器以理解短问题之间的差异。

以下是研究人员得出的结论:

“在本文中,我们提出了一个响应预测模型,它从对话中学习句子编码器。我们表明从输入 - 响应对中学习的编码器在句子级语义文本相似性上表现良好。从Reddit对话中学到的基本会话模型与公共STS任务中现有的句子级编码器相比具有竞争力。在Reddit和SNLI分类上训练的多任务模型在STS Benchmark任务上实现了基于句子编码的模型的Zui新技术。”

该算法如何使用?

Nuance:早期的一篇研究论文“测量句子级别相似性”(未由百度发表)对相关主题提供了如何在现实世界中应用类似算法的描述.:

“句子相似性度量在与文本相关的研究和应用领域变得越来越重要,例如文本挖掘,信息提取,自动问答和hellip;”

百度的研究论文没有说明如何使用这种算法。然而,关于这两种算法的百度的AI博客文章,语义文本相似性的进展指出,这些算法允许他们使用少至100个标记的示例来构建有用的文本分类器。这意味着他们可以用Zui少的数据而不是之前使用的数百万和数十亿来理解更多数据。

Bill Slawski评论

Nuance:我向GoFishDigital的百度专利专家Bill Slawski询问了这个算法,这里是他所说的:

我在帖子中写了关于百度的延续专利, 百度的相关问题专利或者‘人们也问了’问题。这个更新的专利的有趣之处在于它引入了“问题图”的概念。对于百度可能收集答案的问题。

百度告诉我们,他们将创建自然语言问题的数据存储,并在至少一个专利:自然语言搜索结果中回答意图查询。 通过不同地识别问题(可能有一些冗余),它增加了创建更大且可能更好的问题图的能力。

为什么这些算法很重要

百度的目标是创建一个类似于星际迷航计算机的AI。星际迷航计算机是百度的理想选择。至少从2013年开始,这可能是更早的目标。 Slate在2013年发表了一篇文章,副标题是,百度有一个高耸的痴迷:它想建立星际迷航计算机。这是来自那篇文章:的关键引文

“几周前,我正在和百度的搜索产品管理总监Tamar Yehoshua聊天。 “是否有一个关于搜索从现在起几年后会如何看待的路线图?”我问她。 “我们的愿景是星际迷航计算机,“rdquo;她笑着回击。 “你可以与它交谈—它了解你,它可以与你交谈。””

星际迷航计算机与百度语音助手之间的连接非常接近,以至于百度语音项目Zui初是以扮演星际迷航计算机声音的女演员命名的。

在星际迷航中让相信世界的演员说出触发词,“电脑”。并且计算机监听并提供答案。在现实世界中,我们会说出触发词“Ok百度”。和百度的语音助手答案。

这些算法可以看作是对百度在“星际迷航”中成为计算机的目标的贡献。但除了问题回答能力之外,这些技术还有许多其他用途。

星际迷航范式如何与百度语音助手相似

在星际迷航世界中,与计算机的接口完全是说出一个触发词,然后提出一个问题。一个典型的场景就像这个:

在星际迷航世界:

KIRK:电脑。 <&ndash的; (触发词) 这是詹姆斯T.柯克海军上将请求安全访问。

电脑。破坏序列一,代码一,一个A.

COMPUTER VOICE: Destruct Sequence已激活。

在真实世界:

你: Ok百度<– (触发词) 什么是在马德里以实惠的价格吃饭的好餐厅?

百度 Voice Asssistant:马德里Zui便宜的吃东西是…

AI第一范式中是否单独使用百度?

没有。技术公司的公开秘密是,人们首先要成为人工智能的竞赛。百度 的首席运营官齐力在他的声明中引用了成为人工智能的竞赛,宣布他踩下了:

“”我很荣幸能够参与百度向AI-first公司的过渡,“rdquo;陆说。微软和百度等人也试图重塑AI。“

在助手范式中重塑搜索一直是百度的长期目标,而且并不孤单。据报道,甚至Zillow也正在从搜索过渡到AI助手范式。 MashableZui近的一篇文章引用了Zilllow的AI:

“目前,该网站正在经历Wacksman所描述的“从搜索框到助理的演变”。”这些想法是将Zillow从一个简单的房地产搜索引擎转变为一个能够理解你的工具。”

外卖:网站发布者如何适应AI助手范例

据报道,这些技术处于起步阶段。

根据百度:

“我们相信我们在这里展示的只是一个开始,并且仍有重要的研究问题需要解决,例如将技术扩展到更多语言和hellip;”

百度还指出,这些技术无法理解段落和文档级别的文本。这些是他们过渡到AI助手的下一个挑战。

跟上这些发展很重要,因为在某些时候会有更多的迹象表明出版商和商家适合这个新世界。这意味着要关注百度在开发者页面中概述的Schema.org结构化数据要求的新发展。

阅读他们的AI博客上的百度公告, 语义文本相似度的进展

在此处阅读有关语音搜索的更多信息。

Shutterstock图片,作者修改

CategoryNewsSEO

上一篇:Opera浏览器 - Firefox不是唯一的IE替代

下一篇:如何识别消除关键字同化以提升您的搜索引擎优化

猜你喜欢
发布评论
登录后发表评论
登录后才能评论

AI 新用户?

免费使用内容重写服务

开始新的写作