首页 - 每日一评 - 文章正文

百度的新算法从您的内容创建原始文章

时间:2019-07-23 17:20:29 作者:黑曼巴 分类:每日一评 浏览:330

通过创建原始内容,百度的新算法可以回答用户的问题,而无需将其发送到其他网页。这类似于用于生成特色代码段的算法。这些被称为“提取摘要””因为他们从网页中提取内容。这种方法基于网络上的信息创建一个新文档,创建百度自己的维基百科版本。

 

百度发布了一项新算法的研究,该算法可以带走你和你的竞争对手的网页并生成“连贯”的网页。文章。通过创建原始内容,百度的新算法可以回答用户的问题,而无需将其发送到其他网页。

释义算法如何运作?

百度的新算法的工作原理是使用一种“提取”算法来总结网页内容。然后你的内容会丢掉不相关的部分。这类似于用于生成特色代码段的算法。

这些被称为“提取摘要””因为他们从网页中提取内容。 Extractive Summaries就像将原始文本缩减为Zui重要的句子一样。

然后,该算法使用另一种称为抽象概要的算法。抽象摘要是一种释义形式。

人为释义(抽象摘要)的缺点是几乎三分之一的摘要包含虚假事实。

以下是有关提取摘要的更多信息, 忠实于原始:事实感知神经抽象摘要

百度的新研究发现了一种方法可以加入两种方法中的Zui佳方法。他们使用“提取摘要””从网络文档中提取重要事实,然后应用“抽象”和“抽象”。解释内容的方法。这种方法基于网络上的信息创建一个新文档,创建百度自己的维基百科版本。

百度的新算法在题为“通过汇总长序列生成维基百科”的研究论文中进行了描述

根据百度:

“我们表明,生成英文维基百科文章可以作为源文档的多文档摘要进行处理。“

这意味着百度可以从多个网页中收集有关主题的信息。

然后是:

“我们使用提取摘要粗略地识别显着信息…”

这意味着他们使用将网页缩减为Zui重要的句子,以便提取意义。

下一步是使用:

“…一个神经抽象模型来生成文章。”

这意味着百度将采用提取的含义并使用“neureal abstractive model”将这些事实(从许多网站中提取)总结为自然的句子和段落以创建文章。

百度说结果文章可以通过人工检查。

“我们证明这个模型可以产生流畅,连贯的多句段落…当给出参考文件时,我们表明它可以提取相关的事实信息,如&hellip所示;人类评价。”

精选片段是第一步

精选片段是Extractive Summarization的一个示例。这是一个整个网页,然后抛出不相关的单词和短语,并保留几个句子来回答问题的过程。

有一个相关的百度算法,总结了 百度语音的网页, 通过LSTM删除的句子压缩。您可以在我的文章: 百度语音搜索摘要算法中以简单的英语阅读它。

是百度的算法汇总你的内容吗?

该算法是关于总结“多文档”的。并总结他们。这可以应用于书籍。这可以应用于信息的开源数据库。但是,这也可以应用于任何公共网页,包括您的内容。

该研究使用维基百科主题作为搜索查询和搜索引擎结果作为提取摘要 的来源,然后将其转述为创建全新文章。该算法还通过仅使用维基百科引用的参考文献生成第二组文章进行了并排测试。

本文以这种方式描述了这个过程:

“参考文件是从搜索引擎获得的,维基百科主题用作类似于我们的搜索引擎参考的查询。但是,我们还会显示仅在维基百科文章的参考部分中找到的文档的结果。”

翻译成普通英语是他们使用维基百科主题作为搜索查询和搜索引擎结果页面(SERP),您的内容,作为生成全新网页的源材料,可用于回答问题而无需显示链接到您的网站。

该研究报告没有说明百度是否会显示自己内容创建的内容。关于百度是否会添加到源材料的链接,无论是作为SERP的一部分还是作为脚注链接,都没有讨论。

百度不再需要显示您的内容

研究论文的结论是他们的实验是成功的。百度可以通过总结您的内容来生成自己的内容,从而回答用户的问题,而不必通过点击访问您的网站来解决问题。

以下是百度的研究论文中提到的:

“我们已经证明,生成维基百科可以作为一个多文档摘要问题来解决;”

那个短语“多文档”指任何免费提供的文件,包括您的网页和竞争对手的网页。

这就是研究论文所说的算法成功率为:

“这个模型在长序列上明显优于传统的编码器 - 解码器架构,允许我们对许多参考文档进行调整,并生成连贯且信息丰富的维基百科文章。”

这意味着百度能够使用许多网页来生成“连贯”的内容。和“信息””文章。这是一个相当令人不安的事件。

百度将此算法与Voice Assistant一起使用吗?

当百度开始从您的内容生成自己的内容时,还没有任何消息。然而,这样的算法非常适合语音助理搜索。语音助理搜索是通过家中或车内的移动电话或物联网(IoT)设备进行的搜索。

因此,一个人可以向百度 Voice Assistant询问有关电影明星的问题,并且百度的语音助手可以用句子回答您的问题,就像您问一个真人一样。

百度一直渴望像星际迷航中的语音助理计算机一样。早在2014年,据报道,之前版本的语音搜索代号是扮演星际迷航计算机声音的女演员。 像这样的算法非常适合语音助手设置。

阅读此处的研究, 通过总结长序列生成维基百科。 在这些研究论文中阅读更多关于提取和抽象概括的信息.:

使用深度学习2017的摘要摘要对原始文本有用:事实感知神经抽象摘要  2018百度语音搜索摘要Algo 作者Roger Montti

图像由Shutterstock,修改作者

CategoryNewsSEO

上一篇:何时( When Not)写元描述

下一篇:苹果iTunes遭索尼,Napster和雅虎威胁

猜你喜欢
发布评论
登录后发表评论
登录后才能评论

AI 新用户?

免费使用内容重写服务

开始新的写作