永州网,内容丰富有趣,生活中的好帮手!
永州网 > 百科 > 正文

Facebook发布开源自然语言处理模型 可用于检索文档回答问题

时间:2024-02-16

这一模型利用了先进的神经网络技术,包括BERT和RoBERTa,以及对抗式训练等,实现了在处理自然语言数据方面的创新突破

友情提示:本文共有 1767 个字,阅读大概需要 4 分钟。

Facebook发布了开源自然语言处理模型,该模型结合了近期最新的技术进展,可以用于检索文档并回答相关问题。这一模型利用了先进的神经网络技术,包括BERT和RoBERTa,以及对抗式训练等,实现了在处理自然语言数据方面的创新突破。通过结合Facebook的社交平台和最新的开放源代码技术,这一模型为用户提供了一个强大的工具,可以有效地从大量文档中寻找答案,并且在各种应用场景下展现出了很高的效果和可用性。这一举措也加速了自然语言处理领域的发展,并为各行各业的应用提供了全新的可能性。

Facebook 和 AI 初创公司 Hugging Face 今天开源了一种 AI 模型检索增强生成(RAG),这是一种自然语言处理模型,可以查找和解释上下文信息来完成一系列任务。

RAG 可以通过通过动态地改变或补充其内部知识,使研究人员能够控制模型掌握的内容,研究人员不必对其计算能力进行再培训就可以获得最先进的结果。

从今天开始,RAG 可以作为 Hugging Face 转换器库的组件提供,与新的数据库集成,提供 RAG 所依赖的索引知识源。

RAG 整合知识的“后期融合”方式

自然语言理解领域的前沿工作已经产生了通用模型,这些模型虽然常常存在缺陷,但是是可以推广的。到目前为止,大多数模型已经应用于无需知识背景就可以生成解决方案的任务中,比如情绪分析这类任务。

相比之下 RAG 使用输入数据从像 Wikipedia 这样的数据库中检索相关的文档。例如,给出一个“地球上第一个哺乳动物是什么时候出现的?”的问题,RAG 可能会提供“哺乳动物”、“地球历史”、“哺乳动物进化”等文献作为上下文与输入连接,然后输入模型以生成输出文本。

根据 Facebook 的说法,RAG 利用了一种“后期融合”的形式来整合检索到的文档中的知识,这意味着它在聚合最终的预测分数之前对文档问题对进行答案预测。当它可以访问包含答案线索的文档时,如果答案不是逐字陈述的,RAG 的性能会进一步提高。在某些情况下,RAG 甚至会生成答案,而这些答案并不包含在检索到的任何文档中。

RAG 擅长知识密集型自然语言问题

Facebook 称,当对诸如包含来自 Google 搜索用户的问题的 NaturalQuestions 之类的开放域数据集进行基准测试时,RAG 显示了在找不到答案的情况下生成正确答案的诀窍。

RAG 还擅长于知识密集型的自然语言问题,Facebook 通过创建受 Jeopardy 启发的问题进行了探索。与其他同类模型相比,RAG 产生的问题更加具体、多样且更加真实。这也许是因为 RAG 能够利用从多个来源获得的不同信息综合出不同的答案的能力。

RAG 的研究经理 Sebastian Riedel 表示,虽然 RAG 在 Facebook 的生产中没有使用,但其背后的团队正在积极迭代以减少潜在的偏见。他们将培训数据集中的文档限制在 Wikipedia 上,他们认为 Wikipedia 比当今许多语言模型的网络爬虫更安全。

RAG 的最大优势:灵活性

研究人员正在探索 RAG 的一个版本,这个版本可以最大程度地降低剩余风险,以便达到一贯的输出安全的程度。他们正在研究如何扩展 RAG,使其多通道化,并使其同时使用多个知识源进行操作。

Sebastian Riedel 说:“RAG 的真正优势在于它的灵活性,要改变一个预先训练过的语言模型所知道的东西,需要用新的文档对整个模型进行再训练。通过 RAG,我们可以通过交换用于知识检索的文档来控制它所知道的内容。我们在带有 RAG 的 NaturalQuestions,CuratedTrec 和 WebQuestions 上获得了非常出色的结果,表明可以用生成的而不是提取的读取器来实现最新的机器读取性能。”

Facebook 认为 RAG 具有广阔的潜力,它断言这将使研究人员能够仅用几行代码就可以为知识密集型任务部署解决方案。

Facebook 方面称,“RAG 允许 NLP 模型绕过再培训步骤,访问和提取最新的信息,然后使用生成器输出结果。我们预见未来对知识密集型任务的研究潜力,这些任务就像今天的情绪分析这样的轻量级知识任务一样简单易懂。”

技术编辑:芒果果丨发自 思否编辑部

公众号:SegmentFault

收集不易,本文《Facebook发布开源自然语言处理模型 可用于检索文档回答问题》知识如果对你有帮助,请点赞收藏并留下你的评论。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
显示评论内容(3)
  1. 做大娱乐家2024-02-16 11:27做大娱乐家[陕西省网友]122.201.55.114
    Facebook的开源举措非常给力,希望这项模型能够帮助更多的人解决实际问题。
    顶0踩0
  2. 飞泳的鱼2024-02-16 11:09飞泳的鱼[山东省网友]43.251.195.201
    这将极大地促进文档检索的效率,期待它能够在实际应用中展现出强大的性能。
    顶0踩0
  3. 意守丹田2024-02-16 10:52意守丹田[云南省网友]203.20.40.129
    太棒了,开源模型将使得更多人能够使用这项技术,加快了自然语言处理的发展。
    顶8踩0
相关阅读
Java面试笔试题大全

Java面试笔试题大全

下面是小编收集整理的Java面试笔试题,希望对您有所帮助!Java面试笔试题1 什么是线程?线程是操作系统能够进行运算调度的最小单位,它被包含在进程之中,是进程中的实际运作单位

2024-01-06 #知识

启蒙未来:探索儿童编程教育之美 + 培养未来创造者 从儿童编程开始

启蒙未来:探索儿童编程教育之美 + 培养未来创造者 从儿童编程开始

儿童编程教育为孩子们提供了一个拓展思维、培养创造力、锻炼逻辑推理能力的绝佳平台

2024-01-26 #头条

Facebook发布RoBERTa新模型 继BERT之后再度称王并碾压XLNet 统治三大排行榜

Facebook发布RoBERTa新模型 继BERT之后再度称王并碾压XLNet 统治三大排行榜

RoBERTa模型在多项自然语言处理任务上取得了惊人的成绩,表现出色的性能让业内人士纷纷赞叹不已

2024-02-09 #生活

Python聚类算法全面操作指南:10种算法完整示例

Python聚类算法全面操作指南:10种算法完整示例

在这篇文章中,读者将可以了解到各种Python聚类算法的实际操作步骤,同时学习到如何使用这些算法来处理实际数据集

2024-02-07 #推荐

如何使用Excel加载数据而不打开数据源文档

如何使用Excel加载数据而不打开数据源文档

通常我们更新表报最直观的办法是手动打开数据源文档,把文档的内容复制到报表模板的数据源表进行覆盖

2024-01-23 #知识

将Word文档转换成壁纸的简易方法

将Word文档转换成壁纸的简易方法

通过将Word文档另存为图片格式如JPEG或PNG,你就可以将其设为计算机桌面壁纸了

2024-01-28 #百科

金山办公再曝隐私门:拿用户上传文档用于AI训练!

金山办公再曝隐私门:拿用户上传文档用于AI训练!

此前WPS隐私政策中提到的我们将对您主动上传的文档材料,在采取脱敏处理后作为AI训练的基础材料使用,被质疑涉及用户隐私问题

2023-12-17 #推荐

探寻MMT代码的含义:解析其背后的意义和应用领域

探寻MMT代码的含义:解析其背后的意义和应用领域

在软件开发中,MMT代码是一种将数据模型、用户界面和模板结合起来的设计模式,旨在使开发人员能够更有效地管理和组织代码

2024-01-28 #知识

探秘Java与安全标准的神秘之旅

探秘Java与安全标准的神秘之旅

本次活动将聚焦于Java在安全领域的最新发展,并深入探讨其与安全标准之间的密切联系

2024-02-01 #头条