开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 无监督re-rankerImproving Passage Retrieval with Zero-Shot Question Generation -> 正文阅读

[人工智能]无监督re-rankerImproving Passage Retrieval with Zero-Shot Question Generation

论文：Improving Passage Retrieval with Zero-Shot Question Generation

作者：Devendra Singh Sachan1,2?, Mike Lewis3, Mandar Joshi4, Armen Aghajanyan3, Wen-tau Yih3, Joelle Pineau1,2,3, Luke Zettlemoyer3,4 1McGill University; 2Mila - Quebec AI Institute 3Meta AI; 4University of Washington

源码：GitHub - DevSinghSachan/unsupervised-passage-reranking: Code and datasets for the paper "Improving Passage Retrieval with Zero-Shot Question Generation"

任务：re-ranking模型，改善open QA中的passage retrieval阶段

方法：使用预训练模型GPT,T5使用zero-shot手段，在候选段落后添加prompt: “Passage: { pi }.?Please write a question based on this passage”,从而基于段落生成问题，并以真正的问题作为模型输入，计算基于段落生成问题token的平均概率。以此概率作为该段落的排序位置。如图所示

优势：该方法可以在任何检索方法（例如基于神经网络或基于关键字）的基础上应用，不需要任何特定于域任务的训练（因此，预计将更好地推广到不同数据中），并在query和passage之间提供丰富的cross-attention（它必须解释问题中的每个令牌）

评估效果：在无监督检索模型方面提高了6％-18％，在强有力的监督模型上就TOP-20通道检索准确性而言最多可提高12％。我们将我们的re-ranker模型简单的加在以往的模型上在full open domain QA上获得了SOTA

以下是原文

1 introduction

模型思路：“introduce a re-ranker based on zero-shot question generation with a pre-trained language model. Our re-ranker, which we call Unsupervised Passage Re-ranker (UPR), re-scores the retrieved passages by computing the likelihood of the input question conditioned on a retrieved passage”

这一部分都在夸这个模型与其他模型相比多么多么好！

在某种程度上，UPR模型受到传统查询评分模型-基于计数语言模型的启发。但我们将语言模型替换为预训练语言模型。现有的很多关于re-ranker工作都在question-passage对上微调预训练模型以获得更好的相关标签，有时也会联合生成问题任务和生成标签任务。我们的模型UPR使用现成的预训练模型而不需要任何训练数据或者微调，但是仍然获得了不错的效果，可以跨数据集、跨预训练模型、跨检索器。

据我们所知，这是第一项表明完全无监督的pippline（由retriever和re-ranker组成）可以极大地超过诸如DPR之类的密集检索模型。随着语言模型继续迅速改善，UPR的性能可能会随着时间的推移而看到相应的增长。 UPR不需要带注释的数据，并且仅使用通用的预训练模型，这意味着很容易应用于广泛的检索问题。听起来好牛皮！！