谨以此博客作为复习期间的记录
流水线式抽取(Pipline): 把关系抽取的任务分为两个步骤,首先进行实体识别,再抽取出两个实体的关系。
联合抽取(Joint Extraction): 端到端,同时进行实体和关系的抽取。流水线式抽取会导致误差在各流程中传递和累加,而联合抽取的方式则实现难度更大
流水线式抽取和新标注策略的实体关系联合抽取都可以和序列标注结合起来,
Document Retriever 和 Document Reader 分两步
论文中提出的模型结构主要包括两个阶段:信息检索(IR)和阅读理解(RC),以及两种答案重排方法:基于证据强度的重排和基于证据覆盖的重排。以下是这些模型组件的详细介绍:
这种结合信息检索、阅读理解和多种重排策略的方法充分利用了多个段落的证据,有效地提高了开放领域问答系统的性能。
Lee et al., Latent Retrieval for Weakly Supervised Open Domain Question Answering, ACL,2019
Petroni et al. Language Models as Knowledge Bases? ACL, 2019
将问题转为一个序列生成问题
统一输入输出的标准
A Unified Generative Framework for Aspect-Based Sentiment Analysis