美国时间2018年8月20-26日,16级陈道源、邓扬同学与雷凯老师一同参加了在美国新墨西哥洲圣达菲(Santa Fe, New Mexico)举办的COLING 2018 (International Conference on Computational Linguistics) 计算语言学国际会议,将实验室的研究成果在会议上展示并与来自全球的学者共同讨论。

COLING会议是自然语言处理领域的重要国际会议,每两年举办一次,被中国计算机学会(CCF)列为B类会议,专注于展示与计算语言学及自然语言处理基础理论、技术与应用有关的研究,在信息检索领域具有很高的国际影响力(http://coling2018.org/)。

陈道源同学在本次会议上发表了一篇长文“Cooperative Denoising for Distantly Supervised Relation Extraction”,并在会议上做了海报论文展示。

邓扬同学在本次会议上发表了一篇长文“Knowledge as A Bridge: Improving Cross-domain Answer Selection with External Knowledge”,并在会议上做了口头汇报论文展示。

通过参加本次会议,了解了相关领域内最新研究进展,开拓了视野。通过做报告,认识到了语言表达的重要性。通过与参会人员的交流,受到了很多启发。感谢互联网研发中心、雷老师和沈老师的资助。

 

以下是论文列表及简介:

简介:远监督关系抽取极大地减少了从非结构化文本中提取关系事实的人力成本。但是它存在着噪声标签的问题,这会极大损害抽取性能。与此同时,知识图谱中所表达的有用信息仍未在最先进的远监督关系提取方法中得到充分利用。针对这些挑战,我们提出了一种新的协同去噪框架,该框架由两个分别利用文本语料库和知识图谱的基础网络组成,以及一个通过自适应双向知识精馏和以动态集成应对噪声变化实例的协作模块。在真实数据集上的实验结果表明所提出的方法可以有效减少噪声标签,并在最先进的方法上取得实质性的改进。

 

简介:答案选择是一项重要而具有挑战性的任务。在大量标记的训练数据可用的领域已经取得了显著的进展。然而,获得丰富的注释数据是耗时和昂贵的过程,将答案选择模型应用到具有有限标记数据的新领域将会有很大的障碍。在本文中,我们提出了知识感知注意力网络(KAN),一个跨领域答案选择的迁移学习框架,使用知识库作为桥梁,使知识从源领域转移到目标领域。具体地,我们设计了一个知识模块,将基于知识的表示学习集成到答案选择模型中。所学的基于知识的向量表示由源领域和目标领域共享,这不仅利用大量的跨领域数据,而且还受益于正则化效应,从而导致更通用的文本表示来帮助新领域中的任务。为了验证我们的模型的有效性,我们使用SQUAD-T数据集作为源域数据集和三个其他数据集(即yahoo QA,TREC QA和insuranceQA)作为目标域。实验结果表明,KAN具有很强的适用性和通用性,在跨域答案选择方面明显优于目前最好的模型算法。