COLING 2018, the 27th International Conference on Computational Linguistics将于2018年8月20日至26日在美国圣达菲举行。COLING是自然语言处理领域的重要国际会议,每两年举办一次(http://coling2018.org/)。

16级陈道源、邓扬两名同学在雷凯、沈颖老师指导下在本次会议中各被录用了一篇长文,下面是论文列表与简介:

  • Cooperative Denoising for Distantly Supervised Relation Extraction
  • 作者:Kai Lei*, Daoyuan Chen*, Yaliang Li, Nan Du, Min Yang, Wei Fan, Ying Shen. (* indicates equal contribution)

简介:远监督关系抽取极大地减少了从非结构化文本中提取关系事实的人力成本。但是它存在着噪声标签的问题,这会极大损害抽取性能。与此同时,知识图谱中所表达的有用信息仍未在最先进的远监督关系提取方法中得到充分利用。针对这些挑战,我们提出了一种新的协同去噪框架,该框架由两个分别利用文本语料库和知识图谱的基础网络组成,以及一个通过自适应双向知识精馏和以动态集成应对噪声变化实例的协作模块。在真实数据集上的实验结果表明所提出的方法可以有效减少噪声标签,并在最先进的方法上取得实质性的改进。

 

  • Knowledge as A Bridge: Improving Cross-domain Answer Selection with External Knowledge
  • 作者:Yang Deng, Ying Shen, Min Yang, Yaliang Li, Nan Du, Wei Fan, Kai Lei.

简介:答案选择是一项重要而具有挑战性的任务。在大量标记的训练数据可用的领域已经取得了显著的进展。然而,获得丰富的注释数据是耗时和昂贵的过程,将答案选择模型应用到具有有限标记数据的新领域将会有很大的障碍。在本文中,我们提出了知识感知注意力网络(KAN),一个跨领域答案选择的迁移学习框架,使用知识库作为桥梁,使知识从源领域转移到目标领域。具体地,我们设计了一个知识模块,将基于知识的表示学习集成到答案选择模型中。所学的基于知识的向量表示由源领域和目标领域共享,这不仅利用大量的跨领域数据,而且还受益于正则化效应,从而导致更通用的文本表示来帮助新领域中的任务。为了验证我们的模型的有效性,我们使用SQUAD-T数据集作为源域数据集和三个其他数据集(即yahoo QA,TREC QA和insuranceQA)作为目标域。实验结果表明,KAN具有很强的适用性和通用性,在跨域答案选择方面明显优于目前最好的模型算法。