2018年10月19日—21日,“第十七届中国计算语言学大会”(The Seventeenth China National Conference on Computational Linguistics, CCL 2018)在长沙理工大学举行。本次大会组织了多项技术评测任务,为研究者提供测试自然语言处理相关技术、算法和系统的平台,吸引了全国各大高校学校以及企业参加。我院研究生戚昆逊、刘汉锋、曹子旋三位同学在本次会议的评测任务“中文文本蕴含识别”大赛中获得了全国第4名、二等奖的好成绩。
文本蕴含关系是自然语言中广泛存在的语义关系。文本蕴含关系识别涉及到词汇语义、语义推理、社会经验和常识等多个方面问题,是自然语言处理领域的一项基础性研究,具有丰富的应用场景。本次评测将中文文本蕴含识别看作一个分类问题:每个输入样本为2个句子,分别是“前提句Premise”和“假设句Hypothesis”,要求参评系统判断两者之间的蕴含类别,包括:蕴含(E, entailment):P能合理推理得到H,反之不一定;矛盾(C,contradiction):P和H不能同时成立;无关(N, neutral): P和H不存在必然的联系。大会组织方提供了约8-10万人工编辑句对用于训练和评测。我院研究生队伍在本次参赛的数十只队伍中脱颖而出,获得评测二等奖。