计算机科学与技术专业2013级本科生何杭峰 

        今年二月份,我在学院的资助下参加于美国旧金山举行的AAAI Conference on Artificial Intelligence (AAAI) 2017会议,并在会议中为我的论文《A Unified Model for Cross-Domain and Semi-Supervised Named Entity Recognition in Chinese Social Media》作报告。

        AAAI-2017是由美国人工智能协会(American Association for Artificial Intelligence) 主办的一个人工智能学术会议。本届大会包含研讨会(workshop)、教程(tutorial)、博士生论坛(doctoral consortium)、技术项目(technical program)。

        我的工作是针对社交媒体(微博)语料的命名实体识别任务。我需要识别出句子中的人名(person)、组织名(organization)、地界名(geo-political entity)和地点名(location)。由于微博语料存在大量的噪声而且标注语料非常有限,但是我们有大量的非标注语料和足够的新闻媒体语料。所以我们提出了一个统一的模型来利用非标注语料和新闻媒体语料。我们的模型包括两个部分,一个是半监督学习(semi-supervised learning)模块,另一个是跨领域学习(cross-domain learning)模块。半监督学习模块通过自信度(confidence)来动态调整非标注语料中每个句子的学习率;跨领域学习模块通过相似度(similarity)来静态调整新闻媒体语料中每个句子的学习率。我们采用深度学习框架BiLSTM-MMNN来作为我们的基本模型。

        这是我第一次在国际会议中作报告。我做的报告分为两部分,一部分是一分钟的spotlight,另一部分是poster。在spotlight中,我做了充分的准备,报告相对顺畅;在poster中我的工作吸引了不少学者的关注并和他们进行了交流。     

        在会议中,我还与全球各地的人工智能领域的研究者们进行了交流。他们不仅对我的工作提出了相当好的建议,而且交流了他们的工作,让我受益良多。

        最后感谢北京大学信息学院的大力资助,让我深感学院对本科生科研的重视。

 


 

北京大学信息科学技术学院版权所有 Copyright © 2010-2016