CICLing2016参会报告
信息科学技术学院2013级本科生杨至轩
 
4月4日至10日,在信息科学技术学院的支持下,我与阮翀学长前往土耳其科尼亚参加第17届International Conference on Intelligent Text Processing and Computational Linguistics会议,展示我们在计算语言所胡俊峰老师指导下完成的论文:Optimize Hierarchical Softmax with Similarity Knowledge。
科尼亚是土耳其中部的一座历史文化名城,曾是历史上数个国家的首都。虽然近期土耳其国内安全局势不稳,伊斯坦布尔和首都安卡拉都遭到炸弹袭击,但由于科尼亚是库尔德人文化的发源地之一,我们预测科尼亚的局势是比较安全的,所以还是放心地前往参会。
本次会议安排4天学术活动及3天文化活动。4天的学术活动除了常规的报告之外,还邀请了4位学界知名人物作为keynote speaker进行特殊报告:
·       Facebook人工智能研究所的Thomas Mikolov(著名的word2vec 的作者)报告了他在循环神经网络的结构上新的创新想法,并阐述了他心目中未来走向人工智能的路线图。
·       阿姆斯特丹大学的PiekVossen教授报告了他们旨在进行从大规模新闻流中自动建设知识图谱的NewsReader项目。
·       剑桥大学的Simone Teufel教授报告了她在text summarization上的进展和看法。
·       香港科技大学的Pascale Fung教授报告了她的研究组在旨在能理解情感的智能问答机器人Zara上的进展。
总结这四位keynote speaker的报告可以看出,他们的工作都是带领整个团队进行雄心勃勃的、目的直指人工智能的大项目。这和我在国内看到的研究都几乎是不成系统的对某个具体小问题进行研究是截然不同的。我想我们在对具体问题进行深入探索时,也应该保持这样的长远眼光和远大志向。
本次会议共接收了约212篇论文,都受邀在会议上进行报告。总结来说,本次会议的论文可粗略分为两类:
·       由语言学专业的作者完成的论文,其特点是他们根据自己对某门语言的专业知识,提出对自然语言处理方法的一些改进(比如为俄语设计一套新的分类特征以进行指代识别),或者是将自然语言处理方法用作工具,报告他们在语言学上的发现和探索(比如探索葡萄牙语的诗歌韵律)。
·       由计算机领域的作者完成的论文,其特点是他们面对某个自然语言处理任务或算法,从算法自身的角度提出改进。我们的论文就属于此类。
由于自己的计算机背景,虽然自己在计算语言学实验室做了接近两年的研究,但平时却极少关注语言本身,只是单纯从算法和数学的角度来考虑问题。本次会议听到众多语言学专业的报告提醒了我这是不应该的,语言的结构是可以被人类理解和研究的,因此要想解决好语言上的问题,一定要理解语言自身。
本次会议除了学术上的收获之外,我还有幸与几位来自世界各国的朋友结成友谊。最后,感谢Thomas Mikolov在会议上对我们的研究提出宝贵的建议,感谢Pascale Fung教授在回国的旅途中给了我极大的照顾并给了我关于研究与个人发展的珍贵建议,感谢胡俊峰老师对本篇文章的指导,以及信息科学技术学院对我本次出访的支持!
 
        



 

 

北京大学信息科学技术学院版权所有 Copyright © 2010-2016