最后更新时间:2015-04-19

所长:王厚峰  教授

研究所简介
  计算语言学研究所成立于1986年。自成立以来,一直保持文理结合、多学科(计算机科学、语言学、信息技术、数学与统计学)交叉的学术风格和研究特色,已形成系列化的研究方向和梯队形的人才队伍。
  研究所致力于计算语言学理论、语言信息处理的基础资源、应用技术三个层面的研究,以语言信息处理的理论和模型研究为基础,以语言资源、知识库及其平台建设为支撑,以大规模文本内容计算和跨语言信息处理为应用目标开展研究,取得了以综合型语言知识库(CLKB)为代表的多项研究成果。规范和论著被广泛引用,2篇全国优秀博士学位论文在此产生。这些成果作为语言信息处理技术与产业的基础设施,为机器翻译、智能搜索、语音识别、信息提取、人机会话等多方面应用提供规范化的语言知识和核心基础软件。特别是CLKB免费用户数以万计,已在国内外学术界和产业界产生了广泛的影响并取得显著的效益,免费用户数以万计签约用户遍布美国、日本、德国、法国、俄罗斯、英国、韩国、瑞典、新加坡,中国大陆、台湾、香港,以及苹果、谷歌、IBM、英特尔、微软、科罗拉多大学、伯明翰大学、东京大学、香港大学、台湾“中央研究院”等知名企业、高校和研究机构。CLKB近期所获奖励包括2011年国家科学技术进步二等奖、2010年中国电子学会电子信息科学技术奖一等奖,2007年教育部科技进步一等奖等。
  目前,研究所有在职研究人员12名,其中教授2名、副教授6名;另有博士后1名,博士生和硕士生30多位。

主要研究方向
■ 中文计算的基础理论与模型
  以中文为核心,以语言的形式化表示、计算模型等为研究内容,从语言、认知和计算三个方面展开基础性研究,为语言资源、知识库的构建、语言的分析技术提供理论基础
■ 大规模多层次语言知识库构建的方法
  在中文计算基础理论与模型的支撑下,针对多层次语言知识库的建设从方法、规范到实现展开系统性的研究;为海量文本的动态监控、多语言机器翻译和国家语言资源的整理与语音数据库建设等提供服务
■ 海量文本内容处理技术
  在中文计算基础理论与模型以及多层次语言知识库的支撑下,研究海量文本数据的有效组织形式与文本内容表示形式以及在此基础上相关算法,为不同应用,特别是为大规模的网络异构文本信息处理提供关键技术
■ 多语言信息处理和机器翻译
  以汉语为中心,依托于中文计算基础理论与模型以及多层次语言知识库构建方法,重点研究汉语与英语、日语、韩语等语言之间的规律和多语言之间翻译的方法和技术,为跨语言信息检索和机器翻译提供技术保障

联系方式

  地址:北京大学理科1号楼1445房间
  电话:86-10-62753081-106
  传真:86-10-62753081-101
  http://icl.pku.edu.cn

 


 

北京大学信息科学技术学院版权所有 Copyright © 2010-2016