最后更新时间:2015-04-19

所长:黄铁军  教授

研究所简介
  人类70%的信息是通过视觉获取的,无处不在的摄像头和数码相机正在高密度、全天候地实时采集全球信息,互联网70%以上的流量是视频,全球大数据中图像视频占一半以上,图像和视频已经成为信息科学的极其重要的一类研究对象。
  数字媒体研究所成立于2006年,主要研究图像和视频的高效压缩、智能分析和识别相关的基础理论、创新算法以及芯片和系统实现。依托数字媒体所的数字视频编解码技术国家工程实验室是北京大学第一个国家工程实验室,所牵头制定的AVS国家标准已经在高清电视等领域得到广泛应用。实验室和上海交通大学共建的“未来媒体网络协同创新中心”已经于2014年得到国家认定,是北京大学第二个获得“2011计划”支持的单位。
  数字媒体研究所承担国家973、863、国家自然科学基金重大和重点项目等国家级项目50多项;申请发明专利150多项,获得授权专利近60项、软件著作权11项;牵头制定国家标准10多项、IEEE标准5项、ISO/IEC标准5项;每年在国际重要期刊和会议发表论文100多篇。近年来,两次荣获国家科技进步二等奖,还获得2009年度中国高等学校十大科技进展、第十七届中国科协求是杰出青年奖成果转化奖等多个奖项。
  数字媒体研究所现有固定教职工11人。学术带头人高文院士,现任国家自然科学基金委员会副主任。全所正高级职称者(含“百人计划”研究员)7人,其中国家杰出青年科学基金获得者和优秀青年基金获得者各1人。此外,聘请外籍客座教授4人,博士后6人,博士生(含联合培养)35人、硕士生(含联合培养)55人。

主要研究方向
■ 视频编码与处理
  视频编码及处理算法创新,针对高清/超高清视频、立体电视、移动视频、监控视频、分布式传感器网络等应用,研究高效的视频编码及处理算法,在现有视频编码研究的基础上,研究新型高效的视频编码框架,实现编码效率的突破性提高,推动下一代视频编码标准的制定,并将相关技术产业化,实现产学研高效结合。
■ 媒体大数据处理与分析
  针对大规模图像视频数据难以有效利用的问题,围绕“分析、编码和识别相结合”这一特色,突破图像视频大数据的高效压缩、特征表达、对象识别、行为分析等瓶颈问题,研究监控视频超高效表达理论和压缩方法、基于时空关联分析的监控视频大数据表示理论与方法、面向视频分析的深度学习等,实现大规模视觉对象的识别、重检、追踪、行为分析,以及事件检测与异常发现,并探索其在智慧城市、网络媒体等典型领域的应用关键技术。
■ 音视频SoC算法与结构
  致力于音视频编解码和图形图像处理算法及其结构创新。面向AVS下一代标准和国际下一代标准,研究编码算法的硬件实现结构,针对算法硬件实现指标的确认和技术评估,进行新标准硬件原型验证。联合算法提出单位,通过合作及交叉验证的方式,制定技术先进而适合芯片制造的编码算法;突破目前先有算法再有结构的研究开发模式,面向不同产业应用,同步提出针对新算法的结构,成为音视频编解码SoC领域核心结构研究成果产出中心。
■ 计算机视觉与数字艺术
  计算机视觉,又称“图像理解”,是人工智能领域的重要分支,是研究从图像和图像集合中提取语意信息的理论与算法的应用科学。它是一门结合信息科学、数理科学、心理学和神经科学的交叉科学。计算机视觉是信息科学领域的一个极具挑战性的课题,被誉为未来10年的十大热点问题之一,其研究成果可以被广泛应用于工业自动化、机器人、安全监控、医疗健康、多媒体、娱乐、航空航天等各个领域。
■ 移动视觉搜索
  面向图像视频搜索、移动增强现实等新型交互需求,研究紧凑视觉特征的高效抽取与表示、视觉特征编码和大规模图像索引模型,推进图像识别技术在移动互联网、安防、图像大数据、智能电视、智能交通、智能家居等领域的应用,已经在互联网公司得到规模应用,正在形成包括高水平学术论文、发明专利、国际标准以及产业化应用的系统性成果。

联系方式
  地址:北京大学理科2号楼2615室
  电话:86-10-6275 8116
  传真:86-10-6275 1638
  http://idm.pku.edu.cn

 


 

北京大学信息科学技术学院版权所有 Copyright © 2010-2016