讲师
清华大学
电子工程系教授、博导
窦维蓓,Ph.D、清华大学电子工程系教授、博导。现任中国“数字音视频编解码技术标准工作组”( AVS)工作组音频专题组组长,IEEE SA AVS (1857) 标准工作组IEEE 1857.8 Subgroup chair。主持完成了AVS2音频标准GB/T 33475.3《信息技术 高效多媒体编码 第3部分:音频》的编制工作。主持编写了IEEE Std. 1857.2TM-2013 “IEEE Standard for Advanced Audio Coding”。研究多模态数据处理和信息融合系统,应用在人脑生理信息挖掘和音频信号处理等领域。负责或参加多项国家自然基金面上/重点项目和科技部项目,负责完成了十余项企业合作和国际合作项目。发表学术论文百余篇,获授权发明专利19项,登记软件著作权1项。正在研究基于多模态神经影像信息融合的神经康复评估问题。
演讲:音频编码技术特点
时间
2018-10-19 15:00 - 15:45
地点
主要内容
针对超高清、3D等新一代试听系统,对多层级、高质量的音频编解码技术需求。国标委颁布了音频编码新国标,简称AVS2音频。本报告将从编码框架、核心技术、性能指标等方面,详细分析新国标的特点和应用前景,并展望下一代智能音频编码技术特点。
所属专题
音频新体验
回声消除、减少卡顿、360度声场,耳朵对音频的要求越来越高,本专题将讨论提升音频体验的技术革新与应用创新。
同专题的演讲
邓滨
人工智能产业领域的技术着眼点会更关注神经网络和深度学习算法以及数据,但是随着技术的落地,不可避免的要涉及到硬件产品的基础体验问题。而由于使用场景、使用方式的差异,以及人际通讯和人机对话的技术要求差异,使得人工智能硬件和传统具有音频功能的硬件又有所不同。本次分享拟从声学硬件系统的角度来剖析声学信号处理算法、声学硬件指标及相关技术对于语音交互体验的影响。
Claus Bauer
消费者通过各种不同设备,在各种不同环境中,为了各种不同的目的而享受到的多媒体娱乐内容越来越多样化。这就要求有能够大幅度适应各种回放场景、各种使用案例和各种内容类型的信号处理和内容交付技术作为支持。在本次演讲中,我们将分享杜比如何使用多学科的科学手段开发新一代娱乐技术,我们将阐述如何构建一个生态系统,使其既能够助力内容创作人士,又能为所有最终用户提供沉浸式的一致体验。
王国腾
人类大脑对声音的响应速度和敏感程度非常高。K歌时对人声音轨和伴奏音轨的时间对齐有很强的要求。本次分享将主要介绍手机K歌在混音时间对齐方面存在的问题,常规的工程解决方案以及值得探索的方向。