【第一参赛人/留学人员】SUN XUEJING(孙学京)
【留学国家】美国
【技术领域】新一代信息技术
【参赛届次】第10届
【所获奖项】入围
【项目简介】
听觉是除视觉外人类感知外界信息的另一个重要途径。人类的听觉中,除了对声音的响度、音调和音色等主观属性的感觉外,还包括对声音的空间听觉、也就是对声音空间属性或特性的主观感受及进一步的信号处理,涵盖声源定位、场景感知与异常音频事件检测等。高阶声场三维声是一种空间音频技术,在我国,由于技术和播放平台受限等原因,三维声采集播放及智慧音频应用一直以来处于探索阶段。主要技术内容:(1)研发开发了三维声特别是高阶声场的采集渲染技术,基于HOA第一增益和基于VBAP第二增益,通过混合增益完成所述多路音频的混音处理,在保持声音平滑运动的情况下更精准定位声源位置;(2)研究开发了虚拟环绕声传输的方法,使元数据的效率更高,同时使音频对象在空间里做曲线运动时轨迹更平滑。实现了针对不同场景,不同内容,动态生成最优虚拟环绕声的音频技术。(3)研究基于多麦克风阵列的绝对声源定位方法及音频事件分类方法。多声源绝对定位方面,获得三个麦克风阵列SPR-PATH的计算结果后,通过寻找三条定位线公共垂线中点所组成三角形平面的重心方式进行拟合,所拟合得到的点即看作声源的具体位置。
【展开】
【收起】