项目研究基于全景声场理念的Ambisonics技术,它是一种声道独立的球形声场再现技术。Ambisonics技术将拾取到的声源信号通过一系列打包渲染算法转换成传输编码格式B格式(B-format),根据阶数不同,B-format有不同的通道数要求。它除了可以还放水平面信息外,还能还放自下而上的高度信息,突破了传统意义上5.1、7.1声道的概念,更真实的营造出四周由远及近的音效,呈现出动态的声音效果、沉浸式的听觉感受。包括基于全景声技术的采集端Twirling Capture SDK,单通道或多通道语音增强处理,回声消除,声源定位,均衡器调整,自动增益控制,波束成形;麦克风阵列设计与定制,包括线性和环形阵列,不规则阵列定制,支持标准First Order Ambisonic(FOA),higher order ambisonic(Hoa)Omini Binaural,支持单指向和全向ECM以及MEMS麦克风。开发一种可扩展性,移植性高,灵活性强,应用场景更广的音频采集方案(麦克风阵列+软件算法支持)Twirling720 Lite和Twirling Capture SDK。支持多个或多种麦克风阵列形状,并将算法集成在芯片中,这样可以根据用户已设想好的产品模型提出定制化音频采集方案,满足各行各业对声音捕捉的需求。算法融合了360度实时声源测向、定向拾音、噪声抑制、混响消除、回声抵消等多项技术。不仅如此,在最近的迭代中,增加了声纹识别、智能语音交互等部分,实现全方向语音唤醒,语音识别,说话人分离、语音交互等更多功能。基于全景声的智能语音技术,将带来更好的临场和空间沉浸感。语音唤醒和语音降噪等提升远场识别,真正实现智能化、人性化、多样化。项目广泛应用于金融银行、智慧安防、工业检测、新闻传媒、养老服务、文化旅游、智能家居等领域。
【展开】
【收起】