【第一参赛人/留学人员】孙学京

【留学国家】美国

【技术领域】新一代信息技术

【参赛届次】第6届

【所获奖项】入围

【项目简介】
项目研究基于全景声场理念的Ambisonics技术,它是一种声道独立的球形声场再现技术。Ambisonics技术将拾取到的声源信号通过一系列打包渲染算法转换成传输编码格式B格式(B-format),根据阶数不同,B-format有不同的通道数要求。它除了可以还放水平面信息外,还能还放自下而上的高度信息,突破了传统意义上5.1、7.1声道的概念,更真实的营造出四周由远及近的音效,呈现出动态的声音效果、沉浸式的听觉感受。包括基于全景声技术的采集端Twirling Capture SDK,单通道或多通道语音增强处理,回声消除,声源定位,均衡器调整,自动增益控制,波束成形;麦克风阵列设计与定制,包括线性和环形阵列,不规则阵列定制,支持标准First Order Ambisonic(FOA),higher order ambisonic(Hoa)Omini Binaural,支持单指向和全向ECM以及MEMS麦克风。开发一种可扩展性,移植性高,灵活性强,应用场景更广的音频采集方案(麦克风阵列+软件算法支持)Twirling720 Lite和Twirling Capture SDK。支持多个或多种麦克风阵列形状,并将算法集成在芯片中,这样可以根据用户已设想好的产品模型提出定制化音频采集方案,满足各行各业对声音捕捉的需求。算法融合了360度实时声源测向、定向拾音、噪声抑制、混响消除、回声抵消等多项技术。不仅如此,在最近的迭代中,增加了声纹识别、智能语音交互等部分,实现全方向语音唤醒,语音识别,说话人分离、语音交互等更多功能。基于全景声的智能语音技术,将带来更好的临场和空间沉浸感。语音唤醒和语音降噪等提升远场识别,真正实现智能化、人性化、多样化。项目广泛应用于金融银行、智慧安防、工业检测、新闻传媒、养老服务、文化旅游、智能家居等领域。 【展开】 【收起】
【成立时间】2018年09月06日
【行业领域】软件和信息技术服务业
【注册资本】150万元
【企业法人】XUEJING SUN
【官方网站】
【公司地址】南京市玄武区玄武大道699-1号3层
【企业简介】
南京拓灵智能科技有限公司是一家集智能音视频采集、处理以及播放为一体的高科技企业,也是玄武区、南京市级高层次人才引进计划所创办的企业。公司自创办以来,一直致力于自主核心技术的研发和创新,特别是在智能音频采集端、麦克风阵列、互动全景声等领域拥有充足的项目经验与技术储备。公司团队由国内、外知名院校博士和硕士组成,除此以外还有来自于美国杜比实验室、苏宁等知名企业的员工加盟。公司已拥有国内发明专利授权2项,发明专利申请8项,其中PCT国际发明专利申请4项,软件著作权9项。单位CEO孙学京博士,毕业于北京大学,美国西北大学语音科学博士学位,曾任职美国杜比实验室,长期从事智能语音及全景声技术研发,并有超过100篇的专利及技术文章;团队成员郭红阳入选北京榜样、“海英人才”等称号。 【展开】 【收起】