远场语音识别面临的瓶颈与挑战
demi 在 周一, 09/10/2018 - 10:27 提交
语音交互正在被视为用户在未来很多场景下的主要流量入口之一。因此,寻求可靠有效的远场语音技术突破变成了当下工业界和学术界的迫切需求。一个经典的语音识别系统包含麦克风信号采集模块、信号处理模块以及语音识别模块。每个模块的处理方法都会影响最终的识别效果。
具体来说,目前远场语音识别的技术难点主要集中在以下4个部分:
第一个是多通道同步采集硬件研发;
第二个是前端麦克风阵列信号处理算法研发;
第三个是后端语音识别与前端信号处理的匹配;
第四个是前端和后端联合优化。
首先,多通道麦克风阵列技术已经被证明可以显著提升语音识别质量。当信号采集通道数足够多时,需要额外研发多通道同步技术。并且,目前消费电子上很少有集成多个麦克风的情况,相关研究成果很少,这也增加了该硬件方案的研发难度。









