鸡尾酒会问题一直是语音识别领域中的重要研究课题。在一场人声嘈杂的鸡尾酒会上,人们难以专注于眼前正与自己交谈的那个人的声音。而对于语音识别算法而言,重叠语音信号会使识别准确率大幅降低,甚至有时无法识别出任何文字。
VoiceFilter 系统处理重叠语音的示例。
谷歌博客链接:https://ai.googleblog.com/2020/11/improving-on-device-speech-recognition.html
论文链接:https://arxiv.org/pdf/2009.04323.pdf