语音识别(Automatic Speech Recognition, ASR)也称语音转文字(Speech To Text, STT),是将人类的语音内容转换为相应文字的技术。这方面已经有了比较多的商业解决方案(科大讯飞、百度、Nuance等)和开源项目(Kaldi、DeepSpeech等),技术已经相对成熟。