语音识别 利用transformer结构的encoder-decoder方案,可以实现轻松的转录。方言识别 采集了约40小时的重庆方言。 训练轻量化模型。 粤语英语混合识别 由于特定地区说话的方式,混合语言识别更能体现本地化。但是一般这种情况语料稀缺,在同一段话或句子中,可能会存在快速的语言切换(例如,粤语和英语交替使用),而且粤语有六个声调,英语通常没有类似的音调变化,需要模型能够处理两种语言交替使用的词汇和语法结构。 识别结果 Share on Twitter Facebook LinkedIn Previous Next