语音识别


  • 利用transformer结构的encoder-decoder方案,可以实现轻松的转录。

方言识别

  • 采集了约40小时的重庆方言。
  • 训练轻量化模型。

粤语英语混合识别

  • 由于特定地区说话的方式,混合语言识别更能体现本地化。但是一般这种情况语料稀缺,在同一段话或句子中,可能会存在快速的语言切换(例如,粤语和英语交替使用),而且粤语有六个声调,英语通常没有类似的音调变化,需要模型能够处理两种语言交替使用的词汇和语法结构。
  • 识别结果