直接开源，阿里达摩院公布下一代工业级语音识别模型

时间：2022-12-22 15:07 来源: IT之家阅读量：7493

阿里巴巴达摩院今日发布新一代语音识别模型Paraformer，适用于语音输入法，智能客服，车载导航，会议纪要等场景。

据介绍，这是业内首个非自回归端到端语音识别模型其推理效率最高可达传统模型的10倍，识别准确率在众多权威数据集排名第一目前该模型在魔术社区面向全社会开源

资料显示，用GPU推理，不同版本的Paraformer可以提高推理效率5—10倍同时，Paraformer采用6倍下采样的低帧率建模方案，可以减少近6倍的计算量，支持大模型的高效推理

本站了解到，阿里达摩院表示，Paraformer是阿里巴巴研发的下一代杀手级语音识别基础模型，未来将广泛应用于理解，钉钉语音转文本，高德导航等会议纪要产品中。

相关阅读:

阿里达摩院推出AI模型社区魔:开源300+ AI模型，可体验国画AI

。

声明：以上内容为本网站转自其它媒体，相关信息仅为传递更多企业信息之目的，不代表本网观点，亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险，需谨慎。

新经济这十年｜盒马CEO侯毅：线上化不是零售业的未来

两年累计回报超114%广发基金郑澄然领衔三年成长动力

微盟联合CCFA发布2022零售数字化报告：58%受访企业开始布

国海证券给予百润股份买入评级公司深度研究：预调酒如日方升RIO蓄

一系列政策加速落地金融助力稳住外贸基本盘

中国电影：随着主要城市防疫成效越来越好相信电影市场会很快恢复电影