首页>潮品 > 新技术 > > 正文

5G新通话不简单:不仅听见,还能看懂

2022-04-18 10:18:24
来源:科技日报 作者:吴长锋 评论:0

  4月12日,中国移动在首钢园国家冬季训练中心速滑馆举办“5G新通话,预见新未来”产品发布会,正式发布5G新通话产品,并宣布部分终端已在全国支持5G VoNR超清通话业务,打造可视化、多媒体、高感知、全交互的全新媒体。

  将覆盖所有新上机型

  在发布会上,中国移动市场经营部总经理首建国介绍,与互联网的语音视频通话相比,5G新通话能够基于中国移动5G网络,实现高清视频通话,通话质量稳定,几乎没有时延,且电话呼入不中断。同时,结合AI技术,5G新通话可以在通话过程中实现中英文实时翻译、语音转文字等功能,此外还提供了屏幕共享、远程协作等特色功能。首建国还介绍说,目前5G新通话功能正陆续在各大手机终端进行适配,到今年7月,所有终端新推出的机型都将支持5G新通话。

  从5G新通话所展示的功能来看,有望成为一款“5G杀手级应用”。在这一被业界普遍看好的业务背后,5G网络是核心基础,媒体互动是重要功能扩展,终端支持是保障,其中还有一个关键,就是AI智能语音技术。

  不仅听见,还能看懂

  5G新通话可以让通话双方实现语音转文字,同时还可以在屏幕上实时翻译,让通话人在听见的同时,“看懂”通话的内容。看似好理解的技术,背后蕴藏着大量黑科技,例如语音识别、口语理解、语音同传等等,非深厚的AI语音技术积累不可为。

  这些背后的黑科技,主要来自智能语音和人工智能的头部企业科大讯飞,因此,科大讯飞也成为中国移动5G新通话的官方合作伙伴。

  据悉,科大讯飞是北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商。资料显示,面向冬奥会场景的多语种语音及语言服务平台,采用了科大讯飞的“自动语音转换与翻译”技术,支持60个语种语音合成、69个语种语音识别、168个语种机器翻译和6个语种交互理解,其中重点语种翻译准确率达到了95%,平均每句翻译响应时间不超过0.5秒。

  口语化体验更流畅

  通话场景下有大量的口语化表达,口语化表达不同于规范的书面文本,一般表现为内容表述不符合语法规范、语气词过重、重复冗余等,这使得直译时出现明显的“机翻”痕迹,给机器翻译在通话场景中的应用提出了更高的要求。

  科大讯飞的技术负责人介绍,针对5G新通话口语化场景优化,采取了三大措施:一是人机协同标注常用口语数据,并补充口语双语训练;二是系统性运用了无监督/弱监督训练方法,基于大量口语化表达的源、目标语言单语数据,采用自训练、回译算法等强化翻译模型和语言模型,对口语化表达特性实现增强训练;三是针对语音识别后处理阶段,设计语气词顺滑、规整等模块,将口语化表达尽可能书面化,从而减少机翻“痕迹”,帮助用户更好地理解。

  中国移动5G新通话背后的人工智能技术,来源于科大讯飞23年来坚持源头技术自主创新的深厚积累。科大讯飞在人工智能语音识别、机器翻译、语义理解等技术领域处于国际领先地位,曾在诸多国际技术赛事中获得冠军。

  (科大讯飞供图)

(责任编辑:韩梦晨)

相关阅读:

版权与免责声明:
①凡本站注明稿件来源为:中国高新技术产业导报、中国高新网、中高新传媒的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网授权使用作品的,被授权人应在授权范围内使用,并注明“来源:中国高新网、中高新传媒或者中国高新技术产业导报”。违反上述声明者 ,本网将追究其相关法律责任。
② 任何单位或个人认为本网站或本网站链接内容可能涉嫌侵犯其合法权益,应该及时向本网站书面反馈,并提供身份证明,权属证明及详细侵权情况证明,本网站在收到上述文件后,将会尽快移除被控侵权的内容或链接。
③如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。电话:010-68667266 电子邮件:dbrmt#chih.org (请将“#”换为“@”)
排行
  • 全部/
  • 本月

编辑推荐


扫描添加 中国高新技术产业导报

(数字报)

扫描添加 中国高新APP客户端
扫描添加 新浪微博
扫描添加 腾讯微信公众号