记者3月19日获悉,阿里大模型产品“通义听悟”发布多项新功能。音视频问答助手“小悟”上线,在业界首次实现单记录、跨记录、多语言自由问,支持对单个最长6小时、一次性上百条音视频的内容理解问答,用户可对超长音视频随心提问,让AI总结任意知识点。此外,针对学习科研场景对AI工具的强烈需求,通义听悟推出“高校公益计划”,向中国大陆高校师生赠送价值数千元的500小时音视频转写时长。
音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,长期以来内容查找难、回顾难、提炼难。阿里通义听悟产品负责人杨帆介绍:“作为一款工作学习AI助手,通义听悟希望让高知识附加值的音视频被轻松阅读、整理和分享。”
据了解,通义听悟接入通义千问大模型,融合了十多项AI功能,包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT提取等,并支持标重点、记笔记等。通义听悟本次升级上新了六大功能点,其中最重要的是音视频问答助手“小悟”,关键信息直接“问”出来。小悟通过多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均实现突破。另外,小悟还会智能推荐问题。针对用户需求,通义听悟还上线了一键AI改写、思维导图生成等新能力。
学生和科研群体对AI新工具有普遍需求,但目前音视频AI转写工具大多收费,或仅提供少量免费时长。
据悉,通义听悟推出“高校公益计划”,推动AI算力普惠。中国大陆高校师生通过后缀edu.cn的教育邮箱进行认证后,均可获赠500小时转写时长,存储空间从20G拓展至200G。
通义听悟能听、能看、能读,还能实现速览加精听,正成为学习科研好帮手。杨帆介绍,调研中发现,约一半用户是在校学生。
去年6月发布以来,通义听悟累计已有上百万用户,包括学生、老师、白领、记者、律师、金融分析师等群体,活跃用户日均转写音视频3次以上,平台每天处理字符数约20亿字。
(责任编辑:韩梦晨)