首页>电子报 > > 正文

大模型加持下,数字人“一路狂奔”

2024-04-22 05:00:00
来源:中国高新技术产业导报 作者:李洋 评论:0


图片来源:聚力维度供图

   本报记者  李洋

  4月16日晚,刘强东以“AI数字人”的形式亮相京东直播间。据京东方面数据,不到1小时,直播间观看量超2000万,整场直播累计成交额超5000万元。

  几天前,中国网络视听大会上360集团创始人周鸿祎的“数字人分身”与现场观众进行了分享:“数字人已经不再神秘,大家都可以轻松创建自己的数字分身,我的数字分身已经替我营业了很多场演讲,体验很不错。”

  当下,数字人作为一项备受关注的技术应用场景涌入人们的视野,并展现出巨大的发展潜力和前景。3月29日,中国网络视听大会上发布的第三期《中国虚拟数字人影响力指数报告》显示,2023年度“数字人、虚拟人”相关企业达99.3万余家,其中,2023年1-12月新增相关企业41.7万余家,同比上升超四成。来自国家知识产权局专利检索数据显示,2023年全年数字人领域专利申请数高达544项,其中发明专利申请共计517项,发明专利申请约占专利申请总数的95%。

  AI成为数字人产业核心关键

  据了解,根据数字人的图形维度,常见的虚拟主播有两类:2D数字人更适合在平面媒体上呈现,具有细腻的线条和色彩,但缺乏立体感,而3D数字人则更适合在三维空间呈现,具有逼真、立体效果,并且可以通过交互增加体验感。在制作技术方面,3D数字人的制作难度更大,技术门槛主要在建模和驱动层面,需要更多的技术和资源投入。

  “2D数字人一般用于口播场景的直播和短视频制作,满足功能性即可,所以电商直播和说明类短视频应用较多。此次刘强东AI数字人就属于这一类。3D数字人目前可以制作有动作表演运镜等复杂场景,更多用于剧情类,在AIGC视频高速发展的今天,可以用于网络大电影网剧、短视频短剧和动漫制作场景。”聚力维度创始人赵天奇接受记者采访时表示。

  近年来,AI正在成为数字人产业的核心关键,极大提升了数字人的交互能力、内容生成能力及智能化水平。“在大模型的加持下,通过AI算法,基于深度学习模型、动作模拟、情感模拟等技术,只需要几分钟的真人视频在经过快速的训练后,就可以生成逼真的数字人,制作成本大大降低。”硅基智能创始人兼CEO司马华鹏对记者表示。

  据悉,硅基智能自研的炎帝大模型,融合了数字人大模型、声音大模型、文本大模型、图像大模型等技术,其可理解复杂文本,高效准确地生成视频,视频中包含数字人、声音、画面等内容元素,已广泛应用于知识生产(视频)、知识传播(直播)、知识创作(文娱)等多个领域,且克隆了大量的数字人律师、教师、医生、企业家、博主等,实现了AIGC产品在十多个行业的落地应用。

  聚力维度研发的AI影视制作平台赛博演猿,可以用AI自动生成数字人模型,也可以用AI根据输入的文字生成数字人符合情绪的表演和口型,再结合单目摄像头视觉捕捉技术完成丰富多彩的动作,“最终在赛博演猿里完成镜头、灯光的整个视频制作。让一个人可以成为一个剧组,一天制作两分钟影视级视频内容。”赵天奇说。

  人人都有机会拥有一个数字人

  当下,数字人赛道的“内卷”已经蔓延到了产品端。搜索“数字人定制”不难发现,市面上定制一款数字人的价格从几十万元、几百万元到几千元不等。

  “虚拟数字人的制作成本涉及到多个方面,如技术研发、模型设计、内容制作、智能驱动等。”福建华策品牌定位咨询创始人詹军豪表示,目前,市面上定制一款数字人的价格差异较大,这主要是受到技术成熟度、市场需求、定制程度等因素的影响。

  “2D数字人本质上是视频的口型变化,并不存在定制流程,所以成本在定制环节可以降到很低。现在3D数字人如果走AI建模路线也可以降到很低,比如,我们训练的赛娲大模型可以用文字或者图像生成高级别、可驱动、多样性3D数字人模型,让每个人都可以拥有一个属于自己的数字人剧组。”赵天奇表示。

  与此同时,司马华鹏坦言,入局者变多,“通货膨胀”,降价也成为必然。“前期数字人形象克隆产品通过标准化的价格和服务扩大市场份额,之后行业的新入局者大多贴着标准化定价往下走。”

  硅基智能最初的商业模式是以To B和To G为主,为政府、大V以及品牌商家提供AIGC数字人克隆服务。对此,司马华鹏解释说:“基于科技平权的核心逻辑,我们优先服务那些大V,就是想通过他们把技术变得更完善,当技术完善到一定程度,就敞开大门,人人都能使用。”

  “这就像新药出厂一样,可能一开始比较贵,过了一年之后,‘摊薄’了研发成本,其实很容易把成本降下来。高成本已经成为过去,可以说,在当下人人都有机会拥有一个数字人。”司马华鹏表示。

  数字人感情表现力会越来越强

  不久前,百度智能云副总裁喻友平在“AI Cloud Day:大模型应用产品发布会”上公开表示,数字人客观地讲没法代替顶级的主播,但是可以达到70%的水平,肯定比随便找10个路人素人(当主播)的水平要高。

  不可否认的是,“真人主播不能全天候工作,在某些时候的确需要一个分身”。这已经成为主播行业的一个共识。

  据悉,硅基智能数字人已经应用于企业直播、跨境电商、本地生活服务、乡村振兴等多领域场景,并且支持国内外主流直播平台的开播。直播的数字人可根据脚本手持产品24小时高效直播并及时回复听众,在直播间进行互动。目前,硅基智能的AIGC数字人已经达到了日常直播5万场的常态化状态。

  赵天奇表示,未来数字人的感情表现力会越来越强,“我们聚力维度目前做的AI演员已经可以达到中等演员水准。在强人工智能实现之前,还是要找好场景,比如真人导演+AI演员的组合,比如人们愿意自己脑补情感的角色扮演聊天”。

  据介绍,硅基DUIX数字人交互平台通过对真人进行虚拟仿真,打造了高度拟人化、可交互的数字人系统,尖端的AIGC数字人技术搭载炎帝大模型,在形象和声音克隆的基础上全面复制思想、知识、经历,还原真人的数字化生命,可用于云端陪伴、逝者复活、数字助手等。目前,硅基智能已经通过与政府、文化机构的合作,在得到相关单位授权后,成功用AI“复活”了爱国诗人闻一多、《南京大屠杀》作者张纯如、京剧大师梅兰芳、中国第三代导演谢晋等多位历史人物和公众人物,让他们的故事和精神得以传承。

  “当下,数字人对人工主播的替代主要集中在长时间值守、标准化流程操作以及大规模个性化推荐等方面。未来若要实现具有真情实感、高度互动的数字人,需要在深化情感识别与生成技术、发展更为先进和细腻的自然语言理解和生成模型、构建多维度的真实感知与反馈机制,以及推进数字人自我学习与进化能力的研究等关键方向进行进一步突破。”中国数实融合50人论坛智库专家洪勇认为。

(责任编辑:)

相关阅读:

版权与免责声明:
①凡本站注明稿件来源为:中国高新技术产业导报、中国高新网、中高新传媒的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网授权使用作品的,被授权人应在授权范围内使用,并注明“来源:中国高新网、中高新传媒或者中国高新技术产业导报”。违反上述声明者 ,本网将追究其相关法律责任。
② 任何单位或个人认为本网站或本网站链接内容可能涉嫌侵犯其合法权益,应该及时向本网站书面反馈,并提供身份证明,权属证明及详细侵权情况证明,本网站在收到上述文件后,将会尽快移除被控侵权的内容或链接。
③如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。电话:010-68667266 电子邮件:dbrmt#chih.org (请将“#”换为“@”)
排行
  • 全部/
  • 本月

编辑推荐


扫描添加 中国高新技术产业导报

(数字报)

扫描添加 中国高新APP客户端
扫描添加 导报微信公众号