首页>产业 > 信息技术 > > 正文

重庆首个自主研发大语言模型发布

2023-07-14 09:16:45
来源:科技日报 作者:雍黎 评论:0
  7月13日,上海交通大学重庆人工智能研究院“兆言”大模型发布会在西部(重庆)科学城召开,发布该研究院最新研发成果——“兆言”大模型产品(以下简称“兆言”大模型),这也是重庆首个自主研发的大语言模型。

  据了解,“兆言”大模型是上海交通大学重庆人工智能研究院基于其AI大模型技术研发出的最新成果,它的建立是通过积累海量数据,辅以独特的数据处理和AI训练技术,以达到精准、专业的文本输出,能够实现以自然语言选择、调用应用程序的能力,助力打造个性化的智能产品。

  发布会现场展示“兆言”大模型的运用对比情况。受访者供图

  “和通用大模型相比,兆言大模型拥有领域精调效率高、训练推理成本低、人机交互能力强的特点。”上海交通大学重庆人工智能研究院院长、首席科学家金石介绍,通用大模型在行业落地面临许多困难,比如,未经行业精调的通用模型在行业应用中表现不佳、通用大模型需要的算力资源不易进行私有化部署、自然语言转API调用不稳定等,兆言大模型能较好地解决这些问题。

  该模型采用启发式数据过滤及增强、模型预训练和精调自适应比例混合、人工和自动评测相结合等方法对模型进行垂直领域精调,解决了精调中的数据质量差、模型原有能力遗忘、模型答案出现幻觉、模型训练效率低等行业难题,使模型答案质量有很好的保障。

  模型研发还把小型化部署作为重点,大幅降低模型训练和推理成本。在商业化所需特定任务上,模型回答质量不降低,而调用成本仅为小型化前的四百分之一,从而保障了以模型为基础的产品在市场上的竞争力。

  为解决在自然语言转应用程序接口(API)调用任务上模型发挥不稳定的问题,研发团队还建立了专有的自然语言调用语料和指令数据集,从而实现了大语言模型对其他系统的精准调用。

  发布会上,上海交通大学重庆人工智能研究院与华院计算技术(上海)股份有限公司、重庆赛迪工程咨询有限公司、重庆誉存科技有限公司、中国移动通信集团重庆有限公司等单位现场签约,各方将发挥各自优势,促进大模型技术在制造业、金融、农业、文旅、教育、医疗、司法等场景落地应用。

(责任编辑:范晓婷)

版权与免责声明:
①凡本站注明稿件来源为:中国高新技术产业导报、中国高新网、中高新传媒的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网授权使用作品的,被授权人应在授权范围内使用,并注明“来源:中国高新网、中高新传媒或者中国高新技术产业导报”。违反上述声明者 ,本网将追究其相关法律责任。
② 任何单位或个人认为本网站或本网站链接内容可能涉嫌侵犯其合法权益,应该及时向本网站书面反馈,并提供身份证明,权属证明及详细侵权情况证明,本网站在收到上述文件后,将会尽快移除被控侵权的内容或链接。
③如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。电话:010-68667266 电子邮件:dbrmt#chih.org (请将“#”换为“@”)
排行
  • 全部/
  • 本月

编辑推荐


扫描添加 中国高新技术产业导报

(数字报)

扫描添加 中国高新APP客户端
扫描添加 导报微信公众号