首页>潮品 > 新技术 > > 正文

字节跳动开源大模型训练框架

2022-03-21 11:36:23
来源:科技日报 作者:刘艳 评论:0

  近日,字节跳动应用机器学习团队开源veGiantModel大模型训练框架。

  该训练框架主要应用于自然语言处理领域的大模型训练,最高可将大模型训练的性能提升6.9倍,大幅降低训练系统的压力。字节跳动旗下的企业级技术服务平台火山引擎已在其机器学习平台上原生支持了veGiantModel,该平台正在公测中。

  自然语言处理是人工智能研究的一个重要领域,旨在帮助计算机理解、解释和运用人类语言,可应用于机器翻译、个性化推荐和信息提取等领域。近些年,自然语言处理在应用方面取得了较为显著的突破,主要归功于深度学习以及相关技术的发展,尤其是Bert、GPT、GPT-3等大规模预训练语言模型的普及。

  大规模训练模型可以包含更多数据,表示更多信息,算法表现更加出众。然而,由于大模型参数量过于庞大,模型设计非常复杂,训练耗时长,对现有的训练系统带来了不小的挑战,主要体现为显存压力、计算压力和通信压力。

  针对现有训练系统在大模型训练场景下的上述挑战, 字节跳动应用机器学习团队提出了大模型训练框架veGiantModel。

  与主流开源训练框架的对比测试显示,veGiantModel的性能表现最好、受网络带宽影响最小,在Tesla V100上较上述两者有1.2倍到3.5倍的提升,在Ampere A100上最高可提升6.9倍,能大幅降低训练系统的压力。

  近年来,字节跳动持续推动技术开源。2021年,字节跳动技术团队陆续开源了微服务中间件CloudWeGo、LightSeq训练加速引擎等30余个重要项目。

  字节跳动相关技术负责人表示,推广科技创新成果的应用并推行技术开源一直是公司所倡导的,技术团队将持续通过科技创新为行业发展提供更多动力,助力科技更好地造福社会。

(责任编辑:韩梦晨)

版权与免责声明:
①凡本站注明稿件来源为:中国高新技术产业导报、中国高新网、中高新传媒的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网授权使用作品的,被授权人应在授权范围内使用,并注明“来源:中国高新网、中高新传媒或者中国高新技术产业导报”。违反上述声明者 ,本网将追究其相关法律责任。
② 任何单位或个人认为本网站或本网站链接内容可能涉嫌侵犯其合法权益,应该及时向本网站书面反馈,并提供身份证明,权属证明及详细侵权情况证明,本网站在收到上述文件后,将会尽快移除被控侵权的内容或链接。
③如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。电话:010-68667266 电子邮件:dbrmt#chih.org (请将“#”换为“@”)
排行
  • 全部/
  • 本月

编辑推荐


扫描添加 中国高新技术产业导报

(数字报)

扫描添加 中国高新APP客户端
扫描添加 新浪微博
扫描添加 腾讯微信公众号