凝聚535万名开发者,服务20万家企事业单位,创建67万个模型......
在深度学习技术及应用国家工程研究中心近日主办的Wave Summit+ 2022深度学习开发者峰会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰公布了飞桨(深度学习平台)生态最新进展。
王海峰介绍,作为基础共性平台,深度学习平台下接芯片上承应用,如同智能时代的操作系统,有力支撑了产业智能化升级,而具有效果好、泛化性强、研发流程标准化等特点的大模型的出现,对深度学习模型的开发、训练和推理部署提出了更高要求,牵引着深度学习平台的发展方向,为人工智能的进一步发展带来新机遇。
飞桨自开源以来,开源贡献者、合作伙伴,遍布海内外,在这个全方位生态体系中,开发者、科研院所、企事业单位、技术伙伴、硬件厂商等,既是飞桨生态的建设者,也是受益者。
“现阶段,建设好我国自主创新的软硬件基础平台至关重要。开发者是开源生态发展的核心力量,也是技术创新的骨干力量。”鹏城实验室主任、中国工程院院士高文指出,飞桨全面开源开放,凝聚众多开发者,核心技术扎实,面向产业做了很多领先的工作,并积极探索与科学计算等基础研究的结合。
尽管深度学习生态持续繁荣、AI技术进一步突破,但是大模型研发依赖算法、算力和数据综合支撑,在应用层面上还面临一系列技术挑战,如数据规模大,数据质量参差不齐;模型体积大,算法难度高;算力规模大,性能要求高。
如何实现大模型产业化,让大模型的落地像流水线一样高效?
王海峰认为,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务,从而形成一条大模型产业化路径。
从文心大模型的产业实践看,这一路径已经走通。
据了解,基于飞桨平台,百度打造了文心产业级知识增强大模型,包括以鹏城-百度·文心为代表的通用大模型、跨模态大模型、生物计算大模型,联合共建的行业大模型,以及适配场景应用的工具套件、大模型API、基于大模型的产品、探索生态共建的创意社区等。
如果没有飞桨支持,文心大模型就成了“无源之水、无本之木”,为让大模型产业落地更高效便捷,飞桨提供了全流程产业化工具与平台,包括大模型开发套件、场景模型生产线等,极大降低了应用门槛。目前,文心大模型已大规模应用于搜索、信息流、智能音箱等互联网产品,并通过飞桨开源开放平台、百度智能云赋能制造、能源、金融、通信、媒体、城市、教育等各行各业。随着应用场景的进一步扩大,文心大模型已联合打造超过10个行业大模型,不断从行业及企业的特有数据和知识中融合学习,模型能力进一步增强,助力企业降本增效,加快行业转型升级。
“具有自主知识产权的核心技术,是核心竞争力的源头活水。AI领域的底层核心技术,发展主动权必须掌握在自己手里。”深圳大学电子与信息工程学院院长、深度学习技术及应用国家工程研究中心技术委员会副主任、中国工程院院士丁文华表示,深度学习技术及应用国家工程研究中心,是国家科技创新体系的重要组成部分。飞桨平台作为工程研究中心的核心研究成果,在保障国家信息科技安全、推动人工智能应用大规模落地方面发挥了重要作用。
(责任编辑:韩梦晨)