开源大模型是趋势:上海书生大模型等四项目在北京作最新发布
12月18日,以“新纪天工 开物焕彩——致敬开源的力量”为主题的重大科技成就发布会开源专场在国家科技传播中心举办。
国家科技传播中心由中国科协科学技术传播中心建设和运行维护。
中国算力网开源开放试验场、星辰语义大模型平台、书生大模型、“香山”开源高性能RISC-V处理器核等四项成就进行了最新发布。2024年开源创新榜单同步揭晓。
鹏城实验室高效能云计算所所长余跃表示,开源已成为推动技术创新和普及的关键力量。算力作为新质生产力的代表,正逐渐成为衡量国力和生产力的重要标准。在此背景下,鹏城实验室、新一代人工智能产业技术创新战略联盟联合发布了中国算力网开源开放试验场。试验场可调度总算力超过5E Flops(FLOPS即每秒执行的浮点运算次数,1E FLOPS=百亿亿 FLOPS),面向全社会提供大规模普惠算力资源,惠及国内外AI开源开发者17万人。2025 年,试验场计划提供超过100万卡时的普惠算力,加载超过500T的公共数据集用于预训练和微调,并举办更多活动,以促进国内产、学、研、用的开发者生态繁荣。
星辰语义大模型实现了国内首个万亿参数大模型的完整训练。中国电信集团CTO、首席科学家李学龙在为该模型平台做推介时表示,该模型已完成从1B模型到万亿参数模型全尺寸开源,目前下载量达40多万次,有效推动智能政务、智能助理等多领域的智能化升级。
书生大模型由上海人工智能实验室发布。其中,书生·浦语 2.5 具备一百万词元(Tokens)的超长文本窗口及开源模型中领先的推理能力,并支持自主规划和在线信息整合。多模态大模型书生万象InternVL2.5支持图像、视频、文本、语音、三维、医疗多种模态。
上海人工智能实验室主任、首席科学家周伯文在为项目做推介时表示,未来书生系列大模型将持续迭代模型并开源,实验室将保持开放,携手产学研,成为技术发展的连接器、放大器和加速器。
上海人工智能实验室青年科学家陈恺在发布中表示,书生大模型不仅服务于学术研究,也应用于产业界,如智能体开发、数字化平台建设等,助力国计民生。此外,上海人工智能实验室还通过实战营和挑战赛等形式培养人才,推动大模型技术的发展。
“香山”开源高性能RISC-V处理器核由北京开源芯片研究院发布。中国工程院院士、“科创中国”开源创新联合体荣誉理事长倪光南在为项目做推介时表示,“香山”开源高性能RISC-V处理器核的源代码通过以GitHub、GitLink等国内外开源托管平台,获得约5000个Stars、670个fork,成为国际开源社区性能最强、最活跃的RISC-V处理器核。目前,“香山”开源高性能RISC-V处理器核已完成三次流片,为芯片产业创新发展做出了卓越贡献。
在圆桌对话环节,中国计算机学会开源发展委员会副主任、LVS创始人章文嵩表示,大模型训练本质上是数据工程管理,而数据获取正变得日益困难。闭源大模型公司将会遇到数据来源问题,因为数据作为每个企业的重要资产,可能很多企业不愿意为闭源大模型公司贡献数据。相比之下,开源模型由于非营利性质,更容易获得社区和企业的数据支持。
余跃认为,开源大模型代表了一种必然的趋势。在人工智能时代,开源的意义超越了代码本身。
杨丽蕴表示,由于开源模型领域尚处于起步阶段,业界尚未形成统一标准,因此厘清AI开源模型的边界及确定哪些内容应当公开,仍需产业界共同探讨。
谢志锋表示,如何利用好国内平台和服务是开发者抓住大模型发展机遇的关键。随着更多相关平台在国内涌现,开发者将拥有更多机会参与大模型和AI应用的创新中。
2024年开源创新榜单由中国科协科学技术传播中心、中国计算机学会、中国通信学会、中国科学院软件研究所共同主办,中国开发者社区承办,共评审出10个年度开源项目、10个年度开源社区、10个年度开源应用场景与10大年度开源事件。