登录邮箱:1527511756@qq.com
当前位置:乡村振兴网>> 品牌>>正文内容

阶跃星辰姜大昕:Scaling Law仍处于陡峭区间,万亿参数是基本出发点

2024年07月07日 来源:乡村振兴网

在2024世界人工智能大会启明创投·创业与投资论坛上,阶跃星辰创始人、CEO姜大昕发表了演讲,分享了对于大模型发展现状与趋势的观察与思考。在演讲中,姜大昕重点阐述了一个核心观点:探索AGI路径,“Scaling Law”和“多模态”是相辅相成、缺一不可的两个方向。两者齐头并进,最终到达AGI。

近年来,GPT系列模型的演进,客观上验证了Scaling Law的有效性。模型参数量决定模型能力的上限。从模型效果看,参数量增大确实带来了性能上的飞跃。虽然业内围绕“Scaling Law还能走多远”尚未形成共识,但阶跃星辰认为,参数量接下来再提高一个数量级是依然成立的。Scaling Law 目前依然奏效,模型性能仍然在随着参数量、数据量和计算量的增加呈幂次方增长。在此发展过程中,万亿参数量已经成为一个基本的入门门槛。

正是基于这样的认知,阶跃星辰很早便启动了万亿参数模型的训练。从千亿到万亿,模型的参数规模提升了一个量级,难度也提升了十倍以上。为此,阶跃星辰加大资源投入,尤其在系统和算法上积极探索,最终走通了万亿参数 MoE 大模型训练的道路。在 WAIC 2024 上,阶跃星辰发布了全新的 Step-2 万亿参数语言大模型正式版。根据从逻辑推理、世界知识、数学和编程等多个维度进行的权威测试,Step-2 模型能力都已全面接近国际主流模型,在部分测试集甚至实现了超越。

责任编辑:杜烽
相关推荐
阶跃星辰姜大昕:Scaling Law仍处于陡峭区间,万亿参数是基本出发点

近年来,GPT系列模型的演进,客观上验证了Scaling Law的有效性。模型参数量决定模型能力的上限。从模型效果看,参数量增大确实带来了性能上的飞跃。虽然业内围绕“Scaling Law还能走多远”尚...[详细]

“虹桥新动力,青浦616”城市漫步活动圆满落幕,美庐奶粉集市成新亮点

近日,上海虹桥国际中央商务区管理委员会与上海市青浦区人民政府联合主办的“虹桥新动力,青浦616”城市漫步活动在青浦区徐泾镇盛大举行。本次活动旨在通过独特的城市探索之旅,让市民和游客...[详细]

阳光电源:以清洁能源技术创新构筑连接之桥

随着光伏储能为核心的新型能源系统加速发展,绿电走进千行百业、千家万户,逐步提升了电力在消费侧的比重,全屋绿电、零碳工厂、零碳园区等逐渐成为现实。随后在“多元应用 引领产业新发展”...[详细]

返回顶部