10月8日晚,蚂蚁集团于开源圈掀起轩然大波。
它正式开源Ling2.0系列首个旗舰级非思考模型Ling-1T,此举措如巨石入水,即刻在开源界引发高度关注,激起热烈反响。
这模型参数量直接拉到1万亿,在开源领域里,这么大规模的非思考模型还是头一个见。
智东西10月9号就报了这消息,我当时看到的时候还愣了下,本来想琢磨下是不是有其他开源模型能跟它比规模,后来发现目前公开信息里还真没有能打的。
Ling-1T的底子是Ling2.0架构,这架构有意思的地方在于它跟着“Ling缩放定律”走,就算计算量到了1e25到1e26FLOPs,架构和超参数还能保持可扩展性。
内部运用混合专家激活设计,独具匠心,整体参数规模逾1万亿,激活参数达500亿,激活比例为1/32。
这般精巧设计,在参数运用方面展现出非凡巧思,这比例挺讲究的,就像咱们做饭只放需要的调料,不浪费还能出味儿。
之前看其他大模型,要么参数大了就费资源,要么省资源了能力又跟不上,Ling-1T这波平衡做得还不错。
此外,有一种名为QK归一化的技术,它专为解决训练过程中的稳定性问题而研发,在相关领域发挥着至关重要的作用,有效提升训练的可靠性和效率。
我查过相关资料,大模型训练最怕梯度爆炸,很多模型都栽在这上面,Ling-1T用这技术把收敛稳定性给稳住了,这一点确实得夸。
此外,它于训练全程运用FP8混合精度,尤为值得称道的是,在当前已知的基座模型领域中,其训练规模堪称出类拔萃,在一众模型里名列前茅。
相较于传统的BF16,FP8不仅能有效节省内存,还可实现超15%的加速。
尤为关键的是,其精度损失偏差未逾0.1%,如此优异的数据,在行业中堪称出类拔萃。
Ling-1T究竟有何底气,竟敢与闭源模型一较高下,它是具备独特优势,还是另有依仗,能在这场激烈较量中争得一席之地呢?看这些测试数据就懂技术底子打好了,性能表现自然得拿数据说话。
在推理、数学、编程等基准测试中,Ling-1T表现卓越,势如破竹地一举斩获22项SOTA佳绩,尽显其在相关领域的强大实力与优势。
其中有七项与数学和推理紧密相关,于AIME25基准中,更是进一步拓展了推理精度与长度的帕累托边界,展现出更为卓越的性能与深度。
这边界拓展可不是小事,之前很多模型要么推理准但处理不了长文本,要么能处理长文本但精度掉得厉害,Ling-1T这波算是把两个痛点都解决了。
编程领域表现更让人意外,在MultiPL-E、LiveCedeBenchi2408-25051这些基准里,它直接超过了DeepSeek-V3.1-Terminus、Kimi-K2-Instruct-0905,连闭源的GPT-5-main和Gemini-2.5-Pro都没打过它。
我之前总觉得闭源模型像班里的尖子生,开源模型想追上得费老大劲,结果Ling-1T这波直接打破了这印象。
而且它在AI代码生成评测ArtifactsBench上,开源模型里排第一,连测试里的基准可视化内容都是它自己生成的,这能力确实够硬。
工具调用方面也不含糊,在BFCLV3基准里,就轻度调了下指令,工具调用准确率就到了70%左右,关键是训练的时候还没接触过大规模轨迹数据。
我觉得这一点对中小企业特别友好,很多企业没精力搞大规模数据训练,Ling-1T这样轻度微调就能用,明显降低了落地门槛。
另外它还能解析复杂的自然语言指令,把抽象逻辑转成视觉组件,生成跨平台的前端代码,非技术人员用文字指令就能弄出页面,这对缺开发人才的企业来说,简直是及时雨。
从写代码到规划行程,Ling-1T的这些应用案例够实在
Ling-1T开源的渠道也考虑得挺周全,HuggingFace、魔搭社区、国内的Lingchat、海外的ZenMux都能拿到。
搞不清为啥有些模型只在一个平台上放,Ling-1T这样多平台布局,明显是想让国内外开发者都方便用。
国内用户使用Lingchat,无需担忧网络难题,海外开发者借助ZenMux,既能测试Chat,又可调用API,如此周全的考量,足见其心思之细腻入微。
实际应用案例也特别接地气,有开发者用它做《三体》人物关系图谱页面,不仅要展示人物关系,还得满足配色、鼠标悬停效果这些视觉要求,结果它都搞定了。
还有个案例是做Crane云平台网页,用户登录、数据仪表盘、设备管理这些功能全实现了,跟正经开发出来的产品没差。
我觉得最有意思的是上海一日游规划,它能根据酒店、目的地坐标这些信息,规划步行路线,还能用mapbox地图展示出来,这比自己查攻略方便多了。
另外它还能玩扫雷、写六边形小球碰撞的HTML脚本,甚至能解线性规划、旅行商问题这些优化题,还会用pygame生成教学动画。
本来想觉得这些功能会不会太杂,后来发现其实都是围绕“实用”来的,不管是开发、学习还是日常规划,都能用得上。
我觉得开源模型就该这样,不光要有硬技术,还得让开发者和用户觉得“这东西能解决我的问题”,Ling-1T在这方面做得挺到位。
综观全局,Ling-1T的开源之举在行业内激起千层浪,其影响力不容小觑,于行业发展而言,恰似巨石入水,涟漪层层扩散,意义深远。
一方面它给开源社区带来了万亿参数级的非思考模型,填补了这方面的空白,另一方面,它的Evo-CoT思维链、LPO强化学习这些技术,也给其他开源模型提供了新思路。
毫无疑问,闭源模型虽然强,但调用成本高,很多中小企业用不起,Ling-1T开源后,这些企业就能低成本用上万亿级模型,这对推动AI普惠挺重要的。
未来它在自动化开发、智能编程助手这些场景的落地值得期待,毕竟现在很多企业都缺开发人才,能自动生成代码还兼顾美观的模型,肯定会受欢迎。
我挺期待看到更多开发者用它做出来的案例,说不定以后咱们日常用到的很多小工具、小网页,背后都是Ling-1T在支撑呢。
友情提示
本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!
联系邮箱:1042463605@qq.com