蚂蚁百灵发布轻量级推理模型 Ring
近日,蚂蚁据百灵大模型公众号,百灵蚂蚁百灵团队发布并开源了Ring-mini-2.0推理模型。发布它是轻量基于此前蚂蚁百灵发布的基础语言模型 Ling 2.0 架构,深度优化的理模高性能推理型 MoE 模型。它在总参数量16B、蚂蚁仅激活1.4B参数的百灵情况下,即可达到10B级别以下dense 模型的发布综合推理能力,尤其在逻辑推理、轻量代码与数学任务中表现卓越,理模并支持 128K 长上下文及 300+ token/s 的蚂蚁高速生成。
经过 Long-COT SFT、百灵更稳定持续的发布RLVR以及RLHF联合优化,Ring-mini-2.0复杂推理的轻量稳定性与泛化性得到显著提升。在多项高难度基准(LiveCodeBench、理模AIME 2025、GPQA、ARC-AGI-v1 等)中,在输出长度相当的情况下,Ring-mini-2.0性能显著超越10B以下dense 模型,甚至媲美更大参数量的MoE模型(如 gpt-oss-20B-medium),在逻辑推理方面尤为突出。

(Ring-mini-2.0性能表现)
据了解,Ring-mini-2.0继承了Ling 2.0 系列的高效 MoE 设计,仅激活 1.4B 参数,通过 1/32 专家激活比、MTP 层等架构优化,达到约 7–8B dense 模型的等效性能。得益于小激活、高稀疏度的设计,Ring-mini-2.0 在H20 部署下实现 300+ token/s 的吞吐,结合 Expert Dual Streaming 推理优化后可进一步提升至 500+ token/s,大幅降低高并发场景下 Thinking 模型的推理成本。同时,借助 YaRN 外推可支持 128K 长上下文,长输出场景下相对加速比最高可达 7 倍以上。
蚂蚁百灵团队表示将完整开放 Ring-mini-2.0 的模型权重、训练数据和 RLVR+RLHF 训练策略。凭借“小而优”的特点,Ring-mini-2.0 有望成为小尺寸推理模型的首选,为学术和工业界提供理想的研究与应用起点。
- ·疑张雨绮家暴,却意外曝光了她的豪宅,鞋柜堪比商场,还有健身房
- ·超越OpenAI、Meta,阿里千问API调用量跃居全球第四
- ·年纳税21亿的TST为何被指微商界的权健?
- ·几丁聚糖、甲壳素、壳聚糖有什么区别
- ·去开封看灯会当心高速堵 今天10时至20时会出现车流高峰
- ·日本雪印推乳酸菌饮料Nyu
- ·卡图巴的功效与作用?马来西亚卡图巴的功效与价格
- ·七亿入口APP?七亿入口平台?七亿入口是真的吗
- ·保姆偷雇主小孩26年后还回 亲妈:她是甩包袱
- ·服用卡图巴后,为什么晚上睡不着觉啊?吃了卡图巴全身酸痛
- ·阿里模型三连发重磅亮相世界人工智能大会,全栈 AI 为开源开放提速
- ·保护穿山甲有什么意义和价值?它们的生存现状如何?为什么不能吃?听专家怎么说!
- ·河南鼓励高校在沿线国家开设分校,推进特色学科境外办学
- ·帝斯曼中国捐款100万元人民币并分批捐赠超过一亿片维生素C产品驰援疫情防控
- ·顶尖AI模型加持、吹响全球创意集结号,爱奇艺启动“与AI共生”短片创作大赛
- ·七亿入口APP?七亿入口平台?七亿入口是真的吗
