阿里千问夺冠,GPT
11月4日,GPT备受关注的阿里AI大模型实时投资比赛“Alpha Arena”落下帷幕,阿里千问Qwen夺下最终的千问冠军。该竞赛由三方机构Nof1于10月18日发起,夺冠集合Qwen3-Max、GPTDeepSeek v3.1、阿里GPT-5、千问Gemini 2.5 Pro、夺冠Claude Sonnet 4.5、GPTGrok 4等全球六大顶尖模型,阿里每个模型拥有一万美元初始资金,千问在真实市场上无人工干预地自主决策、夺冠交易,GPT根据盈亏情况决出最后冠军。阿里历时17天,千问阿里千问Qwen以超20%的收益率夺得最后的冠军,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而四大美国顶尖模型全部亏损,GPT-5亏损超60%垫底。

AI大模型在各种性能基准榜单中屡创新高,如何评估大模型在真实、动态、竞争激烈的环境中的决策水平,是当下AI竞技场最受人关注的领域。美国人工智能研究实验室 nof1.ai 发布的“Alpha Arena”(阿尔法竞技场),向六大顶尖模型提供1万美元及金融市场的实时价格及各类指标数据,让大模型在真实市场中用真金白银进行投资比赛,全程没有人工干预 ,模型进行自主决策和交易,是AI处理实时变动的现实世界任务的真实评测,也因此成为近期最火热的AI大赛。
比赛初期,六大模型相对谨慎,大约5天后,参赛模型大致分为三大阵营:阿里千问和DeepSeek成功领先,屡次互换第一,始终位列第一梯队;Claude Sonnet 4.5和Grok4在相近策略驱动下,维持在第二阵营,略有盈利,整体仍亏损;GPT-5、Gemini 2.5 Pro两大模型则长期亏损垫底。

截至北京时间11月4日早上比赛结束,阿里千问凭借在关键时刻的紧急避险,最后关头超越DeepSeek,Qwen以超20%的胜率问鼎冠军;DeepSeek实现盈利,位列第二,两大中国模型成为唯二仍保持正收益的大模型;Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5四大海外模型均亏损,Gemini 2.5 pro和GPT-5亏损尤为明显,截至最终持仓总市值仅为初始资金的三四成。
赛事主办方Alpha Arena的创办人Jay Azhang多次为阿里千问Qwen模型策略及表现点赞,并祝贺阿里千问最终赢得冠军。有业内专家指出,阿里千问和DeepSeek在实战中的优秀表现,证明了中国模型在解决实际问题的强大潜力,AI对于场景的深刻理解,将成为大模型落地和未来全球AI竞赛的关键。
比赛链接:https://nof1.ai/
- ·张大大为杨幂庆生 晒两人日本同游照最后却闹了个乌龙
- ·《舌尖3》揭秘:河南胡辣汤为何要在杭州拍?
- ·薛之谦和李小璐上热搜原因是什么?李雨桐爆料两人关系不一般
- ·夜光剧本是什么梗,夜光剧本事件始末,网友纷纷心疼杨幂
- ·张雨绮公开diss俞敏洪网友力挺!俞敏洪发表了什么言论被吐槽
- ·洪卓立汤怡分手是什么情况?相恋11年为什么突然说分手?
- ·李敏镐被追缴数亿韩元 MYM娱乐回应:不是逃税
- ·苏小玎已经不会高启盛舞步了?高启盛舞步怎么走?
- ·广东发布2024年消费投诉分析报告:新兴领域消费问题突出
- ·主持人李咏去世 妻子哈文早已解散公司陪老公抗癌
- ·德普告别杰克船长 德普演的不好吗?谁将替代德普出演杰克船长
- ·李诞自曝已结婚 黑尾酱跟李诞结婚了吗 李诞自曝被追求是真的吗?
- ·淘宝闪购涌现开店潮!7月入驻品牌增长110%,超12000家门店集体上线
- ·陈羽凡吸毒被抓 胡海泉发文表态:为什么你要对我隐瞒这么久?
- ·东游记何仙姑离婚原因是什么?何仙姑郑秀珍丈夫是谁为何离婚
- ·曝张柏芝产第三胎爸爸是谁 曝张柏芝产第三胎事件始末详情遭扒
