通义千问Qwen 2.5-Max超大规模MoE模型号称优于Deepseek V3
佚名
2025-01-30 09:00:48
0

IT之家 1 月 29 日消息,新年之际,阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型,大家可以通过 API 的方式进行访问,也可以登录 Qwen Chat 进行体验,例如直接与模型对话,或者使用 artifacts、搜索等功能。

通义千问Qwen 2.5-Max超大规模MoE模型号称优于Deepseek V3__通义千问Qwen 2.5-Max超大规模MoE模型号称优于Deepseek V3

据介绍,通义千问 Qwen 2.5-Max 使用超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。

性能

阿里云直接对比了指令模型的性能表现(IT之家注:指令模型即我们平常使用的可以直接对话的模型)。对比对象包括 DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet,结果如下:

_通义千问Qwen 2.5-Max超大规模MoE模型号称优于Deepseek V3_通义千问Qwen 2.5-Max超大规模MoE模型号称优于Deepseek V3

在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中,Qwen2.5-Max 的表现超越了 DeepSeek V3,同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。

在基座模型的对比中,由于无法访问 GPT-4o 和 Claude-3.5-Sonnet 等闭源模型的基座模型,阿里云将 Qwen2.5-Max 与目前领先的开源 MoE 模型 DeepSeek V3、最大的开源稠密模型 Llama-3.1-405B,以及同样位列开源稠密模型前列的 Qwen2.5-72B 进行了对比。对比结果如下图所示:

通义千问Qwen 2.5-Max超大规模MoE模型号称优于Deepseek V3__通义千问Qwen 2.5-Max超大规模MoE模型号称优于Deepseek V3

我们的基座模型在大多数基准测试中都展现出了显著的优势。我们相信,随着后训练技术的不断进步,下一个版本的 Qwen2.5-Max 将会达到更高的水平。

相关内容

2026上海环保展有啥亮点...
人工智能技术  开启环保新方向慕尼黑博览集团于1966年创立IFA...
2025-12-22 19:34:17
天津广告印刷办公展、新疆展...
信息展会推荐榜在当今数字化时代,信息展会是获取行业动态和前沿技术的...
2025-12-22 19:08:30
展会宣传用短视频?这些专业...
在当今数字化时代,短视频已成为企业宣传和推广的重要工具。尤其是在展...
2025-12-20 19:08:42
2026年德国展会Faku...
Fakuma是全球最重要的塑料加工专业贸易博览会之一,被誉为“塑料...
2025-12-19 19:56:37
2025年中国会展业年会在...
会展BEN 2025年12月18日 08:15 北京本文转自“智海...
2025-12-19 19:08:50
十五五开局,中国会展业迈向...
“十五五”开局之际,中国会展业正站在从“展览大国”迈向“展览强国”...
2025-12-18 23:15:28

热门资讯

3000+人次到场,大量行业首... 3000+人次到场,大量行业首发内容,2024甲子引力年终盛典成功举办丨甲子引力,机器人,人工智能,...
用OLED怕烧屏,华为新专利“... 新款 iPad Pro 克服了此前传统 OLED 屏幕的亮度问题,在平板电脑的尺寸下做到了 1000...
华米 Ov 们把手机电池搞得大... 话说,今年的国产旗舰手机,有一个特质很突出 —— 电池容量大。除了少数几款标准版机型,大多新机的电池...
雷蛇推出USB 4拓展坞:10... 这款拓展坞采用铝合金外壳,似乎不支持RGB灯效。
英国首相为“AI 校园”揭幕:... IT之家 11 月 28 日消息,据路透社报道,当地时间 27 日,英国首相基尔・斯塔默(Keir ...
生成式人工智能安全大赛完美收官... 生成式人工智能安全大赛完美收官 院士专家共谈AI安全与治理
一文看懂索尼、三星、豪威的各种... 1,三大厂家名词统一首先,“双原生ISO”这个词最先在手机端出现,还得追溯至绿厂 Find X2 P...
刚刚,OpenAI首个智能体提... 刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师,编程,工程师,智能体...
靠七天无理由退货赚了200万?... 漏洞不是随便钻的。
对标DeepSeek的深度思考... 对标DeepSeek的深度思考模式?OpenAI推出新功能Deep research,大模型,dee...