最新全球模型列表：阿里Qwen2.5-Max超级DeepSeek V3！另一个国产大模型海外出圈！

金融 2025-02-05 [db:作者]

后台-插件-广告管理-内容页头部广告（手机）

昨天凌晨(2月4日)，Chatbot Arena LLM Leaderboard更新了最新一期的榜单，最近发布的Qwen2.5-Max直接冲进前十，超越了DepSeekek V3, o1-mini和Claude-3.5-Sonnet等模型以1332分排名世界第七！同时，Qwen2.5-Max在数学和编程方

昨天凌晨(2月4日)，Chatbot Arena LLM Leaderboard更新了最新一期的榜单，最近发布的Qwen2.5-Max直接冲进前十，超越了DepSeekek V3, o1-mini和Claude-3.5-Sonnet等模型以1332分排名世界第七！同时，Qwen2.5-Max在数学和编程方面排名第一，Hard prompts排名第二。

https://lmarena.ai/?leaderboard

Qwen-Max是阿里云通义团队对Moe模型的最新探索，新模型具有很强的综合性能。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond和MMLU-Qwen22在Pro等主流基准测试中.5-Max比Claude-3.5-Sonnet，并且几乎完全超越GPT-4o、DeepSeek-V3和Llama-3.1-405B。

ChatBot Arena官方账号 lmarena.ai 阿里巴巴的Qwen2.5-Max在许多领域表现强劲，特别是在专业技术方面（编程、数学、困难提示等）。

据了解，Chatbot Arena由LMSYSYS Org推出的大型模型性能测试平台目前集成了190多种模型。该列表匿名将两两个大型模型团队交给用户进行盲测，用户根据真实对话体验投票。因此，chatbot Arena LLM Leaderboard成为世界顶级大型模型中最重要的竞技场。

此前，Qwen2.5-72B-Instruct发布后，也闯入了Chatbot 世界十大Arena榜单是得分较高的中国大模型；Qwen2-VL-72B-Instruct在Vision榜单中排名第九，是成绩优异的开源模型。

目前，企业可以在阿里云百炼调用Qwen2.5-Max模型的API，开发者也可以在Qwen 免费体验Qwen2.5.5.5-Max。

Qwen2.5-Max发布后，引起了海外开发者的广泛关注。一些网民比较了DeepSeek-V3 和 Qwen 2.5后，Qwen2.5-Max的出色表现受到高度赞扬。

还有网友开玩笑地为OpenAI首席执行官Sam Altman担心:另一个中国模型来了

许多海外网民表示，中国新模型的迭代速度和质量令人惊叹。

阿里云作为国内较早开源自主研发的大型科技工厂，实现了全尺寸、全模态的开源，推出了语言大模型、多模态大模型等多种开源模型。

在全球范围内，Qwen有9万多个衍生模型，已经超过Llama，成为全球更大的开源模型群。Qwen2.5-max的发布也受到全球各种语言开发者的欢迎。

“Qwen2.5.5-max，我们能告别ChatGPT吗？！”一些使用阿拉伯语的网民说。

许多海外网友用英语表达了对Qwen2.5-max极端性能的惊叹。

通义团队表示，数据规模和模型参数规模的不断提高可以有效地提高模型的智能水平。通义团队对下一个版本的Qwen2.5-Max充满信心，并将继续探索，除了预训练的Scaling 除了继续探索，scaling还将大力投资于强化学习，希望实现超越人类智能，推动人工智能探索未知。

(来源金融界)

后台-插件-广告管理-内容页尾部广告（手机）

标签：

最新全球模型列表：阿里Qwen2.5-Max超级DeepSeek V3！另一个国产大模型海外出圈！

摩根大通:如何看待DeepSeekek？ R1推出后对投资的影响？

中信证券：DeepSeeek对全球人工智能产业链具有很强的参考意义，重点关注工具软件等重点行业软件、通用管理软件、人工智能计算能力三条主线

最新文章

热门文章

标签列表