阿里云发布全球最强Qwen2开源模型！超越文心4.0等闭源大模型

6月7日消息，今天阿里云在其技术博客上宣布，正式发布了全球性能最强的开源模型Qwen2-72B。

这一最新模型在性能上超越了美国最强的开源模型Llama3-70B，同时也领先于包括文心4.0、豆包pro、混元pro在内的众多中国闭源大模型。

目前，所有人均可在魔搭社区和Hugging Face免费下载通义千问最新开源模型。

阿里云发布全球最强Qwen2开源模型！超越文心4.0等闭源大模型第1张
此前开源的Qwen1.5-110B已领先于文心4.0等一众中国闭源模型

Qwen2系列模型在代码、数学、推理、指令遵循、多语言理解等能力上实现了大幅提升。

在MMLU、GPQA、HumanEval等国际权威测评中，Qwen2-72B一举斩获多项世界冠军，展现了其卓越的性能。

阿里云发布全球最强Qwen2开源模型！超越文心4.0等闭源大模型第2张
Qwen2-72B在十多个权威测评中获得冠军，超过美国的Llama3-70B模型

此外，Qwen2系列包含5个尺寸的预训练和指令微调模型，均使用了GQA（分组查询注意力）机制，为用户带来了推理加速和显存占用降低的优势。

阿里云CTO周靖人表示，坚持开源开放是阿里云的重要策略，旨在打造AI时代最开放的云，让算力更普惠、让AI更普及。

Qwen2的发布，不仅为全球开发者提供了强大的工具，也为推动AI技术的普及和发展做出了贡献。

目前Qwen2系列模型的API已登陆阿里云百炼平台，并获得了全球众多开源平台和工具的第一时间支持。

此外，Qwen系列模型的总下载量在一个月内翻了一倍，突破1600万次，显示出其在全球开源社区中的广泛影响力。

☆未收藏(0)

本文由 @威廉咩羊于 2024-06-07 发布在酷瑞百科，如有疑问，请联系我们。
本文链接：https://www.krbk.com/qydt/329127.html

喜欢钻研奇怪芝士的有文化的LSP