赞助商
立即入驻

Qwen2-阿里云最新发布的通义千问开源大模型

6个月前发布 149 0 0

Qwen2是阿里云通义千问团队开...

收录时间:
2024-06-12
Qwen2-阿里云最新发布的通义千问开源大模型Qwen2-阿里云最新发布的通义千问开源大模型
Qwen2-阿里云最新发布的通义千问开源大模型

Qwen2-阿里云最新发布的通义千问开源大模型

Qwen2是什么?

Qwen2是阿里云通义千问团队开源的新一代大语言模型,推出了5个尺寸的预训练和指令微调模型,在中文英语的基础上,训练数据中增加了27种语言相关的高质量数据;代码和数学能力显著提升;增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。多个评测基准上的领先表现。现已在Hugging Face和ModelScope开源。

Qwen2系列包含5个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。如下表所示:

模型 Qwen2-0.5B Qwen2-1.5B Qwen2-7B Qwen2-57B-A14B Qwen2-72B
参数量 0.49B 1.54B 7.07B 57.41B 72.71B
非Embedding参数量 0.35B 1.31B 5.98B 56.32B 70.21B
GQA True True True True True
Tie Embedding True True False False False
上下文长度 32K 32K 128K 64K 128K
Qwen2-阿里云最新发布的通义千问开源大模型插图

Qwen2的亮点特性

1、代码 & 数学:在代码方面,Qwen2实现了在多种编程语言上的显著效果提升。而在数学方面,大规模且高质量的数据帮助Qwen2-72B-Instruct实现了数学解题能力的飞升。

 

2、长文本处理:Qwen2-7B-Instruct几乎完美地处理长达128k的上下文;Qwen2-57B-A14B-Instruct则能处理64k的上下文长度;而该系列中的两个较小模型则支持32k的上下文长度。

 

3、安全方面:通过显著性检验(P值),Qwen2-72B-Instruct模型在安全性方面与GPT-4的表现相当,并且显著优于Mistral-8x22B模型。

Qwen2的性能评测

相比Qwen1.5,Qwen2在大规模模型实现了非常大幅度的效果提升。在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型,如Llama-3-70B以及Qwen1.5最大的模型Qwen1.5-110B。

Qwen2-阿里云最新发布的通义千问开源大模型插图1

Qwen2-72B-Instruct在提升基础能力以及对齐人类价值观这两方面取得了较好的平衡。相比Qwen1.5的72B模型,Qwen2-72B-Instruct在所有评测中均大幅超越,并且了取得了匹敌Llama-3-70B-Instruct的表现。

 

在小模型方面,Qwen2系列模型基本能够超越同等规模的最优开源模型甚至更大规模的模型。相比近期推出的最好的模型,Qwen2-7B-Instruct依然能在多个评测上取得显著的优势,尤其是代码及中文理解上。

 

如何使用Qwen2?

目前,Qwen2已在Hugging Face和ModelScope上同步开源,相关资源地址如下:

  • Qwen2项目博客:https://qwenlm.github.io/zh/blog/qwen2
  • 在线体验地址:https://huggingface.co/spaces/Qwen/Qwen2-72B-Instruct
  • GitHub地址:https://github.com/QwenLM/Qwen2
  • Hugging Face模型地址:https://huggingface.co/Qwen
  • ModelScope模型地址:https://modelscope.cn/organization/qwen

🚀 阿里云基于Qwen2的AI编程助手通义灵码正式上线,如有兴趣,可以试试。

数据评估

Qwen2-阿里云最新发布的通义千问开源大模型浏览人数已经达到149,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:Qwen2-阿里云最新发布的通义千问开源大模型的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找Qwen2-阿里云最新发布的通义千问开源大模型的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于Qwen2-阿里云最新发布的通义千问开源大模型特别声明

本站做视频AI导航网提供的Qwen2-阿里云最新发布的通义千问开源大模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由做视频AI导航网实际控制,在2024年6月12日 上午10:52收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,做视频AI导航网不承担任何责任。

相关导航

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...