Qwen2.5:阿里巴巴最新开源的系列AI大模型
Qwen2.5是什么?
Qwen是阿里巴巴集团Qwen团队研发的大语言模型和大型多模态模型系列。目前,大语言模型已升级至Qwen2.5版本。无论是语言模型还是多模态模型,均在大规模多语言和多模态数据上进行预训练,并通过高质量数据进行后期微调以贴近人类偏好。Qwen具备自然语言理解、文本生成、视觉理解、音频理解、工具使用、角色扮演、作为AI Agent进行互动等多种能力。
Qwen2.5的主要特点
- 参数规模多样:易于使用的仅解码器稠密语言模型,提供 0.5B 、1.5B 、3B 、7B 、14B 、32B 和 72B 共7种参数规模的模型,并且有基模型和指令微调模型两种变体(其中“ B ”表示“十亿”, 72B 即为 720 亿)
- 大规模数据预训练:利用我们最新的数据集进行预训练,包含多达 18T tokens (其中“ T ”表示“万亿”, 18T 即为 18 万亿)
- 长文本处理能力:在遵循指令、生成长文本(超过 8K tokens )、理解结构化数据(例如,表格)以及生成结构化输出特别是 JSON 方面有了显著改进
- 指令遵循与改进:更加适应多样化的系统提示,增强了角色扮演的实现和聊天机器人的背景设置。
- 上下文理解:支持最多达 128K tokens 的上下文长度,并能生成多达 8K tokens 的文本。
- 多语言支持:支持超过 29 种语言,包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韩文、越南文、泰文、阿拉伯文等。
如何使用Qwen2.5?
Qwen2.5既提供了开源模型,也开放了API服务,帮助你快速开发或集成生成式AI功能。
1、开源版本:
- 开源地址:https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e
- Github:https://github.com/QwenLM/Qwen2.5?tab=readme-ov-file
- 在线demo:https://huggingface.co/spaces/Qwen/Qwen2.5
2、API服务
如果不想进行繁琐的部署,阿里还开放了旗舰模型Qwen-Plus 和 Qwen-Turbo的API。
API地址:https://help.aliyun.com/zh/model-studio/developer-reference/what-is-qwen-llm
数据评估
关于Qwen2.5:阿里巴巴最新开源的系列AI大模型特别声明
本站做视频AI导航网提供的Qwen2.5:阿里巴巴最新开源的系列AI大模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由做视频AI导航网实际控制,在2024年10月15日 下午12:44收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,做视频AI导航网不承担任何责任。
相关导航
Emu3是智源研究院发布的原生...
Qwen2-VL:阿里最新开源的视觉多模态大语言模型
Qwen2-VL是由阿里巴巴最新开...
Stable Diffusion 3.5:Stability AI 开源的新一代AI图像生成模型
Stable Diffusion 3.5 是由 S...
Seed-Music:字节跳动推出的AI音乐大模型,支持一键生成高质量歌曲
Seed-Music是由豆包大模型团...
Pyramid-Flow:北大快手等联合推出的开源文生视频AI模型
Pyramid-Flow是由快手、北京...
Llama 3.2:Meta最新推出的开源模型,包括视觉大语言模型和设备端纯文本模型
Llama 3.1是Meta最新推出的开...
Mochi 1:Genmo 推出的最新开源视频生成模型
Mochi 1 是 Genmo 推出的最新...
Pixtral 12B:Mistral 推出的首款多模态大语言模型,支持下载和微调
Pixtral 12B是法国 AI 初创公...
暂无评论...