腾讯混元大模型(Tencent Hunyuan)由腾讯公司全链路自研,在高质量内容创作、数理逻辑、代码生成和多轮对话上性能表现卓越,处于业界领先水平。混元 API 支持 AI 搜索联网插件,通过整合腾讯优质的内容生态,提供强大的时新、深度内容获取和 AI 问答能力。
混元生文
混元文生文目前已上线16个版本,以下为模型特性的简要介绍,可作为业务接入时版本选择的参考依据。
模型类型 | 模型名称(api 调用名) | 版本更新时间 | 能力和特征 | 输入输出 | 相关文档 |
文生文-推理模型 | hunyuan-t1-latest | 2025-05-21 | 【官方推荐使用】【推理模型】 业内首个超大规模 Hybrid-Transformer-Mamba 推理模型,扩展推理能力,超强解码速度,进一步对齐人类偏好。 | 最大输入28k 最大输出64k | |
| hunyuan-t1-20250529 | 2025-05-29 | 【最新版本】 能力和特征: 优化文本创作、作文写作,优化代码前端、数学、逻辑推理等理科能力,提升指令遵循能力。 | 最大输入28k 最大输出64k | |
| hunyuan-t1-20250521 | 2025-05-21 | 【推荐】【热门】 1. 数学、代码、科学、知识问答能力显著增强。 2. 优化文科数据,提升文创、文本理解能力。 | 最大输入28k 最大输出64k | |
| hunyuan-t1-20250403 | 2025-04-03 | 提升项目级别代码生成能力;提升文本生成写作质量;提升文本理解 topic 的多轮、tob 指令遵循和字词理解能力;优化繁简混杂和中英混杂输出问题。 | 最大输入28k 最大输出64k | |
| hunyuan-t1-20250321 | 2025-03-21 | 全面搭建模型文理科能力,长文本信息捕捉能力强。 支持推理解答各种难度的数学/逻辑推理/科学/代码等科学问题。 | 最大输入28k 最大输出64k | |
通用文生文 | hunyuan-turbos-latest | 2025-05-20 | 【最新版本】【效果最优】【官方推荐使用】 hunyuan-TurboS 混元旗舰大模型最新版本,具备更强的思考能力,更优的体验效果,已更新至最新版本。 | 最大输入28k 最大输出16k | |
| hunyuan-turbos-20250604 | 2025-06-04 | 【最新版本】 能力和特征:预训练底座升级,写作、阅读理解能力提升,较大幅度提升代码和理科能力,复杂指令遵循等持续提升。 | 大输入28k 最大输出16k | |
| hunyuan-turbos-20250515 | 2025-05-20 | 一、发布特性: 1. 长短思维链自适应融合。 2. 全面提升数学、代码、逻辑和科学等理科效果,文科效果维持。 二、效果指标: 理科:数学 ood 测试集提升7%;逻辑难题提升5%;代码能力及体验提升5%;科学提升8%。 | 最大输入28k 最大输出16k | |
| hunyuan-turbos-20250416 | 2025-04-16 | 【推荐】【热门】 预训练底座升级,增强底座的指令理解及遵循能力;对齐阶段增强数学、代码、逻辑、科学等理科能力;提升文创写作质量、文本理解、翻译准确率、知识问答等文科能力;增强各领域 Agent 能力,重点加强多轮对话理解能力等。 | 最大输入24k 最大输出8k | |
| hunyuan-turbos-20250313 | 2025-03-13 | 【推荐】【热门】 预训练底座训练 token 数升级;数学/逻辑/代码等思考能力提升;中英文通用体验效果提升,包括文本创作、文本理解、知识问答、闲聊等。 | 最大输入24k 最大输出8k | |
| hunyuan-turbos-longtext-128k-20250325 | 2025-03-25 | 擅长处理长文任务如文档摘要和文档问答等,同时也具备处理通用文本生成任务的能力。在长文本的分析和生成上表现优异,能有效应对复杂和详尽的长文内容处理需求。 | 最大输入128k 最大输出6k | |
| hunyuan-large | 2025-02-10 | Hunyuan-large 模型总参数量约 389B,激活参数量约 52B,是当前业界参数规模最大、效果最好的 Transformer 架构的开源 MoE 模型。 | 最大输入28k 最大输出4k | |
| hunyuan-standard-256K | 2024-02-10 | 采用更优的路由策略,同时缓解了负载均衡和专家趋同的问题。长文方面,大海捞针指标达到99.9%。 MOE-256K 在长度和效果上进一步突破,极大的扩展了可输入长度。 | 最大输入250k 最大输出6k | |
| hunyuan-standard | 2025-02-10 | 采用更优的路由策略,同时缓解了负载均衡和专家趋同的问题。 MOE-32K 性价比相对更高,在平衡效果、价格的同时,可实现对长文本输入的处理。 | 最大输入30k 最大输出2k | |
| hunyuan-lite | 2024-10-30 | 升级为 MOE 结构,上下文窗口为 256k ,在 NLP,代码,数学,行业等多项评测集上领先众多开源模型。 | 最大输入250k 最大输出6k | |
机器翻译 | hunyuan-translation | 2024-10-25 | 支持中文和英语、日语、法语、葡萄牙语、西班牙语、土耳其语、俄语、阿拉伯语、韩语、意大利语、德语、越南语、马来语、印尼语15种语言互译,基于多场景翻译评测集自动化评估COMET评分,在十余种常用语种中外互译能力上整体优于市场同规模模型。 | 最大输入4k 最大输出4k | |
| hunyuan-translation-lite | 2024-11-25 | 混元翻译模型支持自然语言对话式翻译;支持中文和英语、日语、法语、葡萄牙语、西班牙语、土耳其语、俄语、阿拉伯语、韩语、意大利语、德语、越南语、马来语、印尼语15种语言互译。 | 最大输入4k 最大输出4k | |
角色扮演 | hunyuan-role | 2024-07-04 | 混元最新版角色扮演模型,混元官方精调训练推出的角色扮演模型,基于混元模型结合角色扮演场景数据集进行增训,在角色扮演场景具有更好的基础效果。 | 最大输入28k 最大输出4k | |
Function Call | hunyuan-functioncall | 2025-04-22 | 混元最新 MOE 架构 FunctionCall 模型,经过高质量的 FunctionCall 数据训练,上下文窗口达 32K,增强了复杂指令和多轮理解能力,增强了开源 BenchMark 的效果,在多个维度的评测指标上处于领先。 | 最大输入28k 最大输出4k | |
代码生成 | hunyuan-code | 2024-11-12 | 混元最新代码生成模型,经过 200B 高质量代码数据增训基座模型,迭代半年高质量 SFT 数据训练,上下文长窗口长度增大到 8K,五大语言代码生成自动评测指标上位居前列;五大语言10项考量各方面综合代码任务人工高质量评测上,性能处于第一梯队。 | 最大输入4k 最大输出4k |
混元多模态模型
混元多模态模型重磅发布,支持图片生文,包括图片基础识别、图片内容创作、图片多轮对话、图片知识问答、图片分析推理、图片 OCR 等能力。以下为模型特性的简要介绍,可作为业务接入时版本选择的参考依据。
模型类型 | 模型名称 | 版本更新时间 | 能力和特征 | 输入输出 | 相关文档 |
混元图生文 | hunyuan-t1-vision | 2025-05-16 | 混元多模态理解深度思考模型,支持多模态原生长思维链,擅长处理各种图片推理场景,在理科难题上相比快思考模型全面提升。 | 最大输入8k 最大输出24k | |
| hunyuan-turbos-vision | 2025-05-23 | 此模型适用于图文理解场景,是基于混元最新 turbos 的新一代视觉语言旗舰大模型,聚焦图文理解相关任务,包括基于图片的实体识别、知识问答、文案创作、拍照解题等方面,相比前一代模型全面提升。 | 最大输入8k 最大输出24k | |
| hunyuan-large-vision | 2025-05-26 | 此模型适用于图文理解场景,是基于混元Large训练的视觉语言大模型,支持任意分辨率多张图片+文本输入,生成文本内容,聚焦图文理解相关任务,在多语言图文理解能力上有显著提升。 | 最大输入8k 最大输出8k | |
| hunyuan-vision | 2025-01-03 | 混元最新多模态模型,支持图片+文本输入生成文本内容。 图片基础识别:对图片中主体、元素、场景等进行识别 图片内容创作:对图片进行概述、创作广告文案、朋友圈、诗词等 图片多轮对话:输出单张图片进行多轮交互问答 图片分析推理:对图片中逻辑关系、数学题、代码、图表进行统计分析 图片知识问答:对图片包含的知识点进行问答,例如历史事件、电影海报 图片 OCR:对自然生活场景、非自然场景的图片识别文字。 | 最大输入6k 最大输出16k |
混元生图
混元生图提供文生图 API 技术服务,基于混元文生图大模型,可结合输入的文本描述智能创作出与输入相关的图像内容,提供更高质量的图像创作、更强大的中文语义理解能力以及更广泛的应用场景。
模型类型 | 模型名称 | 版本更新时间 | 能力和特征 | 输入输出 | 相关文档 |
混元生图 | 混元生图 | 2024-09-11 | 输入 prompt 文本,生成图像。 prompt 扩写:支持 prompt 自动扩写优化。 绘画风格:支持18种预置风格选项 + prompt 自定义风格。 分辨率:支持8种分辨率。 生成数量:支持1 - 4张。 随机种子:支持随机种子生成或自定义固定种子生成。 | 最大输入1024字符文本 最大输出4张图片 | |
| 混元生图 (多轮对话) | 2024-08-28 | 输入 prompt 文本,生成图像,支持通过多轮对话的方式不断调整图像内容。 | 最大输入100轮对话文本 输出图片 | |
| 文生图轻量版 | 2024-07-15 | 输入 prompt 文本,生成图像,支持更轻量的同步请求方式和更高的性能。 | 最大输入256字符文本 输出图片 |
混元生3D
混元生3D 提供 API 技术服务,基于混元生3D 大模型,可结合输入的文本描述或者上传2D 图像快速生成高精度3D 模型,显著降低创作门槛,适用于游戏、影视、工业设计等领域,大幅提升效率。
模型类型 | 模型名称 | 版本更新时间 | 能力和特征 | 输入输出 | 相关文档 |
混元生3D | 混元生3D | 2025-03-11 | 支持根据文本描述或上传2D图像自动生成高精度3D 模型。 | 最大输入图分辨率5k 最大输入200个 utf-8 字符 输出 3D 模型 |
腾讯元器
腾讯元器平台是一款基于混元大模型开发的一站式智能体创作与分发平台,用户无需编程经验即可轻松创建属于自己的智能体。在这个平台上,用户可以通过描述来设定智能体的角色和流程,利用丰富的插件和知识库资源让智能体更加智能化。平台还提供基于 AI 大模型的智能对话功能,以及智能体商店,汇聚了众多富有创意和趣味性的智能体玩法,为用户带来全新的智能体验。