当前位置: 首页 > 新闻中心

腾讯大动作!

[发布时间:2025-07-04 13:24:35] 来源:188体育官网登陆 阅读:1 次

  【导读】腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解

  6月27日,腾讯混元开源的首款混合推理MoE模型Hunyuan-A13B发布,该模型是业界首个13B级别的MoE开源混合推理模型,其效果比肩同等架构领先开源模型。

  开源模型灵活性、透明度和成本优势,为AI产业发展带来新机遇。今年年初DeepSeek出圈后,腾讯、阿里、字节等头部网络公司旗下大模型开源悄然加速。

  腾讯混元宣布开源首个混合推理MoE模型Hunyuan-A13B,总参数80B,激活参数仅13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高,这在某种程度上预示着,开发的人能用更低门槛的方式获得更好的模型能力。

  即日起,模型已经在Github和Huggingface等开源社区上线,同时模型API也在腾讯云官网正式上线,支持快速接入部署。

  据了解,这是业界首个13B级别的MoE开源混合推理模型,基于先进的模型架构,Hunyuan-A13B表现出强大的通用能力,在多个业内权威数据测试集上获得好成绩,并且在Agent工具调用和长文能力上有突出表现。

  *加粗为最高分,下划线表示第二名,数据来源于模型各个公开的测试数据集得分

  在实际使用场景中,Hunyuan-A13B模型能够准确的通过需要选择思考模式。快思考模式提供简洁、高效的输出;慢思考则涉及更深、更全面的推理步骤,如反思和回溯。

  Hunyuan-A13B模型对个人开发者较为友好,在严格条件下,只需要1张中低端GPU卡即可部署。目前,Hunyuan-A13B已经融入开源主流推理框架生态,无损支持多种量化格式,在相同输入输出规模上,整体吞吐量是前沿开源模型的2倍以上。

  Hunyuan-A13B集合了腾讯混元在模型预训练、后训练等多个环节的创新技术,这些技术共同增强了其推理性能、灵活性和推理效率。

  腾讯方面有关人员表示,Hunyuan-A13B模型是腾讯内部应用和调用量最大的大语言模型之一,有400+业务用于精调或者直接调用,日均请求超1.3亿次。

  本次进行升级更新并对外开源,是继混元Large后混元大语言模型推出的又一重要开源模型,其参数更小,但是性能和效果实现了大幅的提升。接下来,腾讯混元将推出更多尺寸、更多特色的模型,将更多实践技术与社区共享,促进大模型开源生态的繁荣。

  2024年大模型从科技前沿走向大众视野,2025年DeepSeek火爆出圈,开源正在成为国内外众多大模型的“必选项”。

  据不完全统计,仅今年3月至今,OpenAI、谷歌、Meta、英伟达、阿里、DeepSeek、智谱AI、群核科技、阶跃星辰等全球多家科技巨头已密集发布超10款开源大模型。

  与此同时,开源模型性能持续突破,AI开源社区Hugging Face的模型榜单不断被刷新。无论是科技巨头,还是初创企业,都在加快步伐拥抱开源浪潮。共享最新前沿技术成果的同时,这一些企业也在致力于降低算力成本。

  就国内而言,字节跳动豆包、昆仑万维、百度文心、阿里通义千问等今年均推出开源模型。当前,头部网络公司旗下大模型开源仍在加速。

  5月30日凌晨,阿里巴巴开源了创新自主搜索AI Agent——WebAgent。WebAgent具备端到端的自主信息检索与多步推理能力,就像人类一样在网络环境中主动感知、决策和行动,例如,当用户想了解某个特定领域的最新研究成果时,WebAgent能够主动搜索多个学术数据库,筛选出最相关的文献,并按照每个用户的需求来做深入分析和总结。

  字节跳动Seed团队也有新动作,发布并开源了多模态基础模型BAGEL,该模型拥有70亿个活跃参数,总参数达140亿个。BAGEL集视觉理解、文生图、图像编辑于一体,在标准多模态理解基准测试中表现出色,优于现有顶级开源视觉语言模型如Qwen2.5-VL和InternVL-2.5。

  麦肯锡公司联合Mozilla基金会、Patrick J.McGovern基金会发布的《AI时代的开源技术》报告数据显示,全球超过50%的企业已在数据、模型及工具层面采用开源AI技术。

  开源模型通过提供高质量的模型权重和训练代码,支持模型的预训练、微调和定制,助力科创企业基于现有的强大模型进行快速开发,避免了从头开始构建AI系统的高昂成本。企业可依据业务所需灵活调用模型组件、算法框架和推理引擎,实现从“重资产开发”到“轻量化集成”的转型路径,大幅度降低了创新门槛和试错成本。

  据了解,未来混元计划推出多尺寸混合推理模型,从0.5B到32B的Dense模型,以及多个MoE模型,适配企业与端侧不一样的需求,混元图像、视频、3D等多模态基础模型及配套插件模型也将持续开源。

首页
一键拨号
联系我们