万亿参数!元脑企智一体机率先支持Kimi K2大模型
发布时间 2025-07-22 11:21 转载:美通社 阅读 3048次

北京2025年7月21日 /美通社/ -- 浪潮信息宣布元脑企智一体机已率先完成对Kimi K2 万亿参数大模型的适配支持,并实现单用户70 tokens/s的流畅输出速度,为企业客户高效部署应用大模型提供高处理性能和完善的软件工具平台支持。


Kimi K2是月之暗面推出的开源万亿参数大模型,创新使用了MuonClip优化器进行训练,大幅提升了模型的学习效率。K2在代码生成、数学推理、Agent多步骤任务上展现出领先能力,评测指标达到业界领先水平。自发布以来,K2在开发者和研究社区引起广泛关注,迅速获得在编码辅助和Agent驱动自动化任务中的部署应用。

Kimi K2的模型总参数量达1万亿,激活参数为320亿。K2使用混合专家(MoE)模型结构,较DeepSeek V3采用了更大的参数量和更多的专家数。K2模型1万亿的参数量对AI计算系统提出至少1TB的显存容量需求,384个路由专家所带来的专家负载不均衡性对推理速度有很大影响。目前业界可公开访问的K2 API的输出速度一般低于20 tokens/s,这样较低的性能对于编程或Agent类场景很不友好,会严重影响用户体验。Kimi K2凭借其为智能体任务设计的架构和优秀的智能体验,展现出巨大的应用潜力,但提升推理速度和输出稳定性是其成为可信赖的生产力工具需要解决的核心挑战。

元脑企智一体机采用元脑服务器NF5688G7作为算力底座,其搭载FP8计算引擎,配备1128GB HBM3e高速显存,单台服务器即可支持K2 万亿参数全量模型部署。NF5688G7服务器具备900GB/s的GPU P2P带宽,为Kimi K2提供了专家间高速并行通信,最大化并行效率。该服务器可支持3200Gbps的RDMA扩展网络,为预填充-解码分离部署和大规模专家并行预留了充足的扩展空间。

浪潮信息已完成元脑企智一体机对K2的适配,支持64K上下文长度和多路用户实时并发访问。基于SGLang推理框架,通过减少MoE对齐块大小内核的小批量模式开销和fused_moe的内存消耗,并复用deepGEMM等高效算子,实现单用户并发下输出速度超过70 tokens/s,25用户并发时每用户输出速度超过25 tokens/s。优化后的计算性能可保证用户在进行复杂的代码生成、长文本书写或Agent调用时,能够获得流畅、低延迟的交互体验。

SGLang启动K2推理服务,用户交互时的解码速度
SGLang启动K2推理服务,用户交互时的解码速度

元脑企智一体机提供了元脑企智(EPAI)平台与K2大模型的无缝集成,为企业用户提供了一套软硬件协同优化、开箱即用的端到端大模型私有化部署解决方案。通过元脑企智平台,企业可利用低代码、可视化界面,便捷地进行数据准备、模型微调、知识检索(RAG)和智能体(Agent)构建。

元脑企智一体机已成功部署于金融、制造、能源、医疗等多个关键行业,帮助企业快速、安全、经济地构建专属大模型应用,加速产业智能化转型步伐。

浪潮信息是全球领先的IT基础设施产品、方案和服务提供商,通过发展新一代以系统为核心的计算架构,打造开放、多元、绿色的元脑智算产品和方案。浪潮信息致力于AI计算平台、资源平台和算法平台的研发创新,并通过元脑生态携手领先伙伴,加速人工智能的创新和应用落地。

 

消息来源:浪潮信息

【媒体发稿、商务合作联系:heisceo(微信)】

5G应用蓬勃发展创造新增长点[原文链接]
大脑芯片技术重塑人机融合新范式 [原文链接]
2024年我国AI产业规模突破7000亿元[原文链接]
从“月壤砖”到“月球房”,还需这三步 [原文链接]
绿色算力“算”出发展新机遇[原文链接]
每周精选查看更多 >
美国副总统《乡下人的悲歌》:我们最大的敌人是自欺欺人
美国副总统《乡下人的悲歌》:我们最大的敌人是自欺欺人
《乡下人的悲歌》是J.D.万斯通过个人成长经历对当代美国工人阶级白人群体困境的深刻反思。这部作品的核心并非仅仅讲述一个“逆袭”故事,而是以自传为框架,剖析一个群体在现代化进程中遭遇的文化断裂、经济衰败与精神迷... [详细]
王阳明思想与草根创业者
王阳明思想与草根创业者
这种思维模式能让创业者在资源约束下,将“匮乏”转化为“专注优势”,用认知升维突破物理局限。王阳明思想的真正力量,在于教会创业者:最大的资源不在银行账户,而在心智模式的升级。... [详细]
希鸥网观点:创业公司团队如何管理更有效率?
希鸥网观点:创业公司团队如何管理更有效率?
当团队中出现冲突或挑战时,积极介入并提供协助和支持。促进团队成员之间的沟通和解决问题的能力,以保持团队的凝聚力和效率。 [详细]
想升职加薪?拿着超4亿年薪的CEO给了20条建议
想升职加薪?拿着超4亿年薪的CEO给了20条建议
我们熟知的“迪士尼”,全称是华特迪士尼公司(英文简称:DISNEY),作为一家市值超过2万亿人民币(3103亿美金)的大型企业,迪士尼最为国人所熟悉的是其位于上海的迪士尼乐园和电影屏幕上的公主系列大电影,但这些只是迪士尼公司的一... [详细]
如果最近你创业不顺,不妨读一读段永平这100句话
如果最近你创业不顺,不妨读一读段永平这100句话
上市后,拼多多市值一度超过京东,在所有中国互联网企业中排名第四。因此,其“80后”CEO黄峥也被人们戏称为“杭州80后新首富”、“抛弃你的同龄人。... [详细]