浪潮云率先发布671B DeepSeek大模型一体机解决方案

发布时间

2025-02-07

产品发布

近日，DeepSeek凭借其低成本、高性能的大模型研发成果，迅速引发了全球科技界的关注。浪潮云联合沐曦股份、铨兴科技等生态伙伴，发布预置DeepSeek-R1和DeepSeek-V3模型的海若一体机，率先实现671B DeepSeek大模型国产GPU单机推理服务，为行业客户提供大模型智能应用落地的一体化解决方案。

一站式大模型交付，开启行业智能新篇

为解决行业大模型落地面临的算力多样适配难、数据不出域、模型微调效率低、推理服务性能差、模型服务交付慢等问题，海若一体机通过优化算法框架和加速库、软硬全栈调优等方式，提供模型微调、模型推理、智能体编排、智能体应用等服务，以完备的方案为行业客户提供大模型场景化应用一站式交付。

海若一体机产品能力全景图

开箱即用：海若一体机提供从算力、平台、大模型到应用的一体化交付方案，能够实现1－３天完成整体交付，开箱即用。

推理优化：海若一体机量身定制了极致优化的推理加速方案,基于软硬件融合调优，大模型的推理性能可大幅提升，解码生成速度提升185.7%，平均首字时延降低55.9%。

安全增强：具备知识库细粒度权限管控能力，提供私有化部署方案，防止数据泄露，支持模型输入输出安全检测，保证内容合法合规。

开放兼容：支持浪潮海若、DeepSeek、GPT-4、通义千问等主流大模型；支持EmBedding、ReRanker、ASR、TTS多类型；内置模型池适配沐曦、昇腾等多种芯片，根据场景、性能、预算灵活选择。

规格多样：启航版、进阶版、旗舰版等多种规格，可根据模型参数和应用规模灵活选择。

全栈产品矩阵，精准匹配算力需求

面向行业客户的多样场景需求，海若一体机推出三种规格，提供DeepSeek从671B到1.5B多种参数的预置大模型，用户可根据业务场景灵活选型，实现精度与效率的最佳平衡。浪潮云联合铨兴科技研发高显存的海若一体机，支持单机部署DeepSeek 671B参数大模型，释放极致性能。

接入DeepSeek系列模型，赋能智能体开发

目前，海若AgentOS已正式上架DeepSeek-R1和DeepSeek-V3模型。此次接入的模型已全面融合海若推理链路，集成海若独家内容安全模块，实现模型安全增强与企业级高可用保障，同时支持完善的日志分析和告警，助力用户安全稳定地构建智能体应用。AgentOS平台致力于为用户提供全流程、一站式的智能体开发服务，平台支持接入各类大语言模型，支持模型的一键部署，并具备模型管理和监控能力，大大降低了用户在模型管理上的技术门槛和时间成本。同时，平台提供知识库管理、可视化工作流编排和丰富的工具组件，结合模型实现生产级智能体开发，简化模型开发流程，将为开发者和行业用户带来更快、更高效、更便捷的智能体开发和应用体验。

当前，智能体已成为新型应用生态的关键入口。海若一体机作为大模型生产力平台，将助力客户管理模型、智能体、私域知识库等大模型资产，推动行业智能化升级，重塑大模型落地行业格局，引领智能经济新时代。

浪潮云率先发布671B DeepSeek大模型一体机解决方案

新闻推荐