随着惠普企业公司(Hewlett Packard Enterprise)和戴尔科技公司(Dell Technologies)双双推出面向大型语言模型(LLM)训练的新型服务器,人工智能的发展仍在继续。
HPE 新推出的 HPE ProLiant Compute XD685 使用 AMD 最新推出的第五代 Epyc 处理器和 Instinct MI325X 加速器,支持自然语言处理、LLM 和多模式 AI 训练。XD685 采用模块化 5U 机箱,支持多种 GPU 和 CPU 组合,并提供风冷和直接液冷两种冷却方式。它支持多达 8 个 Instinct MI325X 加速器,内存带宽为 6 Tbps。
Instinct GPU 采用 HBM3E 共享内存,因此所有显卡都显示为一个大内存池。这意味着需要更少的显卡就能达到相同的性能水平,从而降低了总拥有成本。
XD685 的另一个优势是其由 HPE Services 提供的用于建立大型人工智能集群的服务套件。这包括配置、验证和测试协助,以缩短部署时间。通过 HPE Integrated Lights-Out (iLO) 技术提供安全性,将生产级安全性嵌入到芯片中。
HPE ProLiant Compute XD685 可通过 HPE 订购,并将于 2025 年第一季度全面上市。
与此同时,戴尔科技继续扩大其广泛的生成式人工智能解决方案组合,在戴尔人工智能工厂旗下推出了一系列产品。
首先是一系列新的 PowerEdge 服务器。PowerEdge XE9712 为大规模人工智能部署的 LLM 训练和实时推理提供高性能、高密度的加速。它采用 Nvidia 的 GB200 NVL72,在机架式设计中最多可配备 36 个 NVIDIA Grace CPU 和 72 个 NVIDIA Blackwell GPU。72 个 GPU 通过 NVLink 域连接,作为单个 GPU,可实现高达 30 倍速度的实时万亿参数 LLM 推理。
戴尔表示,戴尔PowerEdge M7725专为高性能密集计算而设计,是研究、政府、金融科技和高等教育环境的理想选择。戴尔PowerEdge M7725每个机架有24K-27K个内核,使用第五代AMD Epyc处理器,有64或72个双插槽节点。它采用直接液冷和风冷两种冷却方式。
除计算外,戴尔还通过其PowerScale存储设备提供非结构化存储和数据管理,以提高人工智能应用性能,并提供简化的全球数据管理。
新的PowerScale具有更快的元数据和戴尔数据Lakehouse发现功能,而新的61TB硬盘提高了容量和效率,并将数据中心的存储占用空间减少了一半。PowerScale 还增加了 InfiniBand 功能和 200GbE 以太网适配器支持,吞吐量最高可提高 63%。
为了安装所有这些硬件,戴尔推出了集成机架 7000 (IR7000),通过更高的密度、更可持续的电源管理和先进的冷却技术来满足加速计算的需求。它基于开放计算项目 (OCP) 标准。
IR7000 机架专为液体冷却而设计,能够为未来高达 480 千瓦的部署提供冷却。据戴尔公司称,它能够捕获近100%的热量。它支持戴尔和现成的网络,是一个即插即用的集成机架系统。
下一条: 全球网络安全人才缺口扩大