精诚制造 匠心未来
— 温度控制设备行业标准制定者 —
座机:0755-27398559
手机:13510663356
邮箱:yixianglzw@163.com
浪潮信息推出元脑R1推理服务器单机可开释DeepSeek 671B强壮模力
时间:2025-03-20 23:04:14 |   作者: 米乐体育直播视频在线观看

  2月11日,浪潮信息正式推出元脑R1推理服务器,经过体系立异和软硬协同优化,单机即可布置运转DeepSeek R1 671B模型,协助客户显着下降DeepSeek R1全参数模型的布置难度及本钱,并提高推理服务功能,加快千行百业探究智能出现。

  当时,DeepSeek开源多版别模型,助力各行业加快使用大模型技能推进事务晋级转型。其间,DeepSeek R1 671B模型作为全参数根底大模型,比较蒸馏模型具有更强的泛化才能、更高的准确性和更好的上下文理解才能,但也对体系显存容量、显存带宽、互连带宽和推迟提出了更高要求:在FP8精度下至少需求约800GB显存承载,FP16/BF16精度下需求1.4TB以上的显存空间;此外,DeepSeek R1是典型的长思想链模型,具有短输入、长输出的使用特色,推理解码阶段依靠更高的显存带宽和极低的通讯推迟。面向671B模型的算力特征和体系需求,元脑R1推理服务器供给抢先的显存容量、显存带宽和通讯速度,可以助力企业高效完结DeepSeek全参数模型的本地化布置。

  元脑R1推理服务器NF5688G7是抢先的高算效AI核算渠道,原生搭载FP8核算引擎,针对DeepSeek R1 671B模型布置速度快且无精度丢失。在显存方面,供给1128GB HBM3e高速显存,满意671B模型 FP8精度下不低于800GB显存容量的需求,单机支撑全量模型推理情况下,仍保存足够的KV缓存空间。显存带宽高达4.8TB/s,完美符合DeepSeek R1模型”短输入长输出、显存带宽灵敏”的技能特征,在推理解码阶段可完成极致加快。在通讯方面,GPU P2P带宽达900GB/s,保证单机布置张量并行最佳通讯功能,根据最新推理结构单机可支撑20-30用户并发。一起,单台NF5688G7装备3200Gbps无损扩展网络,可依照每个用户事务需求量开端上涨完成灵敏扩展,供给老练的R1服务器集群Turnkey解决计划。

  元脑R1推理服务器NF5868G8是专为大推理模型(Large Reasoning Model)立异规划的高吞吐推理服务器,业界初次完成单机支撑16张规范PCIe双宽卡,供给高达1536GB显存容量,支撑在FP16/BF16精度下单机布置DeepSeek 671B模型。立异研制根据PCIe Fabric的16卡全互连拓扑,恣意两卡P2P通讯带宽可达128GB/s,下降通讯推迟超60%。经过软硬协同优化,相较传统2机8卡PCIe机型,NF5868G8可将DeepSeek 671B模型推理功能提高近40%,现在已支撑多元AI加快卡选配。

  浪潮信息是全球抢先的IT根底设施产品、计划和服务供给商,经过开展新一代以体系为中心的核算架构,打造敞开、多元、绿色的元脑智算产品和计划。浪潮信息致力于AI核算渠道、资源渠道和算法渠道的研制立异,并经过元脑生态携手抢先同伴,加快人工智能的立异和使用落地。