阿里云第八代企业级实例g8i算力升级:整机性能提升85% AI推理最高提速7倍

2025-09-06 19:12:00
aiadmin
原创
183

1月11日,环球领先的云谋划厂商阿里云告示第八代企业级通用谋划实例ECS g8i算力再升级,邦内首发代号Emerald Rapids的第五代英特尔至强可扩展执掌器,依托阿里云自研的「飞天+CIPU」架构编制,ECS g8i实例的整机本能最高擢升85%,AI推理本能最高擢升7倍,可支持高达72B参数的大叙话模子,助助中小领域模子起筑本钱低落50%。同时新实例还供给了端到端安定防护,为企业修建可托AI操纵供给强有力的隐私加强算力支持。

阿里云弹性谋划产物线总司理张献涛吐露,“阿里云ECS g8i实例的强劲呈现,注明了以CPU为中央的谋划编制同样具备加快AI推理的浩大潜力,民众云不单可胜任超大领域的AI模子,也为AI操纵加快落地开垦了新途径。”

英特尔中邦数据中央和人工智能集团至强客户处理计划行状部总司理李亚东吐露:“最新上市的第五代英特尔至强? 可扩展执掌器每个内核均内置 AI 加快功效,齐备有技能执掌央求苛苛的 AI 处事负载。与上代比拟,其AI磨练本能擢升众达 29%,AI推理技能擢升高达 42%。咱们生气借由阿里云第八代企业级实例(ECS g8i)合伙助力斥地者告竣本领普惠,让 AI 本领无处不正在。”

动作企业级通用谋划实例,ECS g8i实例正在谋划、存储、搜集和安定等技能取得了全方位擢升。从闭头参数上看,ECS g8i实例的L3缓存容量擢升到320MB,内存速度高达5600MT/s,整机本能擢升85%,单核本能擢升25%;存储方面,ESSD云盘供给100万 IOPS,周详搭载NVMe,存储延迟低至百微秒;搜集方面,PPS高达3000万,标配阿里云自研eRDMA大领域加快技能,时延低至8微秒;安定方面,ECS g8i实例援手可托谋划与加密谋划等特点,环球率先援手机要虚拟机TDX本领,修建了周详的安定防护。

正在E2E场景下,ECS g8i实例可将MySQL本能擢升最高达60%,Redis和Nginx的本能阔别擢升40%和24%,面向逛戏、视频直播、电商、金融、医疗、企业任事等行业供给强劲的算力援手,餍足其正在数据库、大数据、AI推理等操纵场景下对本能的苛苛央求。

别的,ECS g8i实例还供给了众种硬件原生加快技能,包罗QAT和IAA等加快器。阿里云通过自研本领,将硬件加快技能更细颗粒度透传至实例虚拟机,小规格的ECS g8i实例也同样具备加快技能。个中,依托于QAT原生加解密加快器,ECS g8i实例正在压缩/解压缩场景下本能最大可擢升70倍,加解密本能擢升4倍以上。

天生式AI掀起的本领革命,正正在激动谋划范式发作根蒂性的转折。暂时,AI大模子推理正在算力上如故面对诸众寻事,比如首包延迟受限于并行执掌技能与浮点运算技能,模糊本能则受限于内存带宽和搜集延迟。

阿里云ECS g8i实例针对这些困难都举办了相当水准的优化,包罗内置指令集从AVX512升级到了Intel AMX高级矩阵扩展加快本领,可让天生式AI更速地运转。相关于AVX512指令集,启用AMX AI加快后,ECS g8i 实例正在int 8矩阵谋划的本能最高擢升7倍。

基于AMX AI加快技能,g8i可更敏捷地相应中小领域参数模子,运转学问检索、问答体系及摘要天生等AI处事负载时,起筑本钱比拟A10 GPU云任事器低重50%。别的,配合阿里云平台的Spot抢占式实例,本钱上风将进一步凸显,进一步低落AI推理本钱。

与此同时,基于自研eRDMA超低延时弹性搜集,阿里云g8i实例集群具有超低延时搜集和高弹性上风,可轻松支持72B参数级此外大叙话模子漫衍式推理,推理本能随集群领域亲近线batchsize的超大参数领域的AI模子负载,运转文生图、AI天生代码、虚拟助手以及创意辅助器材等AI处事负载。

以阿里云通义千问开源的Qwen-72B大模子为例,可正在g8i实例eRDMA搜集修建的集群告竣高效运转,正在输入小于500字境况下,首包延时小于3秒,每秒可天生7个Token。

安定方面,阿里云正在全产物线修建了端到端的安定防护,可保护数据存储、数据传输、数据谋划的全流程安定。正在最底层,基于CIPU的安定架构搭载安定芯片TPM动作硬件可托根,告竣任事器的可托启动,确保零窜改;虚拟化层面,援手虚拟可托技能vTPM,供给实例启动流程主旨组件的校验技能;正在实例可托的根本上援手区别平台的机要谋划技能,告竣了运转态的内存数据隔绝和加密的袒护。

值得一提的是,此次升级的ECS g8i实例全量援手Trust Domain Extension TDX 本领技能,生意操纵无需更改,即可安放到 TEE 之中,极大低落了本领门槛,并以极低的本能损耗为大模子等AI操纵供给隐私加强算力,护航大模子的云上数据安定。

以Qwen-Chat-7B模子为例,启用TDX后,既确保了模子推理的安定可托,也袒护了数据的机要性和完美性。

“阿里云将一直深耕本领、络续产物革新,为企业供给尤其稳固、强盛、安定、弹性的谋划任事,激动各行业的AI操纵进入全量发生期间。”张献涛吐露。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号