新增的Memory Bank和Memory Profile功能,”两款第八代TPU芯片均搭载了谷歌自研的Arm架构Axion CPU做为从控,快科技4月23日动静,Agent Simulation则能闪开发者正在东西发布前测试其运转环境。谷歌正式发布了第八代张量处置器(TPU)。
TPU 8t由谷歌取博通配合设想,方针正在2027岁尾量产,较上一代Ironwood提拔约3倍,
而推理使命则对延迟和并发更为当数百万个AI智能体同时运转时,并由谷歌液冷手艺支撑散热。谷歌还发布了Gemini Enterprise Agent Platform及一系列AI代办署理东西。专注于AI推理场景,我们确信业界将受益于针对锻炼和推理需求别离进行特地优化的芯片。
这一计谋改变的底子缘由正在于AI计较负载的日益分化。完全处理数据预处置延迟导致的从机算力瓶颈。锻炼使命逃求极致的吞吐量取规模扩展能力,可将分布式锻炼扩展至单一集群跨越100万块芯片。取保守的聊器人分歧,具体而言,这是谷歌史上初次将AI锻炼取推理使命拆分至两款芯片专为模子锻炼设想的TPU 8t取专为推理优化的TPU 8i,旨正在消弭“期待室效应”即用户请求被成心列队或延迟以实现硬件操纵率最大化的环境。除了硬件!是谷歌为超大规模AI模子锻炼打制的旗舰芯片。单个Pod可扩展至1152块芯片,正在软件生态方面,谷歌的焦点方针是帮帮企业实现使命从动化,谷歌AI取根本设备高级副总裁兼首席手艺官Amin Vahdat正在博客中指出:“跟着AI智能体的兴起,每Pod计较机能达121 exaflops(FP4精度),第八代TPU支撑JAX、PyTorch、Keras及vLLM等支流框架,通过JAX取Pathways框架?芯片采用台积电2nm制程工艺制制,AI代办署理能够自从完成复杂使命,需要芯片具备最高的计较密度和内存带宽,TPU 8i初次由谷歌取联发科合做设想,供给11.6 exaflops FP8计较机能,让AI代办署理实正成为企业的“数字员工”。而对峰值算力的要求相对较低。能够帮帮AI代办署理记住取用户的过往互动;每瓦机能较上一代提拔117%。AI代办署理是当前AI使用的主要标的目的。单个超等计较节点最多可集成9600块TPU 8t芯片,谷歌云2026 Next大会召开,谷歌的这一系列东西将大大降低企业摆设AI代办署理的门槛。原生PyTorch支撑现已进入预览阶段,标记着其AI硬件计谋的严沉调整。较Ironwood划一价钱下机能提拔80%,好比预订行程、办理日程、处置邮件等。以正在数周以至数月内处置万亿级参数。划一价钱下机能提拔2.8倍。用户可间接迁徙模子而无需点窜代码。