集微网消息,谷歌公布了一系列新的人工智能技术和合作伙伴关系,旨在将更多不断发展的技术引入大型企业。谷歌还公开了定制人工智能芯片的新版本。
谷歌表示,Cloud TPU v5e现已推出预览版,并且是其内部张量(Tensor)处理单元的最新版本。谷歌表示,与2021年发布的TPU v4相比,对于大型语言模型和生成式AI模型,该芯片的每美元训练性能提升高达2倍,每美元推理性能提升高达2.5倍。TPU v5e的成本不到TPU v4的一半,使更多组织能够训练和部署更大、更复杂的AI模型。
谷歌称,“通过TPU v5e Pod平衡性能、灵活性和效率,允许最多256个芯片互连,总带宽超过400Tb/s和INT8性能达到100 petaOps。”
谷歌博客表示,新的TPU将提供八种不同的虚拟机配置,从一个TPU芯片到单个切片内超过250个TPU芯片。对于需要更多计算的客户,该公司正在推出“Multislice”,这是一种将模型交给数万个TPU芯片计算的服务。
“到目前为止,使用TPU的训练作业仅限于单个TPU芯片切片,TPU v4的最大作业切片大小为3072个芯片。”
“借助Multislice,开发人员可以在单个Pod内通过芯片间互连(ICI)或通过数据中心网络(DCN)跨多个Pod将工作负载扩展到数万个芯片。”
除了新的TPU之外,谷歌还表示,A3虚拟机(VM)将于9月全面上市,配备8个英伟达H100 GPU、双路第四代Intel Xeon可扩展处理器和2TB内存。这些实例最初于今年5月宣布,可以增加到26000个英伟达H100 Hopper GPU。但鉴于GPU持续短缺,目前尚不清楚谷歌将拥有多少个H100。
谷歌表示,生成式人工智能初创公司Anthropic是新TPU v5e和A3 VM的早期用户。虽然谷歌向这家初创公司投资了3亿美元,但它也是亚马逊AWS的忠实用户。
(校对/张杰)