新闻详细
新闻当前位置:新闻详细

马斯克最强人工智能来了:拥有10万个H100 GPU

转载:https://ai.zol.com.cn/886/8864024.html

2024-07-23 11:01:46·[??中关村在线 原创??]·作者:海是天的倒影

7月23日,马斯克在孟菲斯超级计算机集群(Memphis Supercluster)的训练工作开始后不久,发表了一份声明。这个超级集群由10万个英伟达H100 GPU组成,并使用液冷散热和单一的RDMA网络互连架构,被认为是全世界最强大的AI训练集群之一。

从GPU规模来看,该集群已经全面超越了最新Top500榜单上的任何一台超级计算机,包括世界上最强的Frontier(拥有37888个AMD GPU)、Aurora(拥有60000个Intel GPU)和微软Eagle(拥有14400个Nvidia H100 GPU)。马斯克透露,他的目标是在今年12月之前训练出世界上最强大的人工智能(Grok3),而孟菲斯超级计算机集群则是实现这一目标的重要优势。

在今年3月敲定协议后,“超级计算机工厂”几乎是立即开工。上个月,经济发展组织大孟菲斯商会也证实了马斯克旗下xAI全新“超级计算机工厂”的筹备工作正在有序进行。

为了达成这项协议,xAI已口头承诺改善孟菲斯的公共基础设施,以支持数据中心的发展,包括建设一个新的变电站和一个污水处理设施。据估计,孟菲斯工厂每小时可能使用高达150兆瓦的电力,相当于10万户家庭所需电量;而xAI预计每天至少需要100万加仑的散热水。

尽管如此,在孟菲斯市议会中仍有人对这项工作表示担忧。上周,市议会议员Pearl Walker表示:“民众很害怕。他们担心水资源可能出现问题,也担心能源供应出现问题。”

事实上,早在5月份,xAI就宣布获得了60亿美元(约437.14亿元人民币)的资金用于AI开发。该公司目前为其孟菲斯超级计算站点发布了六个招聘信息,职位包括光纤工头、网络工程师和项目经理等。

Copyright2023流翼科技