视频选集

数据中心动辄几千甚至上万张显卡,单卡的能力当然很重要,但是很多时候,决定一个数据中心的总体算力的关键,反倒在组织这么多显卡协作上。今天我们就来聊一聊,在 H20 也被禁运的当下,我们是如何高效利用现有算力,组团拼出“超级大脑”的?

【参考资料】
华为云发布CloudMatrix 384超节点 已通过昇腾云正式商用
Atlas 900 A3 SuperPoD超系欸但 产品文档
服务器互联,多GPU卡间互联通信怎么一回事? 神经蛙没头脑
GPU&CUDA多机通信 FelixFu520