视频选集

第五课介绍了GPU的工作原理以及如何针对其特性优化深度学习工作负载,特别是语言模型。

对比CPU和GPU的设计哲学与架构差异,并深入解析GPU的内部构造和工作模式,之后简要介绍了TPU。

接着介绍GPU性能优化技巧 (六大秘技)

之后讲性能曲线

最后用flash attention 1/2结尾。