视频选集

在本视频中,我将解释Kolmogorov-Arnold网络,这是一种在Liu等人论文《KAN: Kolmogorov-Arnold Networks》中提出的新型网络。
我会从回顾多层感知器开始,以展示神经网络中典型线性层的工作原理。然后,我将介绍数据拟合的概念,这是理解贝塞尔曲线和B样条所必需的。
在介绍Kolmogorov-Arnold网络之前,我还将解释神经网络的通用逼近定理以及它的等价形式Kolmogorov-Arnold表示定理。
在视频的最后部分,我将通过逐步推导Kolmogorov-Arnold表示定理的公式来解释这种新型网络的结构,同时与多层感知器进行比较。
我们还将探讨这种网络的一些特性,例如易于解释性和持续学习的可能性。
论文链接: https://arxiv.org/abs/2404.19756
幻灯片PDF: https://github.com/hkproj/kan-notes
章节
00:00:00 - 引言
00:01:10 - 多层感知器
00:11:08 - 数据拟合简介
00:15:36 - 贝塞尔曲线
00:28:12 - B样条
00:40:42 - 通用逼近定理
00:45:10 - Kolmogorov-Arnold表示定理
00:46:17 - Kolmogorov-Arnold网络
00:51:55 - MLP与KAN的比较
00:55:20 - 可学习函数
00:58:06 - 参数数量
01:00:44 - 网格扩展
01:03:37 - 可解释性
01:10:42 - 持续学习