视频选集

这是长期更新的多模态论文集专栏。
本期视频解读的是VLMO: Unified Vision-Language Pre-Training with Mixture-of-Modality-Experts
更多技术内容详见个人博客:www.gnn.club
本视频的配套博文地址:https://www.gnn.club/?p=3039