
东汉末年
机器视觉 多模态学习11篇经典论文
2023-02-12 16:56:23
整理了 多模态学习的 11篇经典论文 相关解读和代码,整理自 李沐 机器学习 https://github.com/mli/paper-reading
CLIP 图片和文本之间的对比学习

2021openai
CLIP 论文解读

csdn
CLIP Github代码

openaipytorch
ViLT 摆脱目标检测视觉文本模型

视觉文本
ViLT 论文笔记

csdn
ViLT Github代码

ICML
ViLD CLIP蒸馏帮助开集目标检测

CLIP蒸馏
ViLD 超越Supervised

知乎
ViLT Github代码

tensorflowtpu
GLIP 联合目标检测和文本定位

余志州 多模态论文阅读笔记

概览
GLIP 论文解读

GLIP Github代码

微软
CLIP4Clip CLIP做视频文本检索

检索CLIP
CLIP4Clip 笔记

CLIP4Clip Github

ActionCLIP 多模态视频动作分类

对比学习多模态
ActionCLIP 解读

浙大
ActionCLIP Github

pytorch
PointCLIP 3D变2D利用CLIP做点云

点云
PointCLIP 解读

PointCLIP Github

LSeg 有监督的开集分割

开集分割
LSeg 解读

csdn
LSeg Github

GroupViT图像文本对无监督做分割

图像文本对分割
GroupViT 解读

GroupViT Github

nvidiapytorch
CLIPasso CLIP跨界生成简笔画

简笔画
CLIPasso 解读

CLIPasso 项目主页

DepthCLIP 用文本跨界估计深度

CLIP 改进工作串讲

csdn
DepthCLIP Github

Comments
No comments yet, be the first to comment