东汉末年

东汉末年

机器视觉多模态学习11篇经典论文

2023-02-12 16:56:23

整理了多模态学习的 11篇经典论文相关解读和代码，整理自李沐机器学习 https://github.com/mli/paper-reading

CLIP 图片和文本之间的对比学习

CLIP 图片和文本之间的对比学习

2021openai

CLIP 论文解读

CLIP 论文解读

csdn

CLIP Github代码

CLIP Github代码

openaipytorch

ViLT 摆脱目标检测视觉文本模型

ViLT 摆脱目标检测视觉文本模型

视觉文本

ViLT 论文笔记

ViLT 论文笔记

csdn

ViLT Github代码

ViLT Github代码

ICML

ViLD CLIP蒸馏帮助开集目标检测

ViLD CLIP蒸馏帮助开集目标检测

CLIP蒸馏

ViLD 超越Supervised

ViLD 超越Supervised

知乎

ViLT Github代码

ViLT Github代码

tensorflowtpu

GLIP 联合目标检测和文本定位

GLIP 联合目标检测和文本定位

余志州多模态论文阅读笔记

余志州多模态论文阅读笔记

概览

GLIP 论文解读

GLIP 论文解读

GLIP Github代码

GLIP Github代码

微软

CLIP4Clip CLIP做视频文本检索

CLIP4Clip CLIP做视频文本检索

检索CLIP

CLIP4Clip 笔记

CLIP4Clip 笔记

CLIP4Clip Github

CLIP4Clip Github

ActionCLIP 多模态视频动作分类

ActionCLIP 多模态视频动作分类

对比学习多模态

ActionCLIP 解读

ActionCLIP 解读

浙大

ActionCLIP Github

ActionCLIP Github

pytorch

PointCLIP 3D变2D利用CLIP做点云

PointCLIP 3D变2D利用CLIP做点云

点云

PointCLIP 解读

PointCLIP 解读

PointCLIP Github

PointCLIP Github

LSeg 有监督的开集分割

LSeg 有监督的开集分割

开集分割

LSeg 解读

LSeg 解读

csdn

LSeg Github

LSeg Github

GroupViT图像文本对无监督做分割

GroupViT图像文本对无监督做分割

图像文本对分割

GroupViT 解读

GroupViT 解读

GroupViT Github

GroupViT Github

nvidiapytorch

CLIPasso CLIP跨界生成简笔画

CLIPasso CLIP跨界生成简笔画

简笔画

CLIPasso 解读

CLIPasso 解读

CLIPasso 项目主页

CLIPasso 项目主页

DepthCLIP 用文本跨界估计深度

DepthCLIP 用文本跨界估计深度

CLIP 改进工作串讲

CLIP 改进工作串讲

csdn

DepthCLIP Github

DepthCLIP Github

Comments

chat_bubble_outline

No comments yet, be the first to comment