东汉末年
东汉末年

机器视觉 多模态学习11篇经典论文

2023-02-12 16:56:23

整理了 多模态学习的 11篇经典论文 相关解读和代码,整理自 李沐 机器学习 https://github.com/mli/paper-reading
CLIP 图片和文本之间的对比学习
CLIP 图片和文本之间的对比学习
2021openai
CLIP 论文解读
CLIP 论文解读
csdn
CLIP Github代码
CLIP Github代码
openaipytorch
ViLT 摆脱目标检测视觉文本模型
ViLT 摆脱目标检测视觉文本模型
视觉文本
ViLT 论文笔记
ViLT 论文笔记
csdn
ViLT Github代码
ViLT Github代码
ICML
ViLD CLIP蒸馏帮助开集目标检测
ViLD CLIP蒸馏帮助开集目标检测
CLIP蒸馏
ViLD 超越Supervised
ViLD 超越Supervised
知乎
ViLT Github代码
ViLT Github代码
tensorflowtpu
GLIP 联合目标检测和文本定位
GLIP 联合目标检测和文本定位
余志州 多模态论文阅读笔记
余志州  多模态论文阅读笔记
概览
GLIP 论文解读
GLIP 论文解读
GLIP Github代码
GLIP Github代码
微软
CLIP4Clip CLIP做视频文本检索
CLIP4Clip CLIP做视频文本检索
检索CLIP
CLIP4Clip 笔记
CLIP4Clip 笔记
CLIP4Clip Github
CLIP4Clip Github
ActionCLIP 多模态视频动作分类
ActionCLIP 多模态视频动作分类
对比学习多模态
ActionCLIP 解读
ActionCLIP 解读
浙大
ActionCLIP Github
ActionCLIP Github
pytorch
PointCLIP 3D变2D利用CLIP做点云
PointCLIP 3D变2D利用CLIP做点云
点云
PointCLIP 解读
PointCLIP 解读
PointCLIP Github
PointCLIP Github
LSeg 有监督的开集分割
LSeg 有监督的开集分割
开集分割
LSeg 解读
LSeg 解读
csdn
LSeg Github
LSeg Github
GroupViT图像文本对无监督做分割
GroupViT图像文本对无监督做分割
图像文本对分割
GroupViT 解读
GroupViT 解读
GroupViT Github
GroupViT Github
nvidiapytorch
CLIPasso CLIP跨界生成简笔画
CLIPasso CLIP跨界生成简笔画
简笔画
CLIPasso 解读
CLIPasso 解读
CLIPasso 项目主页
CLIPasso 项目主页
DepthCLIP 用文本跨界估计深度
DepthCLIP 用文本跨界估计深度
CLIP 改进工作串讲
CLIP 改进工作串讲
csdn
DepthCLIP Github
DepthCLIP Github

Comments

chat_bubble_outline

No comments yet, be the first to comment