CS Notes

Home

❯

AI

❯

LVLM

❯

VLM

VLM

2026年3月20日1分钟阅读

计算机视觉任务

任务图像分类 目标检测 语义分割 深度估计 表面法线估计 基于分割的图像生成图像修复 姿态估计 关系检测 图像描述 视觉问答 指代表达 情境识别 基于文本的图像生成 视觉常识 上下文分类区域标注 GLUE基准任务 阅读理解 自然语言推理 基于情境的常识推理

论文

Vision Transformer (ViT)

CLIP OpenCLIP

BEiT

IBOT

dino DINOv2- Learning Robust Visual Features without Supervision


关系图谱

  • 计算机视觉任务
  • 论文

Created with Quartz v1.0.0 © 2026

  • GitHub