fly away, chase dream
ML、CV、Image process

  • about
  • blog
  • leetcode
  • life📚
  • links
  • wiki

ViLD(Vision and Language knowledge Distillation): 基于视觉和语言模型的zero shot 目标检测

ViLD(Vision and Language knowledge Distillation): 基于视觉和语言模型的zero shot 目标检测

2022-01-25
计算机视觉, 论文阅读
对于常用的目标检测而言,测试集和训练集的类别时保持一致的,即我们想要检测什么,那么训练集就有该类别的数据. 对于zero-shot 即测试集的出
Read more…
谷歌Detic: 结合分类数据集进行目标检测模型训练

谷歌Detic: 结合分类数据集进行目标检测模型训练

2022-01-22
计算机视觉, 论文阅读
论文三连问 论文做了什么:使用分类数据集来训练检测模型的分类器,使检测器可以识别出上万的类别 论文怎么做的:对于检测标注格式的数据和分类标注格式
Read more…
对比学习之SimCLR与MoCo小记

对比学习之SimCLR与MoCo小记

2022-01-11
计算机视觉, 论文阅读
SimCLR 与 MOCO 都是采用自监督、对比学习的形式来训练视觉模型。因为对于主流的CNN网络,模型训练都依赖于人工标注,但是人工标注成本太大,我们能使用的标
Read more…
Masked Autoencoders Are Scalable Vision Learners小记

Masked Autoencoders Are Scalable Vision Learners小记

2022-01-03
计算机视觉, 论文阅读
读前三问 论文做了什么:论文以自监督的形式来训练自动编码器用来提取特征,实现无标注的预训练 怎么做的:对输入图片进行mask,采用编码器-解码器
Read more…
Yolox阅读笔记

Yolox阅读笔记

2021-10-08
计算机视觉, 论文阅读
yolox 是旷世今年推出的一个新的YOLO检测器技术报告,核心是将YOLO与anchor free方式实现,性能超过了之前的YOLO系列。此笔记记录Y
Read more…
Ppyolov2 笔记

Ppyolov2 笔记

2021-05-19
计算机视觉, 论文阅读
PP-YOLOv2 是百度对于ppyolo-v1 的升级版,主要是引入了各种插件来提升性能。如下图,ppyolov2 在相同的map下能达到更高的FPS. PPyolo-v2 的改进
Read more…
Vision Transformer 笔记

Vision Transformer 笔记

2021-03-06
计算机视觉, 论文阅读
本文主要从代码角度记录使用transformer实现图像分类的流程. 代码vit-pytorch/ 总体结构 结合上图与代码展开: 前向传播过程代码
Read more…
CBAM注意力模块: Convolutional Block Attention Module

CBAM注意力模块: Convolutional Block Attention Module

2020-05-11
计算机视觉, 论文阅读
之前谈过SE-net, 对于目标检测或检测用于特征通道的attention, 今天记录一下CBAM模块, 对分类或检测中用来获取通道、空间位置的a
Read more…
Image Caption模型

Image Caption模型

2020-05-03
计算机视觉, 自然语言处理, 论文阅读
图像描述生成作为结合CV与NLP的跨模态学习任务, 在人工智能领域也是热门的研究点. 模型 Image caption 是在给定照片的情况下生成人类可读的文字描述的具有挑
Read more…
YOLOv4: Optimal Speed and Accuracy of Object Detection论文解读

YOLOv4: Optimal Speed and Accuracy of Object Detection论文解读

2020-04-28
计算机视觉, 论文阅读
最近目标检测又出了yolo-v4,作为一个做目标检测的不可不膜拜膜拜。首先由于约瑟夫大神已经退出CV,yolo-v4 的一作是DarkNet的
Read more…
1 2 3 4 5 › »     共 5 页

Recent Posts

  • ViLD(Vision and Language knowledge Distillation): 基于视觉和语言模型的zero shot 目标检测
  • 谷歌Detic: 结合分类数据集进行目标检测模型训练
  • 识别损失函数汇总
  • CLIP: Learning Transferable Visual Models From Natural Language Supervision理解与使用小记
  • 对比学习之SimCLR与MoCo小记

Categories

  • Keras
  • Leetcode
  • Linux
  • Python
  • Tools
  • 剑指offer
  • 图像修复
  • 图像增强
  • 图像处理
  • 机器学习
  • 深度学习
  • 自然语言处理
  • 计算机视觉
  • 论文阅读

Tags

Anchor Anchor free Cbam Cbir Cspnet Deeplab Densecrf Dlib Docker Facenet Fast rcnn Faster rcnn Fpn Gan Gitlab Google images download Hadoop命令 Hive Hrnet Image caption Imagenet Inception Iterm2 Keras Knn Leetcode Libsvm Linux Lstm Maccmd Mae Markdown语法 Mnist转图片 Moco Nlp Numpy gpu加速 Nvidia docker Ocr Ohem Pandas Pp yolo Ppyolov2 Progan Psnr Pyplot文档 Python Pytorch Ransac Rcnn Register Reid Roialign Se net Separable convolutions Simclr Simplehttpserver Sppnet Ssd Transformer Ubuntu Video object segementation Vit Yolo Yolo v3 Yolo v5 Yolov4 Yolox Zero shot 二分类 人脸检测 人脸识别 分割 分布式算法服务 分布式训练 压缩命令 四领域连通标记 图像去雾 多标签分类 多模态 孪生网络 数据加载 数据增强 最小二乘法 模版匹配 深度学习 目标分割 目标检测 相关 聚类 识别损失 超分辨率重建 跳板机 边缘检测

Social

GitHub
16120438@bjtu.edu.cn
© 2022 fly away, chase dream. Generated with Hugo and Mainroad theme.