论文链接:arXiv:2005.12872v3 作者:Nicolas Carion et al. (Facebook AI Research) 模型关键词:Set Prediction、Hungarian Matching、Transformer、Object Queries


这篇论文提出了一个极具颠覆性的目标检测框架 —— DETR(DEtection TRansformer),它摒弃了 anchor、NMS、候选框等传统组件,使用纯粹的 CNN + Transformer 结构进行端到端训练,实现了“无组件”目标检测。

Read more »

项目地址:github.com/QianQing26/MiniCLIP

项目简介

本项目是对论文 "Learning Transferable Visual Models From Natural Language Supervision"(CLIP) 的一次轻量实现,适用于资源受限环境(如单卡 8GB 显存)。该实现完整复现了 CLIP 的核心思想与训练流程,并使用 Flickr8k 数据集进行实验验证。

Read more »

本文是我在精读 BERT 论文《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》时,遇到的两个重要但难以理解的问题。虽然论文中只用几行文字描述,但通过查阅资料和向GPT请教,我终于理解了背后的逻辑。在这里记录下来,方便自己日后获得启发。

Read more »
0%