CLIP4Caption论文笔记 这篇2021年10月发布在MM'21的论文提出了一个基于CLIP、CLIP4CLIP和Uni-VL的模型,用来做视频描述任务,效果拔群,METEOR和CIDEr指标都是SOTA。文章主要想利用已有的vision-language预训练模型来帮助下游任务。同时文章还提出了一种集成学习方法,效果也有提升。 2021-11-02 论文笔记 CLIP4Caption Transformer Video Captioning
Pytorch DDP多卡训练 Pytorch DDP多卡训练 DDP指的是DistributedDataParallel,即支持多机多卡的Pytorch官方库,位于torch.distributed中。 本文简单介绍使用DDP进行单机多卡训练的步骤。 1. 开头导入库、获取local_rank、初始化backend 123456789import torchimport torch.distributed as distfro 2021-10-25 PyTorch Pytorch DDP
Video Captioning任务 Transformer方向小综述 对于Video Captioning任务,对基于Transformer的论文进行小综述 2021-10-25 论文笔记 Transformer Video Captioning
Python Type Hints Python Type Hints Python是一门不注重类型转换的语言,不像C++那样需要进行显式类型声明,这样在程序编写的过程中或许会更方便,但是在debug的时候就可能会很麻烦了,所以Python在3.5版本中引入了Type Hints。 Type Hints指的是在Python中显式提示某个变量的类型,可以翻译为类型提示,假如用错了类型,IDE就会有提示,能够让开发者更加方便地找到错误。 2021-10-24 Python Python Type Hints
如何构建数据集?大佬们都这么干的…… 当下深度学习对数据的要求越来越高,更好的数据往往就能训练出更好的模型,为了得到更好的数据,各路大佬们都绞尽脑汁,本文将介绍5种不同的构建数据集的方法。 2021-10-22 技术杂文 深度学习 机器学习 数据获取
Video Swin Transformer Video Swin Transformer [TOC] 简介 Swin Transformer分为两篇论文,一篇是21年5月的Swin Transformer: Hierarchical Vision Transformer using Shifted Windows,另一篇是21年6月的Video Swin Transformer。其中Swin Transformer是对ViT的改进,使用分层 2021-10-22 论文笔记 Transformer 深度学习
英语论文写作 英语论文写作 [TOC] 标题的方法 有什么效果?、吸引读者(把有意思的放上来)、中心明确 摘要的写法 Attention is all you need 论文摘要 be based on:基于 propose:提出 achieve 28.4 BLEU:取得了score require less time to train:需要更少的时间训练 A Better Use of Audio-V 2021-10-16 论文笔记 论文写作