C++与Python合作的方法

本文介绍C++和Python如何合作来提高程序效率又不失灵活性。

2024-11-23

学习笔记技术杂文

C++

当我们在谈论模型部署时，我们在谈论什么。

工业界应用神经网络时，往往要对学术界产出的模型进行优化，才能在推理设备/服务器上实现更高的效率，从而降低成本，这整个过程也一般称之为模型部署。那么，当我们在谈论模型部署时，我们究竟要经历哪些步骤？怎么去做优化提速？本文对这个过程进行大致的简略分析。

2024-10-31

学习笔记技术杂文

模型部署模型量化

CMake快速入门

CMake是一个构建（build）工具，完成代码编译、链接、打包过程，并且是跨平台的。本文介绍CMake是什么和快速入门的方法。

2024-10-22

学习笔记技术杂文

CMake

cURL学习笔记

简单记录cURL这个工具的使用方法。

2024-10-22

学习笔记技术杂文

Curl

使用zsh优化Ubuntu终端

本文记录使用使用zsh作为ubuntu的terminal并进行优化（美化）的操作步骤。

2024-10-02

Linux

Ubuntu zsh

Weakly-supervised Video Anomaly Detection with Robust Temporal Feature Magnitude Learning

ICCV2021的一篇经典论文，提出了RTFM的WSVAD训练方法，并提供了一定的数学证明。

2024-09-05

论文笔记

RTFM ICCV21

UBoCo Unsupervised Boundary Contrastive Learning for Generic Event Boundary Detection

CVPR22的一篇文章，介绍了一种无监督的GEBD方法，GEBD任务指的是类别无关的检测视频中发生的事件边界。作者使用一种新颖的RTP算法检测边界，并结合BoCo Loss来训练。

2024-08-31

论文笔记

CVPR22 Generic Event Boundary Detection

The Platonic Representation Hypothesis

MIT团队发表的一篇ICML 2024论文，被ChatGPT之父Ilya Sutskever点赞过，对于大模型的未来提出了柏拉图表征假说（Platonic Representation Hypothesis），本文简单介绍这篇论文的观点和证明思路。

2024-06-20

论文笔记

大模型原理

近期LLM+视觉下游任务方法总结

最近，使用大语言模型（LLM）和多模态大语言模型（Multimodal LLM, MLLM）进行视觉下游任务的方法越来越多，本文对相关文献进行初步的调研，并形成了一篇总结的文章。（因个人水平，无法覆盖全，望谅解）。

2024-06-19

论文笔记

LLM MLLM

论文笔记 UniVTG：Towards Unified Video-Language Temporal Grounding

新加坡国立+MetaAI的一篇ICCV23论文，其将Moment Retrieval、Highlight Detection、Video Summarization统一成了Video-Language Temporal Grounding的任务，并进行了预训练，得到一个Unified的模型，展示了在下游任务的强劲性能。

2024-04-13

论文笔记

Moment Retrieval Video-Language Temporal Grounding Highlight Detection Video Summarization