One Class Classification算法简单介绍

本文最后更新于:2022年9月5日 上午

One Class Classification算法简单介绍

One Class Classification (OCC) 是异常检测 (anomaly detection) 的一种常用方法,其只使用正常的数据来训练,训练后能够区分正常值和非正常值 (outlier)。

异常检测任务的特点是数据极其不均衡,异常情况通常来说较少,所以当做二分类问题可能效果不佳。而OCC只需要正常数据,其能学习到正常数据的边界,并以此分类。

如下图,传统的分类就是比如区分苹果和梨,红点是苹果,蓝点是梨,黑色实线就是学习到的分类器。而OCC就是区分“苹果与梨”和其它,虚线就是学习到的OCC分类器,一个苹果商标就处于外面,属于异常数据。

image-20220904194058232

参考文献:

One-Class Classification Algorithms for Imbalanced Datasets (machinelearningmastery.com)

one class classification - 知乎 (zhihu.com)

thesis.pdf (tudelft.nl)