题目标题

机器学习中的正负样本

难度:初级

机器学习
参考解析

在分类问题中,这个问题相对好理解一点,比如人脸识别中的例子,正样本很
好理解,就是人脸的图片,负样本的选取就与问题场景相关,具体而言,如果
你要进行教室中学生的人脸识别,那么负样本就是教室的窗子、墙等等,也就
是说,不能是与你要研究的问题毫不相关的乱七八糟的场景图片,这样的负样
本并没有意义。负样本可以根据背景生成,有时候不需要寻找额外的负样本。
一般 3000-10000 的正样本需要 5,000,000-100,000,000 的负样本来学习,
在互金领域一般在入模前将正负比例通过采样的方法调整到 3:1-5:1。