互联网金融风控中的数据科学 (part2) ：模型策略

blairchen

data-science

Publish：Apr 21, 2018

views

反欺诈也是一种机器学习过程，反欺诈建模中的数据科学

反欺诈也是一种机器学习过程

对于做互联网金融一般情况是正负样本是极度不平衡的(最高可以达到 100 : 1), 这样的情况对于 SVM 这种分类器是不合适的，所以在做金融的评分卡模型 或 欺诈模型 也好，这样对特征的处理和样本的非平衡处理是比较高的.

好坏用户的定义，一般是根据用户的贷后表现，来定义好坏用户的.

举个栗子🌰 :

用户借款 5W 元，可能是分期还款 12个月，这样每个月都会还一笔固定的额度.

信用风险 : 在挺长的时间可以按时还款.

欺诈风险 :

用户可能第 1、2 期是还的，之后是不还的.
(因为中介也越来越聪明，给他自己留出时间，躲避催收的手段，也躲避追踪等等)

贷前审核（触碰到拒贷规则）

造假行为（信息资料造假）

调查员调查出来是中介或者 有欺诈风向的，进入黑名单的.

…

所以我们在定义模型负样本的话，我们可能定义为 m1+ 信用风险、m3+ (90天以上不还款的话)，我们可以定义为欺诈风险