反欺诈建模方案

来源:互联网 发布:c 网页编程 编辑:程序博客网 时间:2024/04/27 21:18

在反欺诈场景中,知识图谱聚合各类数据源,逐步绘制出借款人的profile,从而针对性的识别欺诈风险。以一个借款人举例,借款人可以有身份证号,手机号,学历等个人信息,属于个人的属性信息;而借款人可以有担保人或是亲属好友,借款人与担保人之间的关系(也就是边Edge)是被担保与担保的关系,借款人与其亲属好友之间的关系是父亲、母亲、同事、同学等关系;借款人也具有住址,银行流水,工作单位等信息。这些信息可以来自于多个渠道,例如可以由借款人自己填写,或是积累的历史数据,或是数据提供商提供,或是在互联网上获得,甚至通过推理得到,往往具有冗余性;信息通过图的形式连结,展示出借款人的profile。

1识别数据造假

当融合来自不同数据源的信息构成知识图谱时,有一些实体会同时属于两个互斥的类别(例如同时在两个不同的城市工作),或某个实体所对应的一个Property(同一个人的住址)对应多个值,这样就会出现不一致性,这个不一致性即可判定为潜在的可疑点。
通过这种不一致性检测,我们利用绘制出的知识图谱可以识别潜在的欺诈风险。在P2P行业,欺诈风险主要的骗术包括个人信息造假、工作单位虚假、代办包装、虚假联系人、组团骗贷等。以识别数据造假为例,利用知识图谱我们可以通过借款人的身份信息PII(Personal Identify Information),例如手机号或是身份证号,直接索引到个人的全部信息,并以此与借款人的填写信息进行不一致性检测;也可以通过借款人的其他信息进行推理出其相关信息进行验证,举一个例子,我们可以通过借款人的身份证号和姓名可以获得他的学历信息和年龄,通过学历信息和年龄可以推算出其工作年限,再根据其所在城市,行业,职位,结合互联网上的招聘网站数据推理出其薪水范围,进而验证他的收入水平;甚至可以通过不同借款人之间的同事关系,验证其工作单位的真假。

2组团欺诈和代办包装

除了对数据造假进行验证外,由于图结构带来的天然关联检索的特点,知识图谱可以识别潜在的代办包装或是组团骗贷。我们利用征信公司提供的欺诈数据,拥有的代办包装公司数据,互联网公开欺诈黑名单,行业黑名单联盟等数据开发大量的标签数据,对实体(包括公司和人)贴上标签,例如逾期,虚假手机号,代办包装或是组团骗贷等标签,当借款人进行申请贷款时,如果我们发现他和bad people/company/info具有较多的关联关系,那么这个人有很大的可能是欺诈,从而识别出风险。
与搜索引擎的场景不同,知识图谱在反欺诈场景中具有较低的应用门槛,数据量较少时也可以进行低程度的交叉验证,而随着数据量的积累和增多,知识图谱也会越来越完善,其反欺诈能力也会越来越强。我们建立大数据反欺诈系统,在借款人提交借款申请开始即介入整个风控流程,对接多个数据源以获取借款人的数据信息,在各个环节建立checkpoint,通过可配置的规则引擎在各个checkpoint执行预定的逻辑,识别和防御欺诈风险。

3.反欺诈模型设计

first

通过社交 (同学圈,同事圈,亲戚圈),手机通讯录 评判

second

1 从用户申请提交的数据层面

· 1.1年龄和学历与收入不符合。
· 1.2通讯录无直属亲人。
· 1.3拥有资产如车、房等与居住地址 或消费水平不符合。
· 1.4现住地址与公司地址差异较大。如不在同一城市中。
· 1.5QQ或APP最近常登陆地区不在现 住地址或公司地址中。
· 1.6最近手机通讯地址不在常用地址 中
· 1.7收货信息上手机号码与通讯录上 手机号码反差较大

2 申请的记录在已有的记录有类似出现

· 2.1电话号码出现在已有放贷或申请记录中
· 2.2身份证号码出现在已有放贷或申请记录中
· 2.3地址出现在已有放贷或申请记录中
· 2.4QQ号码在已有放贷或申请记录中
· 2.5同一邮箱已有放贷或申请记录
· 2.6银行卡号在已有放贷或申请记录中
· 2.7同一车牌号在已有放贷或申请记录中

3 黑名单 征信

· 3.1 贷联盟公布黑名单
· 3.2 人行征信黑名单
· 3.3 征信是否有逾期

4 操作

· 4.1 单个IP,多次申请账号 • 单个MAC,多次申请账号
· 4.2 同一账号,短时间登陆多个地域相差大的IP
· 4.3单个IP,多次申请贷款
· 4.4 单个MAC,多次申请贷款
· 4.5 同一账号,短时间内申请贷款数量或金额超过一定限制
· 4.6 同一关系圈,出现相似借贷