LR用户挖掘,如何选取阈值

来源:互联网 发布:以此为政,不亦惑乎翻译 编辑:程序博客网 时间:2024/06/06 02:32
 在用逻辑回归做潜在用户挖掘时,阀值(Z)的选取是一个头疼的问题。取太高,查全率虽然高了,但是查询条件过于严格,挖掘出的潜在用户过少。取的太低,资源浪费的太多。对于一般的营销而言,这个问题很好解决,只要按照预算,从高往下选取就可以了。但对于其他没有预算约束的情况就比较麻烦。
希望下面的公式可以给予一些启发
Z=Ln((qc)/(QC))
q-发生显性结果的先验概率,比如信用卡用户发生违约的以往概率
Q-不发生显性结果的先验概率
c-范第一类错误的成本,即信用卡用户对银行造成的损失,就是不能收回的比例
C-范第二类错误的成本,即应该发放信用卡而没有发放所遭受的损失,就是存贷款差价 
原创粉丝点击