ICML2017 Best Paper:Understanding Black-box Predictions via Influence Functions
来源:互联网 发布:linux查看网络连接 编辑:程序博客网 时间:2024/06/03 17:06
1. 前言
众所周知,现在很多流行的机器学习模型对于我们来说就是一个黑盒子,尤其对于深度神经网络来说,网络的解释性一直是学者们很头疼的问题。一种对机器学习模型进行解释的方法是尝试找到训练数据中对结果影响最大的那部分数据点。作者应用了稳健统计学概念中的Influence Function ,来获得损失函数关于单个数据点的变化。另外,针对该方法计算量大的问题,作者提出了高效的近似算法;针对该方法对于函数可导性和凸性的严格限制,该作者对不符合要求的情况进行了讨论(这也是现在解释深度神经网络所面临的主要问题)。最后,作者讨论了该方法的应用。
这篇文章被选为ICML2017的best paper。这篇文章稍偏理论而且质量不错,仔细阅读适合初学者巩固知识,加深对机器学习模型的理解。
2.理论分析
为了研究训练数据中每个数据点对模型的影响,作者提出了两个问题:如果我们将训练数据集中的某个数据点移走会怎么样?如果我们将某个数据点的数据改变会怎么样?针对这两个问题,作者进行了讨论。
2.1 对一个数据点增加权重
首先,我们来看一下对数据点加权对模型参数的影响,形式化的来讲,模型参数的变化为:
另外,这里要说明的是,对一个数据点增加权重
为了获得模型参数与数据点权重之间的关系,Cook和Weisberg计算得出,模型参与对于
其中
既然知道了模型参数与数据点权重之间的关系,那么根据复合函数求导法则,损失函数与数据点权重之间的关系也应运而生:
2.2 改变训练数据点
之前提到的另一个问题是,如果将数据点改变会怎么样?在此,我们同样用
对于一个训练点
同样,以参数
考虑线性近似,可以有,当
另外需要注意的是,该方法对离散的数据依然有效。
假设loss function
- ICML2017 Best Paper:Understanding Black-box Predictions via Influence Functions
- 论文笔记understanding black-box predictions via influence functions
- (2017ICML Bestpaper)Understanding Black-box Predictions via Influence Functions 笔记
- Black Box
- Black Box
- Black Box
- Black Box
- Best paper awards
- Builder pattern - best understanding
- zoj-1319-Black Box
- Black-box Test
- pku1442 Black Box
- poj 1442 Black Box
- POJ 1442 Black Box
- poj--1442--black box
- POJ 1442 Black Box
- POJ 1442 Black Box
- POJ 1442 Black Box
- 高精度计算
- mybaties resultMap可以不写么?
- java读取配置文件
- Map集合的基本功能
- Linux常用命令
- ICML2017 Best Paper:Understanding Black-box Predictions via Influence Functions
- JavaScript学习笔记(日期,时间和计时器)
- python 字符串错误+部分转码问题
- superslide.js 多种网页组合效果
- CSM阴影技术讲解
- UML类图中类与类的关系
- echart地图城市无法显示?
- Less 的使用心得
- bzoj2152 聪聪可可