机器学习在崛起:但其算法的结果是否公平?
来源:互联网 发布:生物技术专业 知乎 编辑:程序博客网 时间:2024/06/05 03:10
点击查看全文
算法正在通过很多很不可思议的方法控制着我们的生活。
当我在一家当地的熟食柜台取了一个号码牌后,我知道自己到最后肯定会得到相应的服务。因为有一个排队的算法在起作用——这种算法保持着先来先得的点餐模式。即使等待的时间会有差异,但是对于所有顾客来说它总是能达到一个可期待的平均服务时间。
举另一个例子进行对比,当我购买了一张彩票时,我将我的机会赋予了一个随机抽签的算法,但是结果很可能不会是我预想的那样。要赢得彩票不仅仅是一件不确定的事情,而且还不太可能。但是对于很多人来说,购买彩票本身这件事件就可以带给他一些短暂的情感上的安慰,所以它还是有经济效应的。
人们总是可以接受那些被保证的确定性算法以及那些在合适的时候完全随机的算法。不过如果想象一下相反的情形,如果你的熟食店随机挑选顾客进行服务那会怎样?如果有足够多的排队的顾客,你可能永远都拿不到你点的炸鸡。同样,如果彩票最后减除了管理费用将所有剩余的钱都返还给购买者又会怎样?即使这样会增加几乎所有人的投资回报,但这看起来就变得一点乐趣都没有了呢!
即使不用精通心理学或者行为经济学,我们也可以很明确地知晓对很多事情来说随机化有时候是合适的,有时候是不合适的。当我们在以小博大的时候,我们输了会抱怨;但是当我们在车管局等了4个小时之后它却关门了的时候,我们的反应可能会不太一样。
试想一下如果你的生命中很多重要的事情都会被那些对你不透明的算法所主宰是一种怎样的体验?比方说在你申请按揭、汽车贷款,以及在工作和学校录用人才时候,很多算法是看起来是随机的,但是某种程度上支配着你的命运。在这些算法不够透明的前提下,我们很难知道它们到底公平不公平,也很难因此预测事情发展的走势。而这种感觉就像是你不知道下次会不会遇到一架飞机随机地直接撞向你一样。
机器学习学到了什么?
让我们试想一下如果一些组织设计出了足够聪明和公平的算法,那么它可能会基于一些固有的、理性的逻辑,输出一些公正,随机的结果。或者可能是看起来很好但是操作上完全不透明的大数据机器学习算法。
有了机器学习,我们希望事情会变得更好,但是它也有可能变得更糟糕。在很多情况下,缺乏训练或设计的机器学习算法会带来一些错误的决定,这些决定可能会对一些群体带来不公。
这将会是一个越来越多并且对我们很重要的问题。机器学习正在影响我们很多重要的决定,而且还对我们的经济也越来越有掌控力。在不知不觉中它成为很多关键时刻的权威算法。
不过随着大数据和机器学习工具(例如Apache Spark)的易用性越来越高,以及我们周围物联网数据流的不断增加,我相信每一个数据驱动的任务都会在一些关键的地方被机器学习所优化。相信在不久的未来,机器学习算法会成为几乎所有应用程序内不可或缺的一个组件。
优化即更好,机器学习提供了一个让几乎所有事情变得更好更快的途径。我并不是夸大其词,但我相信很快机器学习会侵入人类生活的方方面面。我们可能已经到达了真正的“信息界的文艺复兴时代”。
但是我们还需要十分谨慎,我并不相信将来人工智能会进化到掌管整个宇宙的程度,但是很多不计后果开发出来的带有机器学习算法的应用程序已经出现了:比方说金融交易惨败、种族主义式拒绝贷款和监狱假释的不公等等。
不能预见的事情有什么?
点击查看全文
- 机器学习在崛起:但其算法的结果是否公平?
- “机器的崛起”
- 达内2013C++教程笔记(其实为其数据结果与算法的一部分,但内容更像是C++的)
- 平民的希望在公平
- string是引用类型,但因其为不可变的特征造成其与值类型结果相似
- 独家 | 数据分析@爱可可-爱生活是否在用机器学习算法运营微博
- 公平算法
- 机器学习在现实中会遇到的算法总结
- 机器学习各种算法结果可视化比对
- hadoop中的公平调度的实现算法
- Linux的CFS(完全公平调度)算法
- 算法学习笔记----判断集合S中是否存在有两个其和等于x的元素
- sql server2008R2 在执行脚本的时候提示“已创建表 XXX,但其最大行大小(8926)超过了每行的最大字节数(8060)。如果结果行长度超过 8060 字节
- 你在数据预处理上花费的时间,是否比机器学习还要多?
- 机器学习算法工程师在做什么?
- 在opencv3中的机器学习算法
- 在opencv3中的机器学习算法
- 在opencv3中的机器学习算法
- HDU1047 Integer Inquiry
- linux测试服务器如何部署web项目
- 解决MySql登录错误ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: NO)
- HUD1048 The Hardest Problem Ever
- JavaEE开发之SpringMVC中的路由配置及参数传递详解
- 机器学习在崛起:但其算法的结果是否公平?
- HDU1049 Climbing Worm
- MTK内存复用技术
- HDU1058 Humble Numbers(DP)
- 这五点知识设计师得知道
- spring-quartz-定时器实现
- HDU1124 Factorial
- HDU6043 KazaQ's Socks
- ANDROID中BROADCASTRECEIVER的两种注册方式(静态和动态)详解