[行业调研]人工智能简单调研

来源:互联网 发布:深圳户口 知乎 编辑:程序博客网 时间:2024/05/17 21:59

        又是一个深坑,这里就简单地调研一下,不作过多深入的研究。


#########################
强人工智能与弱人工智能
#########################

       目前对于人工智能的定义还存在一定的争论,在学术界通常还区分为 “强人工智能” 和 “弱人工智能” 两个定义。

       弱人工智能是基于数学进行问题求解的机器学习算法,程序设计者预测会出现的情况,然后做出应对方案,由机器判断符合条件与否并加以执行。
       强人工智能要求程序有自己的思维,能够理解外部事物并自发做出决策甚至行动,其表现就像一个“人”一样,甚至很可能比人的反应更优秀。



##################
人工智能的应用领域
##################

1. 专家系统(Expert System)
       专家系统 ES(Expert System)是人工智能研究领域中另一重要分支,它将探讨一般的思维方法转入到运用专门知识求解专门问题,实现了人工智能从理论研究向实际应用的重大突破 ;专家系统可看作一类具有专门知识的计算机智能程序系统,它能运用特定领域中专家提供的专门知识和经验,并采用人工智能中的推理技术来求解和模拟通常由专家才能解决的各种复杂问题。


2. 机器学习(Machine Learn)

       机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

       专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。


按照系统对导师的依赖程度可将学习方法分类为 :
机械式学习(Rote learning)
讲授式学习(Learning from instruction)
类比学习(Learning by analogy)
归纳学习(Learning from induction)
观察发现式学习(learning by observation and discovery)


3. 人工神经网络(Aficial Neural Network)

       人工神经网络是由大量处理单元即神经元互连而成的网络,也常简称为神经网络或类神经网络。神经网络是一种由大量的节点(或称神经元)和之间相互联接构成的运算模型,是对人脑或自然神经网络一些基本特性的抽象和模拟,其目的在于模拟大脑的某些机理与机制,从而实现某些方面的功能。



4. 模式识别
       计算机人工智能所研究的模式识别是指用计算机代替人类或帮助人类感知模式。其主要的研究对象是计算机模式识别系统,也就是让计算机系统能够模拟人类通过感觉器官对外界产生的各种感知能力。


5. QVM
        QVM可以说是最安全也是最冷门的人工智能应用,QVM引擎在病毒库中寻找病毒演化规律并归纳成算法,然后利用人工智能中的深度学习将其掌握,最终QVM引擎将能够自主识别病毒库中的样本及病毒库中并不存在的样本进化版。 


6. 机器视觉(machine vision)
       机器视觉是人工智能正在快速发展的一个分支。机器视觉系统是通过机器视觉产品(即图像摄取装置,分CMOS和CCD两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,得到被摄目标的形态信息,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。

7. 自然语言理解及自动程序设计
       自然语言理解方面已经开发出能够从内部数据库回答英语提出问题的程序,此外,这些程序通过阅读文本材料,还能够把其中的句子从一种语言翻译为另一种语言,执行用英语给出的指令和获取知识等。自动程序方面的目的在于,使计算机自身能够根据各种不同目的和要求来自动编写计算机程序,既可用高级语言编程,又可用英语描述算法。目前已经可以自动编写出一些简单的程序。


8.智能搜索(Intelligent Search)
       智能搜索是结合了人工智能技术的新一代搜索,它既提供传统的快速检索、相关度排序等功能,还能提供用户角色登记、用户兴趣自动识别、内容的语义理解、智能信息化过滤和推送等功能,实现搜索信息的个性化定制。


######################
自然语言处理(NLP)
######################
       natural language processing,是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。 现代NLP算法是基于机器学习,特别是统计机器学习。机器学习范式是不同于一般之前的尝试语言处理。语言处理任务的实现,通常涉及直接用手的大套规则编码。
 



2017年人工智能趋势
摘选自 http://mp.weixin.qq.com/s/4KEzXU1kygE36ohFE7-cQw (有删改)

 

      IDC在其《全球半年度认知/人工智能系统支出指南》(Worldwide Semiannual Cognitive/Artificial Intelligence Systems Spending Guide)中预测,人工智能的收入将从今年的80亿美元增长到2020年的470亿美元,复合年增长率(CAGR)为55.1%。


1.人工智能聊天机器人
        在TechEmergence进行的一项2016年调查中,询问了人工智能的高管和创业者,什么人工智能应用在未来五年内可能会获得成功。他们的首选是虚拟代理和聊天机器人,获得了37%的投票。这些软件程序能够理解自然语言,并通过消息传递服务或电子邮件与人沟通。包括IBM和Facebook在内的几家公司已经宣布了帮助开发者创建聊天室的平台,这些平台似乎越来越受欢迎。

        Gartner预计,到2018年,全球最大的200家企业大多数都会利用智能应用,并使用大数据的完整工具包和分析工具,来优化自身的产品和改善客户体验。”
                                                                                                                                                                                                                    ——Gartner,2016年10月

2.应用开发
       创建聊天机器人并不是开发人员使用人工智能的唯一方式。许多企业正在将人工智能和深度学习功能集成到他们的Web应用、移动应用和内部的企业应用中。人工智能正在发展推荐引擎、安排会议、排定待办事项列表、在大数据中查找隐藏的价值的一系列功能等等。在其2017年十大战略技术趋势列表中,Gartner将智能应用排在了第二位。其中写道,“Gartner预计,到2018年,全球最大的200家企业大多数都会利用智能应用,并使用大数据的完整工具包和分析工具,来优化自身的产品和改善客户体验。”


3.智能物件
       人工智能也与物联网(IoT)的趋势相关,“智能物件”(intelligent things)在Gartner的2017年前十大战略技术趋势列表中排名第三。其中说道,“现有的物联网设备将使智能物联网人工智能的功能无处不在,包括家庭、办公室、工厂车间和医疗设施。”例如,下一代健身追踪器不仅可以监控您的健康信息,还可能具有机器学习和分析功能,使它们能够根据您的个人健康史和过去的追踪器数据提出改善健康的建议。


4.医学研究
       人工智能的最热门领域之一是医疗健康行业。IDC在其《全球半年度认知/人工智能支出指南》中将诊断和治疗系统列为2016年吸引最多投资的领域之一,并表示在未来五年内,包括药物研究和发现以及诊断和治疗系统的使用案例将获得最大的发展。在五年期间,它预测医疗健康人工智能投资的年复合增长率为69.3%。同样,CBInsights将医疗健康列为人工智能中最热的领域,并作为今年的创业项目。


############
微软小冰
############
        2014年5月29日,微软亚洲互联网工程院发布了一款人工智能伴侣虚拟机器人,并取名为“微软小冰”。初始阶段,小冰的对话能力是通过语义分析、机器学习以及深度神经网络从互联网上公开的对话文本中提炼和学习而来。但现在随着用户数量和对话量指数型增长,小冰的学习数据已变为45% 来自真实的用户对话,其余从搜索引擎抓取,实现自我学习成长的正循环。


       如今,第三代小冰具备了语音和视觉能力。用户可以直接用语音和小冰对话,这是利用语音识别将用户的语音转换为文字,经过分析处理后,再将小冰所要回复的话进行语音合成转达给用户实现的。视觉能力则是通过图像识别出用户上传图片中的场景或事物,然后小冰会结合语境回复用户。



--------转载自使用深度学习打造智能聊天机器人 author: 张俊林   http://blog.csdn.net/malefactor/article/details/51901115


       聊天机器人(也可以称为语音助手、聊天助手、对话机器人等)是目前非常热的一个人工智能研发与产品方向。

       很多大的互联网公司重金投入研发相关技术,并陆续推出了相关产品。比如


       苹果Siri

       微软Cortana与小冰

       Google Now

       百度的“度秘”

       亚马逊的蓝牙音箱Amazon Echo内置的语音助手Alexa

       Facebook推出的语音助手M

       Siri创始人推出的新型语音助手Viv

       …….


       为何老牌互联网公司和很多创业公司都密集地在聊天机器人领域进行投入?


       其实根本原因在于大家都将聊天机器人定位为未来各种服务的入口,尤其是移动端APP应用及可穿戴设备场景下提供各种服务的服务入口,这类似于Web端搜索引擎的入口作用。将来很可能通过语音助手绕过目前的很多APP直接提供各种服务,比如查询天气、定航班、订餐、智能家居的设备控制、车载设备的语音控制等等,目前大多采用独立APP形式来提供服务,而将来很多以APP形式存在的应用很可能会消失不见,直接隐身到语音助手背后。


       作为未来各种应用服务的入口,其市场影响力毫无疑问是巨大的,这是为何这个方向如此火热的根本原因,大家都在为争夺未来服务入口而提前布局与竞争,虽然很多公司并未直接声明这个原因,但其目的是显而易见的。


########################
人工智能的开源项目
########################
GraphLab  ------  是一种新的面向机器学习的并行框架。 
Vowpal Wabbit  ------  微软研究院的一个机器学习平台。 
Scikits Learn  ------  是一个开源的、构建在Scipy之上用于机器学习的Python模块。 
Theano  ------  是一个python库,用来定义、优化和模拟数学表达式计算,用于高效的解决多维数组的计算问题。 
Mahout  ------  是Apache Software Foundation旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。 
Pybrain  ------  是Python的一个机器学习模块,它的目标是为机器学习任务提供灵活、易应、强大的机器学习算法。 
OpenCV  ------  是一个基于发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。 
Orange  ------  是一个局域组件的数据挖掘和机器学习软件套装。 
NKTK  ------  natural language toolkit,是python的自然语言处理工具包。 
Nupic  ------  一个开源的人工智能平台。


#######################
开源的机器学习系统
####################### 
 
Google的TensorFlow
       TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。TensorFlow可被用于语音识别或图像识别等多项机器深度学习领域,对2011年开发的深度学习基础架构DistBelief进行了各方面的改进,它可在小到一部智能手机、大到数千台数据中心服务器的各种设备上运行。TensorFlow将完全开源,任何人都可以用。


Facebook的Torch
       Torch是一个支持机器学习算法的科学计算框架。易于使用且高效,主要得益于一个简单的和快速的脚本语言LuaJIT,和底层的C/CUDA实现。Torch的核心是流行的神经网络,它使用简单的优化库,同时具有最大的灵活性,实现复杂的神经网络的拓扑结构。你可以建立神经网络和并行任意图,通过CPU和GPU等有效方式。Facebook开源了他们基于Torch的深度学习库包。


微软的DMTK
        DMTK由服务于分布式机器学习的框架和分布式机器学习算法构成,是一个将机器学习算法应用在大数据上的强大工具包;无论是学术界的研究人员还是工业界的开发者,DMTK可以帮助他们在超大规模数据上灵活稳定地训练大规模机器学习模型。


IBM的SystemML
        SystemML就是System Machine Learning,是一套机器学习系统,由IBM的Almaden实验室近10年前开发。它用Java语言编写,可支持描述性分析、分类、聚类、回归、矩阵分解及生存分析等算法。



三星的VELES
  VELES 是分布式深度学习应用系统,号称:用户只需要提供参数,剩下的我来搞,VELES使用 Python 编写,使用OpenCL 或者 CUDA,利用基于Flow 的编程方式。


Caffe
       Caffe的全称应该是Convolutional Architecture for Fast Feature Embedding,它是一个清晰、高效的深度学习框架,它是开源的,核心语言是C++,它支持命令行、Python和Matlab接口,它既可以在CPU上运行也可以在GPU上运行。它的license是BSD 2-Clause。


引用自知乎:   https://www.zhihu.com/question/20102212 



################################
关于人工智能的分层布局以及发展机遇
################################







引用自知乎: https://www.zhihu.com/question/30156262






#############################
2017年部分人工智能企业融资状况
#############################







最后再补张时间轴图 : )




参考资料:
[1] 王宇飞,孙欣.人工智能的研究与应用[J].信息与电脑,2016.Vol5:115-117
[2] 邹蕾,张先锋.人工智能及其发展应用[J]. 理论研究,2012.Vol2:11-13
[3] 贺倩. 人工智能技术发展研究[J]. 现代电信科技,2016,46(2):18-21+27