人人都在提人工智能,人工智能到底是什么?

 

人工智能就像一个黑箱,好像任何问题只要遇到人工智能就解决了,到底它是不是万灵丹?到底人工智能是什么?

 

 

许多科技电影里都出现过人工智能。在攻壳机动队里,人工智能是人和机器人的结合;在Matrix里,一个机器可以瞬间灌输大量的知识给人类,他们认为这是人工智能;还有一些电影认为人工智能是人控制机器人搏斗,又有电影觉得人工智能是可以自我发展的机器人,它不依赖人的控制,像一个独立的个体,可以和人类对话。

 

我们会对人工智能到底是什么,它能做什么,产生这些实际或不实际的幻想。

 

那现实生活中的有哪些人工智能呢?

 

比如说Apple的Siri,它能做语音识别,把我们说的话自动转化成可执行的命令。在十年前,语音识别的准确度只有70%,而近几年有了深度学习技术,准确度大大提高。即使中国人和印度人说英文有口音,Siri和Amazon的Alexa都可以理解。在这背后使用的技术就是深度学习,它能把语音识别的精准度提升到百分之九十以上

 

还有Tesla Autopilot。现在车上的感应器已经可以做到和人一样探测到路上的行驶线,让车行驶在线里,探测出旁边有没有车,可不可以转弯,这也是一种人工智能。

 

另外还有众所周知的AlphaGo,让我们不得不相信人工智能已经能够思考,并将人类打败。

 

 

以上这些都是现实生活中人工智能的展现,我们不知不觉中已经活在AI的时代,并且人工智能领域还在飞速发展,其中隐藏着巨大的机会

 

事实上,虽然在很多领域人工智能的表现还是不如人类,但在部分领域里人工智能已经能够超越人类,比如人脸识别,图像识别等。我们在这里可以下一个定论,在未来人工智能会全面地超越人类

 

比如图像识别领域。现在我给你一张图,请你告诉我这张图是什么。比如我给你呈现下面的这张图,你可能很快就认出这是一条狗,或者更精确地认出这是一只哈士奇。

 

 

一般来说,在做图像识别时,人类的错误率大概是7.5%。而在2010和2011年时,用电脑做图像识别的错误率接近30%,但在2012年瞬间变为百分之十几,然后当深度学习的技术介入后,在2015年电脑的判定能力已经超过了人类

 

并且,以前可能电脑只能做一些比较粗略的判定,例如判定一张图是猫还是狗还是人,但现在电脑可以做非常精确的分类,不但可以识别出是一只狗,而且可以辨认出是哪一个品种的狗。比如上面两张图其实是不一样品种的哈士奇,但一般人除非非常了解,很难辨认出来,而电脑就可以轻松做到。

 

还有一点可能很让人惊讶,我们一直以为创作能力只专属于人类,但其实人工智能也能创作。比如以下的这两首诗,都是机器写出来的,在平仄、押韵甚至是诗的境界和语义方面,都做得很不错,比很多人写得都好。

 

 

机器人现在不但能创作,还能画画、作曲,虽然说在很多创作和画画的方面还是不如人类,但是它一直在进步。

 

人工智能的市场需求是什么?

 

Google,Facebook,Microsoft,Apple,Amazon等巨头都在往人工智能领域前进。下图表示了Google运用深度学习技术的项目数量,可以看到数量是呈指数增长的。

 

 

此外,自从2012年后,众多创业公司在短短几年内就募集了38亿美元投资这个市场。据报告统计,截止2016年9月20日,中国人工智能创业公司数量约在200-250家,大部分创建于2010年后。

 

所以无论是投资人、大公司还是创业公司,国内还是国外都在不断地往人工智能领域投资,这意味着他们需要雇佣更多人工智能领域的人才,人工智能市场还存在着很大的人才缺口

 

人工智能的产业环境是怎样的?

 

整个人工智能分为三层,第一层是应用层(applications),即把人工智能和深度学习技术用在某一个领域上,比如无人驾驶、机器视觉、语音识别或自然语言处理。

 

第二层是技术层(technology),涉及模型、算法,开源代码。主要是深度学习,目前所有机器学习的技术基本都被深度学习取代了,只有在非常具体的情况下,一些机器学习的算法和模型才能存活。深度学习之所以这么强大是因为它非常精准

 

第三层是基础层(infrastructure),指大数据、计算引擎、深度学习芯片。

 

人工智能的职位需求是怎样的?

 

当把Python和Machine Learning等等作为关键词搜索职位时,职位的数量随着时间呈上升趋势,逐年增长。并且2016和2017的需求量增长得尤其快。

 

 

这个需求量包含从应用类、研究类到开发类,技能要求包括编程、基本概念以及项目经验,对人才的需求是全面性的。

 

对于薪资所得,从StackOverflow和Indeed的数据来看,Machine learning specialist的薪水是一年108000美元,有人可能觉得这个薪水不高,但这两个平台上的薪资数据其实是有些偏低的,我们真正要注意的是它的相对排名,毕竟会随着区域和公司的不同而有差别。

 

我们可以看到Machine learning specialist的薪水比其他职位高,Data Scientist的薪水也比别人高。这也是除了大环境的趋势以外,另外一个驱使大家向人工智能方向前进的要素。

 

人工智能市场上的相关职位大致有这些要求通常需要C/C++和Python,基础知识方面需要了解机器学习,深度学习和计算机视觉,自然语言处理等。项目方面同样希望有一些机器学习、计算机视觉和自然语言处理的项目经验。其他技能包括Caffe和Tensorflow。

 

机器学习的技术框架

 

人工智能技术有三驾马车

  • Big Data:海量数据
  • Algorithm:深度网络
  • Computing Power:高性能计算

 

有人可能会问:为什么数据能够帮助人工智能发展呢?

 

通常来说,深度学习为什么这么火?是因为这个模型非常Flexible,并且参数非常多。经验告诉我们,至少数据量要是参数数量的几倍。以前一些传统的统计学家在做模型时,参数个数只有几个或十几个,都很少到百位数,但现在一个比较好的模型的参数个数通常都是百万级以上,那代表着我们至少要有百万等级以上的数据,才能推动这个模型。

 

所以我们可以看到,数据的规模是越来越大的,从百万到亿的等级。人工智能的概念已经被提出来四五十年了,为什么是现在,而不是以前,人工智能得到如此突飞猛进的发展呢?

 

 

因为现在有网路,在2015年时,整个网路上有约90亿Patabybes的数据,一个Patabybe约等于1000Terabytes,一个Terabyte约等于1000Gigabytes,如果我们可以好好利用这些数据,我们又有很强大的Computing Power,我们唯一缺的就是一个好的模型。这个好的模型,现在我们都知道是深度学习,为什么现在不管是学界还是业界的技术都往这方面集中?

 

因为我们只要能够了解深度学习的方法,就可以取得很好的突破,就算不在技术上突破,也可以有很好的应用,只要我们了解了这把关键性的钥匙,就可以通向无限可能的未来。深度学习是人工智能突破的一个最大推手,未来99%的产品,都会被人工智能所统治,这是一个很厉害的趋势。

 

机器学习的目标是让计算机具备与人一样的学习能力。在这里我们将会提到一个概念叫图灵测试(Turing Test)。人坐在幕布前与幕布后的人或者机器对话,我们不知道回答我们的是人还是机器,如果我们能分辨出是人还是机器,那么这么模型或者机器就Failed the turing test,如果它能成功让我们分辨不出来,它就Passed the turing test。现在机器通过图灵测试是一件很容易的事情

 

机器学习的一般流程

 

在设计一个模型时,首先输入数据,把这些数据的特征提取出来,然后训练得出一个模型。在测试这个模型的阶段,输入测试数据,经过同样的特征提取过程,经过这个模型做预测。

 

 

基本上大多数监督学习都是走这样的一个流程。

 

深度学习的基本原理

 

什么是深度学习网络?

 

深度学习网络其实是基于人脑的神经网络来设计的,它模仿了人脑的运作方式:眼睛接收到外界的刺激,通过神经把信息传导给神经元,神经元与神经元之间彼此相互连接,连接多了就变成了一个网络。

 

但在电脑里没有眼睛,也没有神经元和神经元的网络,那我们怎么把类似这样的结构做到电脑里面呢?

 

其实用的就是数学以及Architecture。从外界输入数据之后,同样通过连线连到“神经元”,电脑里的“神经元”其实是激活函数(Activation Function),很多激活函数就构成了一个Hidden layer,我们不知道这个Layer到底做些什么,我们只知道它是达到我们目标的一个方法,然后把一个Layer和一个Layer间连起来,最后这个模型会告诉你它的输出数据。

 

 

其实深度学习做的事情,是把我们一开始看到的图像,通过很多数学函数传到下一层,下一层得到的图像已经不是原来的图像了,是经过处理的图像。然后继续往下一层传,每一层传的时候都是non-linear projection,当层数增多时,就是一个highly non-linear network,它就可以达到我们的目标,比如做语音识别等。

 

人工智能已经有了这么突破性的成长,在未来它只能有更突破性的成长。只要我们能掌握几个关键技术,比如说深度学习,就有可能在一些传统领域上取得突破,现在是加入AI行业的最好机会