【智能制造观察】人工智能技术趋势与资本热点

2016-5-12 09:08| 发布者: 钟森| 查看: 486| 评论: 0|原作者: 中信研究|来自: 前沿

　 4月27至28日，新智元与中信证券联合举办的人工智能研讨会在北京召开。一边是具有深远战略眼光的国内最大券商，一边是人工智能领域最具影响力的专业平台，双方的合作会当下人工智能行业的发展带来哪些启示?

　　下文是2016年4月27日研讨会的精华摘要，分享嘉宾包括中信证券全球首席经济学家彭文生，新智元创始人杨静，微软亚洲研究院常务副院长芮勇，驭势科技创始人兼CEO、前英特尔中国研究院院长吴甘沙，IBM大中华区副总裁、战略部总经理郭继军，科大讯飞高级副总裁江涛等重量级嘉宾。

　　彭文生：人工智能对经济的影响分析

　　【中信证券全球首席经济学家彭文生】各位来宾，女士们，先生们，大家上午好，首先非常欢迎大家参加今天的人工智能产业研讨会，衷心感谢各位对中信证券一如既往的支持，特别要感谢今天参加这个会议的各位行业资深人士、专家，包括会议的协办方新智元。

　　谈到人工智能，一般人都抱有一个敬畏的心理，尤其我是文科出身，更有一种神秘感。人工智能本身我没有什么发言权，我想从经济学的角度谈两点看法。首先有一个担心，就是人工智能最终是不是将战胜人类，有的甚至担心人工智能最后会把人类毁灭。我们怎么来看这个问题?一个有意思的角度是看经济学几百年来两大流派的争议。其中的一方，是古典经济学，讲的是面对不同的可能情形，每个人依据自己的个体条件，包括财务制约等，做出符合自己最大利益的选择。古典经济学有一个概念，叫经济人，讲的就是人的思考和行为都是目标理性的，最大程度满足自己的利益。基于个体的理性行为，古典经济学不相信经济会长期偏离均衡点，也不会有长期低迷。

　　从这个角度讲，人工智能的各种推理，包括计算机程序推理等，和微观经济学中的经济人理性行为是类似的。古典经济学分析的思维到了70年代，被卢卡斯发扬光大，形成了理性预期学派。他讲过一句非常著名的话，政策可能在某一个时间点能够欺骗所有的人，也可能在不同的时间点欺骗一部分人，但不可能在所有的时间点欺骗所有的人，因为人是理性的，如果大家都是理性的，那么人们会随政策的变化而改变自己的行为，抵消了政策想要达到的效果。从这样一个理性预期的角度看，人工智能涉及到的推理与古典经济学的逻辑框架是一致的，现在的经济学也用到很多数学模式和计量分析。

　　当然经济学中还有另外一个学派，不相信所谓的经济人假设，不相信人总是理性的。对此，今天的投资者应当更有体会。对于金融市场做投资的，凯恩斯称之为动物精神。为什么叫动物精神?就是用正常理性的思维很难解释。这两大流派哪个是正确的，哪个是占上风的，实际上没有绝对的正确，各领风骚几十年。

　　所以我在想人工智能或许也是一样的。人工智能和人到底哪个更厉害?如果人的行为总是理性的，可以用数学模式、量化分析来模拟，那人工智能就可以替代人了。但人不是总是理性的。长期平均来讲，古典经济学所假设人的理性是对的，但短期甚至中期来讲，可能有很多行为不是机器和程序乃至理性的推导所能够把握的。这是第一点体会。

　　第二点体会，人工智能对就业的影响，可以说是对人的一个更现实的威胁。有人讲未来证券分析师也会被人工智能替代，会不会发生呢?其实担心技术进步对就业的冲击，这是几百年来一直持续的事情。早在纺织机代替手工编织的时候，就有人担心技术进步会冲击就业。从历史演进来看，人类的技术进步虽然在某一个具体时点，对某些行业的冲击在所难免，但是总体就业并不值得担心，因为技术进步提高生产率，提高产出，创造新的就业机会。

　　虽然整体就业不会受很大影响，但不代表某些行业和人群不会受到冲击。这有两个含义，一个是我们必须要不断学习，提高自己的技能。另一个是技术进步可能加大社会的收入分配差距。过去这40年，全球收入分配差距越来越大，有多重原因，一般认为技术进步是其中的一个因素。原因在于，技术进步导致原有技能优势的减少甚至散失。我并不担心未来分析师会失业，但是分析师要提高知识，未来的投资分析更需要思想，大数据等技术进步不过是工具辅助。

　　总之，对于人工智能未来的发展，我自己持有更积极的看法，这将会创造更多的就业和投资机会。今天的议程非常丰富，我衷心希望这样一个讨论，对大家提高对人工智能产业发展趋势的了解，对把握相关投资机会能够有帮助，谢谢大家!

　　杨静：AI成为网红，资本市场高度关注人工智能

　　【新智元创始人杨静】新智元是人工智能的一个社交资讯平台和智库，今天有几位主讲人都是人工智能智库的专家和执委。

　　今年是人工智能的60周年，人工智能可以说成为了网红，第一次走入大众。3月份AlphaGo战胜李世石相信大家一定记忆犹新。新智元这样的人工智能专业平台在3月份订阅量超越6万。今天正值北京车展，也变成了智能车展，可以看到人工智能不仅是走入大众，也走进了国民经济的主战场。4月份新智元的订阅量也达到了7万的历史新高。

　　去年我们跟北京龙泉寺共同研发的机器僧，现在也成为了网红。所以我认为人工智能学家也要变成网红，希望芮勇院长他们将来也会成为大咖网红。

　　资本市场高度关注人工智能产业，新智元希望把技术的评估、技术的体系引入人工智能产业的融资体系里来，让人工智能投融资有更多的技术含量。我们也跟平安银行共同成立了人工智能产业基金，希望借助我们智库专家的评估，一起来为人工智能产业建立一个更为科学的评估体系。

　　最后再推荐我们的一本新书，《新智元：机器+人类=超智能时代》在京东和当当人工智能排行榜也是名列前茅，其中有新智元智库专家关于人工智能趋势的解读，我希望今天通过他们的演讲，大家能够更多地了解人工智能产业的发展趋势，通过我们这本书，更加了解新智元和人工智能。

　　谢谢大家!

　　微软芮勇：从人工智能到增强智能

　　【微软亚洲研究院副院长芮勇】三个AI

　　第一个AI是Agglomerative Intelligence，叫做聚合智能。就是把很多人类的智慧加以提炼，用大数据去挖掘，让机器去学习。第二个AI是Adaptive Intelligence，叫做自适应智能。这个人工智能能够根据环境变化进行自我适应调整。第三个AI是Ambient Intelligence，叫做隐形智能。

　　聚合智能

　　人类有很多的知识以大数据的形式存在，那么通过机器学习的方式，把大数据中间的知识挖掘出来，充实自己，这样机器能够做到像人类一样，有各种听觉、视觉、触觉的感觉。微软做的一个项目叫认知服务，把它放在云上，开发API对各种认知功能进行调用。存储云还不够智能。认知云通过人们调用它的API，可以让第三方开发出来很多像人类一样可以去听、去说的APP。微软云认知平台是把微软过去20年在人工智能上的一些成果转化为一些API，供第三方去调用，包括视觉、语音、语言、知识和搜索。

　　计算机视觉包括人脸识别、视频检测、性别识别。 2015年4月份全球流行的年龄估算的APP，在座的各位可能都上传过自己照片。这个是通过认知API，写20行代码去调用完成的。2015年12月微软发布了第二版，能够识别人的表情，是高兴，吃惊，悲伤，还是愤怒。微软做的一个项目叫认知服务，把它放在云上，开发API对各种认知功能进行调用。计算机视觉领域有一个全球顶级比赛，是依据1000张图片，让计算机帮你分类，它没有见过的图片是属于这一千类的哪一类。这里就要说到深度学习，其实就是原来的人工神经网络。在深度学习应用到计算机视觉之后，计算机针对1000类物体做分类的错误率从20%降至2011-2012年10%，2014年达到6.7%。2015年年底，微软的深度学习算法有了进一步的发展，将错误率降到了3.57%。

　　深度学习的一个标志性进展，就是看人工神经网络有多深，做得越深，学习能力就强。2012年深度学习这个词出来能做到8层，2014年能达到19层。关键是算法要对，如果算法不对，在GPU上跑不起来，错误率就降不下去。2015年底的时候，微软研究院的小伙伴做到了152层，可以去挖掘大数据原来没有被发现的一些东西。

　　比图片分类更难的是把图片里面的物体检测出来，也需要深度学习的方法。比物体检测再难的，就是像素级的精确识别。计算机如果在每个像素级都做到非常精确，就会有很广阔的应用前景，比如无人驾驶和精密工业制造。第一个人工智能的属性叫聚合智能，就是从人类各种大数据中挖掘出来知识，然后进行深度学习。

　　自适应智能

　　微软做出一个手机自拍APP，让它来帮我们把这些拍照背景、光线等困难的事情考虑进去。判断被拍照人是什么性别、种族、年龄，这些智能功能都包含在APP里面，不用人类去考虑，所以叫自适应。

　　还有一个例子是实时语音翻译技术。微软的语音识别团队在1992年就已经成立，5、6年前集中精力做这个事情，已经做到中英文实时翻译。2015年推出新产品，通过SkypeTranslator可以享受到全球八种语言的实时翻译。

　　实时翻译至少需要实现四个技术。第一是计算机需要把音频信号能够识别成文字;第二步，机器需要把话中间没用的东西过滤掉;第三步，改良后更加准确的文字的实时翻译;第四步，译文文字变成声音说出来。这四步串联都要高精度有效完成。第一步是语音识别，近年与深度学习相结合，使原来语音识别的错误率从30%降到百分之几。第二、三步是实时的机器翻译，根据个人的说话方式去调整语言模型。第四步是把文字再变回到原来讲者口音的声音，目前也有一些算法可以实现。

　　隐形智能

　　不管是智能的会场，智能的家居，智能的家电，有很多的传感器在环境里，传感器能够实时感知，然后给我们提供更好的服务。为了使得这些设备、穿戴、楼宇有智能理解世界的能力，就要应用到计算机视觉等几个人工智能组合。比如让计算机看一幅场景，它能说出是一名男子在表演滑板，确实已经有这样的技术，它的应用场景也很多，其中一个就是帮助盲人朋友。还有全息计算的未来，微软在今年上半年也会开发自己的SDK。Hololens也有很多的应用，比如在医疗行业、人体分析的教学阶段、室内设计、工业设计等。

　　增强智能

　　绝大多数的人工智能目前还是弱人工智能，就是去做一个人类规定好的、有规则的事情，比如说下国际象棋和围棋。人脑有左右脑，其中左脑是记忆和计算，可以根据一些有规则的事情去推理;右脑是想象力，抽象能力，天外神来之笔就是从右脑来的。弱人工智能是在模拟人的左脑，所以我认为不是人要和机器去PK，人类和机器各有所长，而如何将双方强的地方结合在一起，叫做增强智能。今后60年更是一个人类和人工智能相互增强、各取所长的阶段，这会使得人类能够更有效地去处理各种事情。

　　驭势吴甘沙：人工智能：技术、产业与社会变革

　　【驭势科技创始人、CEO，前英特尔中国研究院院长吴甘沙】信息革命已经经历三个周期，未来将是智能化时代。第一个周期是1950到1970年，计算机完成架构化;第二个周期是1970到1990年，PC出现，开始数字化生存;第三个周期是1990到2010年的网络化。从2010年开始的新的20年周期将是人工智能时代。

　　人工智能的发展经历了三次高潮和两次低谷，目前处于第三次高潮中。1956到1974年是人工智能第一次黄金时代，此时的智能来自于逻辑和推理，出现神经网络等概念。1974年以后，因为计算机内存受限、神经网络被唾弃等原因，人工智能第一次冬天到来。1980年后，人工智能再次发展，知识工程和专家系统大行其道。神经网络在这个阶段重获新生。随后很快第二次冬天到来，因为专家系统昂贵，而通过人类总结获得的知识局限性很大，而日本的第五代计算机梦也破碎。1993年以后，人工智能又一次迎来繁荣，这一轮到目前还没有明确的冬天出现。

　　人工智能三个不同的学派：符号学派、连接学派、行为学派。(1)符号学派起源于逻辑推理。该学派取得两个标志性事件。一是战胜国际象棋冠军卡斯帕罗夫，二是在知识竞赛中赢了人类冠军。(2)连接主义是仿生学的概念。大脑的智能是来自于860亿个神经元、以及这些神经元之间万亿级别的连接。连接主义的理念是智能来自于计算和大数据。深度学习之所以现在能够流行起来，是因为计算能力增强和充沛的大数据。(3)行为主义强调和环境做交互，能够模拟生物运动。双足的机器人把仿生学和行为主义做到了极致。

　　人工智能三个学派之间有融合。(1)连接主义和符号主义产生融合，例如Siri通过连接主义做语音的识别，同时又通过符号主义提取重要信息;(2)AlphaGo是符号主义+连接主义+行为主义的结合。

　　人工智能从数据中提取信息，再从信息中提取智能。前者已经有长足进展。从信息中提取智能有不同的方法，包括：(1)通过交互的方式，行为主义或具身智能就是通过交互的方法来获得智能;(2)通过认知的方式，IBM总结的认知方式包括理解、推理和学习。

　　短期内应该鼓励人工智能技术发展，但人工智能不应被过度消费。(1)短期内应该充分让人工智能技术发展，但不应被过度消费。前两次人工智能的冬天都是因为被过度消费，大家对它寄予过高期望;(2)中期内人工智能可能对社会产生一定影响，但还不会对人类的存在性产生风险;(3)长期看，在50年尺度上，如果进入强人工智能或通用人工智能，机器产生自我意识，可能会对人类的存在带来一些风险。

　　未来五年是人工智能进入各个垂直领域的红利期。未来人工智能一定是走专业化道路，而不是通用道路。近年人工智能比较火的领域是自然语言处理、计算机视觉、人工智能与金融的结合。人工智能未来的几个发展方向中，包括人工智能硬件、垂直领域服务机器人、聊天机器人等都存在着机会。

　　汽车行业面临大变革时代，汽车将被自动驾驶重新定义。传统上汽车产业是非常保守的，但现在面临着百年未遇的大变革，包括新能源、出行共享、智能化、网联化，汽车将会被重新定义。未来，服务业、物流业、保险业等都会被自动驾驶影响，或者重新定义。

　　Business Insider的报告认为具有自动驾驶功能的汽车未来几年预计年复合增长率会达到134%。摩根史丹利认为自动驾驶将为美国每年带来1.3万亿美元的好处，包括燃油节省、事故减少、生产力提升、交通拥堵减少等。

　　秦培景：人工智能——扬帆未知的蓝海

　　【中信证券研究部策略分析师秦培景】我们主要从资本的角度、历史的观点，去看未来在人工智能这片蓝海怎么以技术为锚，人工智能为帆去航行。

　　从AlphaGo事件出现以后，人工智能从中长期来看离应用没有那么远，或者至少存在一个资本盈利的模式和趋势性的改善机会，下面我们将从四个方面进行介绍。

　　第一，为什么AI开始受到一二级市场的关注，从AI发展的理论-实验室-应用的整个过程来看资本回溯逻辑。

　　为什么要投资和关注人工智能。从长期来看，科学是第一生产力，但科学必须依赖技术才能转化为生产力。人类已经经历过三次工业革命，而人工智能一定是助推第四次工业革命的重要技术变革。人工智能历史上有三波浪潮，前面两波浪潮由于技术不支持和缺乏终端需求倒逼没能形成产业革命。

　　从外部环境来看，AI受到政策、资本热点和人才红利共同支持。政策上，发展AI已经写入“十三五”规划;资本市场角度，2015年创业融资已经超过了过去八年的总和;人才培养方面，中国存在“工程师红利”，每年理工科毕业生50万。从内部环境来看，人工智能的核心是算法，数据存量和计算能力是基础。深度学习技术显著改进了算法层面，人类所拥有的数据量每两年翻一倍，而云计算使得商业化成本越来越低。

　　第二，中国的人工智能也有广阔的应用前景，并且中国的人口红利、工程师红利、资本的红利都在逐步体现出来，看好AI产业的三个高成长领域。

　　人工智能应用的产生是需求推动供给和供给创造需求两种逻辑同时存在的。需求推动供给，是逼迫技术去创新;供给创造需求，是技术层存在突破，为应用多元化提供可能。中国是典型的需求推动供给的产业逻辑。因为在中国资本投入到应用层，边际回报率是远比其他要高的，在技术层投资的是一些资本大鳄和大公司，基础层则是资本密集型和数据密集型的产业。

　　因此，未来A股或者整个中国投资机会，主要来自于应用层和技术层。应用层可以分为三个层次：计算智能、感知智能和认知智能，目前计算智能和感知智能的市场规模和公司数量是非常庞大的。据统计，目前计算智能方面的公司最多，特点是市场规模比较小但复合增长率最高。第二个是感知智能，因为和应用非常接近，是目前市场空间最大的，预计2016年大概145亿美元，投资价值高、涉及领域广。

　　从技术角度看，AI主要有四大模块：图象识别、语言处理、机器学习和人机交互，进一步融合有十几个主要细分领域。投资机会主要来源于三方面：市场规模和复合增速，产业资本热度，以及应用产品。在市场规模复合增速方面，机器学习(40亿美元)、图象识别(57亿美元)以及智能机器人(32亿美元)是比较高的，预计未来五年GAGR达30%以上，未来应该可以实现高增长。从应用范围和投资回报率来看，应用范围决定技术未来持续回报的规模，VC和前期投入的情况已经很多产业有比较大的投入。我们看好机器学习、图像识别和智能机器人三大领域。

　　第三，怎样选出在三个高成长领域中有望脱颖而出的公司。

　　一是有技术壁垒的公司。围绕形成技术壁垒的公司多是一些互联网巨头的公司，而且这些互联网巨头进行收购，并不是要形成某个应用领域的垄断，更多是想在技术领域形成一种垄断，或者是明显的先发优势和技术壁垒。此外，我们同样看好拥有技术壁垒的初创公司。二是选择高前景领域。首先是机器学习，这也是一个互联网巨头占绝对领域的背景，从IBM、谷歌、微软到百度，机器学习需要非常高的资本投入和技术支持，小公司很难立足。然后是图象识别，因为是深度学习的进展，一些公司开始在动态识别领域进行，比如智能安防。除此之外，无论是对声音、视频还是语音，图象识别这个领域是离应用最近的，可以很快通过应用去兑现。最后是智能机器人，我们比较看好智能机器人和服务机器人，因为在整个智能机器人的领域，在精密操作上达不到工业机器人的量级。如果是一些比较简单低级的服务，一些家庭应用教育娱乐的机器人比较有前景，因为这是一个从无到有的产业，所以初期复合增长率是比较高的。三是商业化应用。在国外，谷歌和苹果是基于已有用户的基础，去推荐智能领域对应的技术。国内的公司更多是有数据，需要技术来使用这些数据。比如像阿里云、百度的深度学习。

　　第四，推荐两条投资主线。

　　对A股标的进行梳理，我们有两个推荐逻辑，一个是技术优势，通过收购和并购初创企业，取得技术壁垒。第二个是从商业化应用出发，通过技术不断的拓展在人工智能等领域进行商业化应用。在技术优势方面，看好通过投资或收购人工智能领域开发公司，快速地获得技术优势、进而领先布局人工智能领域的龙头企业，以及针对三个高成长领域投入大量研发资金推动技术创新、抢先形成技术壁垒的公司。在商业化应用方面，“人工智能+”料将引领产业变革，推荐关注人工智能+娱乐、人工智能+金融、人工智能+安保等新的业态和商业模式。

　　结语：从人类中长期发展来看，从工业革命以后，以技术为起点的任何线性预测都是无力的。人工智能能够使得我们的存量信息产生出更有意义的结果，能够使得人类无论是在学习和生活方面都能有很快的提升，因为人类自身的进化是漫长的，而数据的计算能力和数据存储的进化是指数级别的。

　　脑洞再开大一点，无论是动物和植物，都是碳基生命，可能在短期来看，看不到人工智能对人的主要工作的替代，但在人类中长期的发展长河中，从碳基生命到硅基生命或许是一个很重要的突破，可能的突破就是人工智能。

　　IBM郭继军：认知商业，未来已来

　　【IBM大中华区副总裁、战略部总经理郭继军】颠覆已经成为常态，推动颠覆的三个力量包括数据类型的井喷、认知计算和API经济。

　　数据被认为是下一代的资源，企业需要提升对数据的理解。数据是下一代企业的基础。在未来，企业依靠对数据更深刻的理解，来差异化企业自身和竞争对手。目前中国只有不超过15%的企业真正从大数据里获益。

　　认知计算有助于打造人类和机器协同发展的环境。IBM发展人工智能技术的目的不是用机器来替代人类，而是从人工智能中提炼出核心技术，例如深度学习和模式识别等，再利用这些核心技术帮助人类克服自身的不足。认知计算的发展将促进人类和机器的协同发展。

　　API经济处于高速发展阶段。IBMWatson目前拥有50多种关键技术，新的技术正不断被开发出来。每个关键技术都是认知应用的基本要素。开发者不必从头开始，通过Watson API就可以使用这些关键技术。全球有来自45个行业的超过500家企业与Watson合作，有8万人员在平台上进行开发，每天都有新的应用被开发出来。

　　Watson已经被应用于生活的各个领域。(1)球队数据分析。NBA猛龙队与IBM合作，用数据分析来挑选球员、制定比赛对策、临时调整对阵方案。改变了以往教练拍脑袋做决定的情况;(2)智能穿戴监测健康状况。IBM通过分析用户数据，为用户提供运动建议;(3)辅助医生诊断。IBM辅助医生诊断，让诊断正确率从90%提高到95%，甚至99%;(4)与机器人本体厂商合作。IBM把Watson变成一个大脑，植入到机器人里面，使其能够跟人类交互;(5)帮助政府治理雾霾。IBM通过分析空气流动、排污情况、社交网络评论和照片等数据帮助北京市政府对抗雾霾;(6)协助政府推行分级诊疗。IBM通过对公众信息、医院信息、病人信息等的认知分析，给决策者提供及时的报告，评估推行政策的效果和问题。

　　科大讯飞江涛：认知智能的挑战

　　【科大讯飞高级副总裁江涛】很高兴有机会在这里与大家做一个分享，关于科大讯飞对人工智能的看法，以及我们觉得面对人工智能大潮，我们应该怎么做。

　　在座的金融行业的从业者，最擅长的是在不确定性中找到确定。关于人工智能，可以确定的是，基于深度神经网络+大数据+云计算+移动互联网和物联网的弱人工智能，在未来5-10年将改变社会生活、改变政府做决策的方式、改变企业做经营的方式、改变人类的就业和工作方式。

　　人工智能发展至今已有整整60年，60年中，经历了三次跌宕起伏，我们研究院曾经在一次发言中提及，中国无论是在对深度神经网络的应用学术层面，在拥有移动互联网的基础设施层面，还是在用户规模层面，在计算能力层面，应该说中国企业都不比国外的同行差。我们有理由相信，这一伦人工智能的大潮，包括科大讯飞在内中国企业定能占据一席之地。

　　相关技术将在未来5-10年，可能会很快改变我们的生活，改变政府的决策方式，改变企业的经营方式。IBM的同行也介绍了他们这一方面取得的成果，应该说一定会比大家想象中来得快

　　从具体来看，人工智能当前面临诸多挑战，在弱人工智能方面，可以归到三个层面：计算智能，感知智能和认知智能。这些是我们具体的工程师、科学家们正在研究的问题。

　　计算智能方面机器的优势越来越大，感知智能这几年进展也非常显著，但是认知智能是当前最需要解决的问题。人类和动物最大的区别就是人类有我们自己的语言系统，有了语言可以形成概念，概念的基础上可以进行逻辑推理，然后是进一步的分析归纳等。语言的使用区分了人与动物，也是人工智能最大的挑战，归纳起来就是认知智能。IBM的同行也讲到了，IBM在人工智能方面取得了一些进展，在特定领域内对人脑的推理学习，对高级神经的模拟。

　　人工智能领域全球最大的一个挑战项目就是考试机器人，美国、日本和中国，应该是大体上在同一个起跑线上，美国是华盛顿大学图灵中心，科大讯飞有10个联合实验室和联合实验机构，去年在北美加拿大多伦多成立了联合实验室，就是做人工智能和产业相关的研究。通过十几年的艰苦努力，我们形成了一套在中国独一无二的产学研一体化的机制，对此，我们十分自豪。

　　讯飞超脑计划介绍与阶段性成果。刚才讲了这么多确定性的事情，就是深度神经网络加上云计算大数据，预计在不久的未来将在很多方面改变人类的生活。而脑科学与信息技术的结合，一旦出成果，产业意义会更大。在这一方面，中国应该说也与发达国家站在同一起跑线上：奥巴马政府推动大脑活动图谱计划，欧盟叫人类大脑项目，中国叫中国脑计划，经过酝酿也即将启动，就是对大脑高级神经活动的结构和运作机理深度的研究，进一步推动人工智能的发展。科大讯飞深度参与中国脑计划的研究，该计划的首席科学家就是科大讯飞研究院院长胡郁。另外，科大讯飞还已正式成为上海脑计划的一员。

　　阶段性成果一：口语翻译达到英语六级水平。科大讯飞超脑从前年年底启动，截至目前，一个成果就是英语口语翻译已达到6级水平。机器翻译一直是认知智能领域中非常具备典型意义的项目之一。

　　阶段性成果二，口语作文评测机器可代替老师。目前相关部门已经启动对于高考的改革，拟引入口语考试，考核考生听说的能力。科大讯飞相关技术已经超过了国家的评测员，在口语作文打分方面，2014、15年，我们的机器人已经能够替代老师对口语测试进行评分。2013年开始，计算机和老师是平行打分，互相校验，14、15年广东省高考英语口语测试全部由机器人打分。

　　阶段性成果三，开放式主观题评测取得突破。第一个环节是OCR技术的突破，科大讯飞把图象识别的感知智能和语义理解、上下文的认知智能进行结合，便在该领域产生了重大的突破;第二步要通过句子、段落和篇章基于语音理解的相关系数，真正进行评价。这个技术去年实现突破后，教育部考试中心先是在安徽进行了一次实验，600多个考生的试题由科大讯飞的机器进行打分，机器打出的分数和人工打分很接近，这方面是很好的突破。

　　阶段性成果四——唯一达到实用的语音实时转写。大家看一段视频，两会期间，安徽省代表团在会议过程中已将该技术投入使用，并取得了很好的效果。预计未来整个知识管理领域，将有很多工作逐步由机器来替补，速记是重要的知识管理工具。

　　阶段性成果五——革命性的人机交互。机器人跟我的距离很远，这个时候我说的话就很难能听见，打电话的时候，如果电话在我身边，对方是听得很清楚，但是我的电话离我有五米，对方根本听不清楚，距离不断的变远，这个时候就得靠远场降噪技术。科大讯飞正好把语音识别和语音理解有机地整合在了一起，让机器人做到始终聆听你所说，需要处理就处理，不需要处理就一直在边上听着，实现了人机交互的技术突破。

　　IBM的同行业介绍了感知智能的很多应用，科大讯飞在英语教育领域，正在积极储备，人工智能未来很快会在教育领域产生很多革命性的变化，另外在医疗、智慧城市等这些方面，都会在很大程度上替代人类。

　　人工智能未来30年战略机遇。未来5-10年内，人工智能就会像如今的水和电一样，成为人类生活中的标配。科大讯飞拥有一批世界顶级的科学家，也有几亿用户级的人工智能开放平台，平台上已经有七亿多用户，去年活跃用户1.8亿，每天请求数已经达到了十几亿人次，这也是业界最大的人工智能交互平台，无论在算法，还是在科研力量，还是在数据方面，我们都已经做好了准备。

　　谢谢!

　　“人工智能产业”专题论坛(人工智能•技术)

　　出门问问李志飞：AI3.0——人工智能的历史和未来

　　【出门问问创始人、CEO 李志飞】AI的发展可以被分成三个阶段，现在是AI3.0时代。从应用的角度(而不是学术角度)来看，以2005年和2015年作为两个分界点，1950年代到2005年是AI1.0时代，2006到2015年是AI2.0时代，现在进入AI3.0时代。

　　AI1.0是基础理论构建的时代。基础理论和相关学派在此阶段被建立起来。比如说有的学派强调逻辑，通过给计算机下达明确规则指令来模拟人的行为。有的学派强调数据和结果，机器主动从数据中挖掘信息。AI1.0的作用包括：(1)让公众理解什么是AI;(2)在研究AI的过程中发展了计算机技术。

　　AI2.0开始走向大规模toC应用。2005年以前，没有面向大规模用户的商用AI系统，谷歌翻译在2005年改变了这一局面，2007年发布的谷歌语音搜索是另一个例子。这些应用每天都有上亿的用户使用，是核心AI技术(机器翻译和语音识别)第一次得到如此大规模的toC应用。

　　一个大规模的AI系统包括三个部分，数据、算法和基础架构，三者相辅相成。在算法层面，谷歌、微软、IBM等巨头之间的水平差异不大，也不存在独家拥有的算法。谷歌的成功很大一部分归功于数据和基础架构。

　　深度学习在未来几年可能会遇到瓶颈。谷歌在2010年之后，数据红利和基础架构红利下降，单纯依靠增加数据规模已经不能继续提高正确率了。当然，在2012年后，由于深度学习的发展，数据和计算的红利在过去几年得以持续维持。但是，在给定一个机器学习算法的基础上，只靠增加数据能起到的作用是有极限的，未来想得到进一步提升必须在算法上有持续创新以及对问题本身(如语音、语义)有更深刻的理解。

　　AI3.0时代可能的两个路径是从软件到硬件和从信息到服务。AI2.0时代人工智能得到了社会广泛关注和讨论，未来会怎样呢?对于AI这类新技术，除了给出发展的预测外，还应该给出执行路径，明确每一步需要尝试哪些东西。未来大的趋势有：

　　(1)从软件到硬件。AI是一种新的交互方式，传统的硬件平台使用键盘和触摸屏，和AI的交互方式不匹配。这也推动了能适应AI交互方式的新硬件平台的诞生，例如支持语音交互的可穿戴设备。(2)从信息到服务。从“附近有什么咖啡馆”到“给我来一杯咖啡”的模式转变。

　　出门问问公司Ticwatch产品已经取得不错的市场表现，同时也在布局和车相关的智能产品，未来还会在机器人领域探索。公司运用的语音识别技术全部是由自己开发的。公司拥有整套AI技术，包括语音交互和手势算法等，公司也有自己非常完整的硬件和操作系统(如Ticwear)的研发团队。目前公司和谷歌有开展合作。公司的业务主线是技术—操作系统—硬件本身，目前软硬结合产品的落地形态是手表，以后会开发跟车相关的软硬结合产品。今年夏天，公司将发布二代手表和车载软硬结合的操作系统。

　　京东李成华：人工智能技术与产业应用

　　【京东深度神经网络实验室首席科学家李成华】人工智能技术演进可以分为四个部分：

　　(1)逻辑智能。主要依靠搜索推理，类似走迷宫，一条路走不通就退回来选另一条路;(2)专家系统。用程序化的语言去模拟人的经验和思维，然后来解决应用问题;(3)机器学习。不需要任何规则，只需要告诉机器起点和目标，让机器通过数据去自我学习;(4)深度学习。也是机器学习领域的一个算法，但是取得了非常大的突破。

　　深度学习是推动人工智能发展的重要里程碑。Hinton在1980年代提出神经网络，2006年又提出深度模型。2011年之前，深度学习还停留在学术层面，2012年后开始被认可并得到了IT巨头的大力投入，从而也打开了人工智能的应用场景。例如，图像识别的准确率从原来的74%多逐步提升至96%以上，图像识别准确率的提升又带动了指纹支付、人脸识别、自动驾驶等技术的发展。

　　国内外巨头都已布局人工智能。谷歌在2012年率先成立深度研究实验室，也宣布了谷歌大脑计划;百度2013年百度成立深度学习研究院;脸谱2013年成立人工智能实验室;苹果在2015年大量招聘人工智能人才和收购人工智能初创公司;腾讯、微软、京东、阿里等也在2014到2015年布局人工智能。

　　人工智能技术目前比较成熟的是图像识别、自然语言处理、语音识别，已经有较为成功的应用。目前，利用这三种技术已经出现了比较成功的应用案例，包括：(1)自然语言处理公司，例如IBM Watson在医疗、金融、法律方面有很好的应用;(2)Siri为代表的智能交互工具，还有小i机器人、微软小冰、百度度秘、京东Jim等;(3)智能家居、无人机、机器人、智能硬件等。

　　人工智能的未来有四个可能的趋势值得期待。(1)更加智能的算法和更加好的应用场景。未来若干年，在自学习和自适应方面可能会有更大的提升和突破，这也将带动应用场景的拓宽;(2)更快的分析能力和应用能力。GPU相对CPU的计算速度，实际上已经快了几十倍;(3)更加智能的互动。未来两三年，自然语言处理可能会有比较大的突破;(4)更热火朝天的竞争。谷歌、百度、IBM、微软等都开放了它们的人工智能平台，会有更多的开发者参与到这些平台上来，进而提高整个技术能力。

　　人工智能相关系统设计

　　【中科创达副总裁杨宇欣】设备的智能化趋势

　　人工智能发展源于最近几年火热的物联网市场的发展，设备智能化的趋势明显，之前是智能手机，现在有手表，未来整个产业看到的将是每个人周围智能终端越来越多，看似不智能的设备，会通过软件升级变得越来越智能。

　　这几年物联网产业发展非常快，物联网是下一步的趋势，从互联网到移动互联网，产业链的布局和不同厂商的角色都发生了很大的变化。之前从投融资的热点来讲都是投物联网，过了O2O和P2P之后，互联网能投的东西不太多，现在都是通过软硬结合，目标是物联网相关的人工智能的方向。

　　智能硬件市场跟传统的这些智能设备的市场不太一样，物联网市场是一个高度分化的市场。现在我们看到在智能硬件市场，市场的细分化和长尾化非常明显。而且现在很多新的技术都来自于创新公司，我们看到了行业里面无论是算法的公司，还是产品的公司，很多新的创业公司都是从大的企业里面出来的，这是一个很明显的趋势。

　　智能终端的三个层次：感知、识别、判断

　　我们认为人工智能发展到下一个阶段，很多云端的智能要跟终端结合。现在我们更多专注在终端上。我们把智能终端分成三层：感知、识别，加上判断。第一个是感知，原有感知技术不能满足新需求，很多新型的柔性材料，和传感器结合，可以把更多的数据采集下来。

　　另外就是识别。从人工智能来讲，深度学习的算法很多会被用在识别和判断这两层，感知有很多的传感器，有很多的半导体，识别判断有很多的算法，我们看到很多的合作伙伴，或者创业公司，一部分会专注在识别相关的算法，把深度学习和人工智能的东西来做识别，做了识别之后要去做判断，无论是机器人，还是无人驾驶，它们在知道周边的环境，并了解周边的环境情况之后，更多是要做判断，要替人去做决定，这些都是人工智能需要做的领域。

　　我认为现在还没有到这一步，更多是技术的积累。现在是解决技术问题的时代，若干年之后解决哲学的问题，到底人和机器是谁主宰这个世界。

　　强大的系统支持和终端平台

　　人工智能需要更强大的系统支持，需要更智能，更集成，更强大，产品质量更加可靠，软件成熟度更高，所以如何把之前整个行业积累下来的技术利用到更多的跟人相关的产品上，这是整个产业都在解决的问题。

　　智能硬件产品化之路还是挺难的，从产品的概念，完成工业设计，电子部分的开发，到软件的开发，还有量产，整个产品能上市的工作只完成了一半，造十台和一万台，结果是完全不一样的。其实在整个智能硬件这一块，我们是致力于解决一系列从概念到整个产品的问题。营销我们解决不了。

　　智能设备的生态系统，可能跟原有的生态系统不太一样。因为从产业链的上端来讲，很多是IP供应商，把技术授权给芯片公司，用这种高性能的芯片产品来给不同的智能设备提供性能的保障。

　　对终端来讲，现在智能终端的产业结构变化很大，原来手机行业都是传统的手机厂商，现在越来越多的互联网厂商参与到硬件产品开发过程中。现在智能硬件和软件都是高度定制化的，而且软硬件是紧密绑定互相依赖的关系。比如VR这个设备，没有内容，就没有独立存在的意义。

　　另外现在智能终端的设备算法重要性变得尤为突出，比如说机器人和无人机，深度视觉的算法能够帮助这些设备更好地识别周围的环境。互联网厂商就是把它们的服务去嫁接到不同的硬件上。现在我们感觉在整个产业链其实有一个环节是比较重要的，就是需要把这些碎片化的技术更多整合成一个平台，能让更多的终端厂商，或者互联网厂商去使用。智能硬件存在的意义在于服务，通过这个硬件传递出来的服务，这应该是一个服务主导的商业环境，而不是像传统的手机是硬件主导的。所以现在需要一个集成化终端平台，把所有技术整合起来，能够给人工智能领域提供支持。

　　我们在推动核心模块化的概念，很多领域核心模块可以把基础硬件功能全部囊括进来，同时又变成一个算法，优化和集成的平台。其实在这一块我们的整个商业逻辑的概念比较类似于ARM商业逻辑。20多年前，全球大概30多种芯片架构;现在就两种，一个是ARM，一个是X86。所以一旦一个厂商出现能够把非差异化的部分做好，那么大家就可以专注于差异化的部分，更好推进这个产业的发展。所以我们会把一些标准的操作系统和软件部分做好，然后提供足够服务和开放的接口，让不同的厂商可以优化算法，同时基于标准的平台去做更多的产品。

　　人工智能相关产业比较

　　比较几个人工智能涉及行业，我们认为机器人是成熟最晚的。机器人由于技术不成熟，不能满足真正用户某些刚需。机器人是一个技术集大成的一个产品，无论是从各种的传感技术，还有各种的算法，包括后台的服务，包括机械、工作控制。所以我们认为这个产品的成熟还需要一段时间，我们能够做的就是把核心方案提供好了之后，让更多人给机器人开发的算法放进来。

　　无人机方案，产品形态比较很成熟了，我们提供了无人机的核心模块。我们希望做无人机的厂商能够专注于自己本身的差异。未来无人机的市场还是相对较大，之前大疆在市场上遥遥领先，其实它所关注的市场，更多是专业的发烧友的市场，这个市场全球基本上容量在100-200万台之间，这个容量我们觉得会继续增大，现在无人机的产品专注于新的领域，就是消费级的无人机，成本在300-500美金，主打跟拍，还有跟踪，成本比较低，控制也比较容易，能满足中国或者美国推出的这些要求，在250克以下，不能超过100米高，当做一个会飞的照相机，折起来跟平板一样大，可以装在袋子里，这个市场会达到千亿级的市场，这个市场有新的机会，这个市场更多拼的是品牌，还有营销，以及消费电子渠道。

　　无人机这个产业，中国的优势第一个在技术方面领先全球，之前无论是手机还是平板电脑，这些技术都来源于国外。无人机方面，无论是大疆还是其他的中国无人机厂商，它们在跟随的技术，在算法基础上，在全球都是领先的，我觉得很可能未来会出现无人机的“中国制造”的现象。

　　现在智能监控设备已经发展到第二个阶段，更多是增加了后台人工智能的算法，传统的监控设备都是拍的，现在可以做到很多识别的算法，并且会大量用在监控上，现在用的人脸识别和人流监测等商业的应用，未来在智能监控设备方面会开始慢慢普及。

　　人工智能和算法结合也日益紧密。现在我们看到很多新的硅谷公司，或者是一些团队，他们开始拿人工智能和深度学习的方式来开发算法。传统的引擎是用纯的识别理论去做识别，需要大量的学习，结合深度学习，可以极大提升效率。

　　国内一些做算法的公司，也开始引入这些深度学习的算法。人工智能有两条路，一种是纯软的，一类做独立的芯片。这个没有说谁好，谁不好，大家刚刚在做，接下来两三年是产业化很重要的时期，到底哪个路线会更快产业化，或者效果更好，可能是仁者见仁，智者见智的问题。从我们做智能硬件平台来看，我们认为通过这种平台的方式，可以让很多智能硬件产品更快地成熟。

　　关于中科创达

　　再介绍一下中科创达，公司于2008年成立，主要关注在操作系统和平台技术服务，现在2000多人，支持了非常多的芯片厂商和操作系统。公司之前是做智能手机起家的，现在在智能硬件、车载电子，还有安全方面都有自己的市场拓展。特别是智能硬件，我们主要看了几块市场，包括无人机、VR、机器人，还有可穿戴的市场。包括车载，在无人驾驶，技术方面我们有自己的产品，我们也有一些图形图象的优化和识别的算法，但是不多，我们现在更多的是跟别人合作，我们作为一个开放平台，通过平台能够更多地进行合作，我们会投资一些核心的技术团队，包括国内和海外的。同时可以给客户提供定制化的服务，包括软件和硬件。

　　除了自己做产品，公司本身在生态系统上也做了很多的拓展。我们跟ARM做了一个加速器，是专门针对智能硬件和物联网领域的加速器，在加速器的帮助下直接辅助创业公司做产品。我们跟中关村合作，跟高通合作，能让我们更好地担当平台的角色，从这个角度来讲，很多做人工智能的公司更愿意跟我们合作，然后更多更快地实现产品化，从而更快地成长。

　　智能驾驶那些事儿

　　【中国无人车未来挑战赛冠军车队核心工程师张天雷】智能驾驶包括车载信息诊断、辅助驾驶、无人驾驶三个层次。(1)OBD，车载信息诊断。通过诊断接口可以获得车上的数据并进行分析。OBD在2014-2015年迎来一波浪潮，腾讯等互联网公司打破了4S店对OBD的垄断，它们把行车状态收集起来发到云里，通过分析之后给用户修车、保养等方面的建议;(2)ADAS，辅助驾驶。通过激光雷达、相机、GPS等传感器，识别周围环境信息，并根据当前情况作出判断。车上安装的车道偏离报警就是辅助驾驶的例子;(3)无人驾驶。对车辆直接进行控制，包括速度、方向和刹车。通过这三个方面的控制来模仿或者超越人类的驾驶行为。

　　无人驾驶又分为定速巡航、变速巡航、部分自动化、自动换道等层次。(1)定速巡航。只对车速进行控制;(2)变速巡航。可以对前车的情况进行跟踪，根据前车的速度来调节自身的速度;(3)部分自动化。在部分条件下自动驾驶，但是换道需要人工来触发;(4)自动换道。在大部分正常天气正常路况下可以混入车流。能否自动换道是评估无人驾驶技术先进程度的试金石。

　　智能驾驶分为感知、认知、执行三个方面。(1)感知。通过激光雷达、相机、GPS等获得车辆自身和周围环境的数据;(2)认知。通过车载计算机来完成。目前商业化的自动驾驶系统主要是基于规则的，一旦触发了规则，就要采取行动。未来深度学习和强化学习的技术有望介入这一领域;(3)执行。执行有三大量，包括方向、油门、制动。好的自动驾驶依赖好的执行能力。

　　激光雷达价格高，这是无人驾驶比较难落地的一个原因。自动驾驶非常烧钱，激光雷达的成本是关键因素。可以参照手机的发展。手机在最开始的时候，价格也很高，随着产业链的发展，价格自然下降了。

　　GPS领域北斗做了一些比较好的廉价方案，今年可能有很多团队会换成北斗的方案。

　　无人驾驶最难的部分是人工智能。在给定周围环境的情况下，需要做一个决策，选择跟车、换道、超车等动作。如果是基于规则的系统，会发现规则越来越多，规则相互之间会发生冲突，这些都影响最终的效果。深度学习和增强学习在这个领域会起到很大作用。

收藏邀请

【智能制造观察】人工智能技术趋势与资本热点

相关分类

关于我们