大多数情况下,人工智能并不是一种全新的业务流程或全新的商业模式,而是对现有业务流程、商业模式的根本性改造。AI重在提升效率,而非发明新流程、新业务。未来10年,不仅仅是高科技领域,任何一个企业,如果不尽早为自己的业务流程引入“AI+”的先进思维方式,就很容易处于落后的追随者地位。
大时代,大格局
人工智能来了,普通公众看到的是智能应用的惊艳,科技公司看到的是大势所趋的必然,传统行业看到的是产业升级的潜力,国家层面看到的是技术革命的未来。
AI时代,有AI大格局。我们可以不关心科幻影视中的机器人,却无法不正视今天的AI技术对产业、经济、社会乃至人类生活的巨大影响。
500年前,在航海大发现以及后来的工业革命时代选择闭关锁国的,后来大都因科技落后而被列强的坚船利炮敲破了国门。40年前,在个人电脑大发展时期错过了集成电路、操作系统、办公软件、数据库软件等技术机会的,只能眼看着英特尔、微软、IBM等公司占据技术制高点。10年前,如果在移动互联网的风口中错过了桌面平台到移动平台的转型,就只能在手机芯片及整机、移动电商、移动社交、移动搜索、O2O、手游等巨大商机前懊悔莫及。
今天,“互联网+”的理念已经向各行业、各应用的纵深不断渗透、落地,逐渐积累起来的高质量大数据为许多前沿行业打下了全面运用人工智能的基础。我们有理由说,“AI+”或“+AI”的模式已经步入蓬勃发展的大好时机。
大多数情况下,人工智能并不是一种全新的业务流程或全新的商业模式,而是对现有业务流程、商业模式的根本性改造。AI重在提升效率,而非发明新流程、新业务。未来10年,不仅仅是高科技领域,任何一个企业,如果不尽早为自己的业务流程引入“AI+”的先进思维方式,就很容易处于落后的追随者地位。
AI将成为国家科技战略的核心方向
2016年11月,第三届世界互联网大会在乌镇召开。名为互联网大会,但从议程的设置以及媒体报道的关注热点来看,这几乎已经是一届“人工智能大会”了。例如,大会的分论坛设置就有智慧医疗、智能出行等主题,都与人工智能相关。而作为时下互联网最核心的领域——移动互联网所在的分论坛几乎完全被人工智能相关的演讲“占领”。我们不妨来看一看官方发布的11月17日移动互联网论坛的议程134:
瞧,90%以上的话题都是——人工智能!如果说未来的移动互联网就是“AI+”的移动互联网,恐怕一点儿都不为过吧。
其实,对人工智能大趋势、大格局的重视已经开始从社会层面上升到国家层面。2016年5月,国家发改委、科技部、工业和信息化部、中央网信办就联合制定了《“互联网+”人工智能三年行动实施方案》135。2017年3月,第十二届全国人民代表大会第五次会议所做的政府工作报告更是明确提出,国家将加快人工智能等新兴产业的技术研发和转化。
在国家层面进行人工智能发展的战略规划和布局,这绝不是一件过于超前的事。人工智能发展涉及科研向产业转化的诸多挑战,在各行业应用AI提高生产效率、改进生产流程也需要更高层面的信息共享和整体规划,未来因人工智能引发的产业革命则亟待新一代教育体制、人才培养与再培训机制、新的社会保障体系等的建立和完善。单靠企业或社会的力量,这些全局层面的问题是很难得到快速解决的。
2016年,关注全球人工智能发展态势的朋友一定会注意到,这一年几乎成了人工智能的“战略报告年”,从科研机构到咨询公司,从民间到政府,我们看到了许多份重量级的AI报告。
2016年9月,成立于2014年的斯坦福大学人工智能百年研究项目组发布了首份人工智能报告——《2030年的人工智能与生活》136。这个研究项目组包括17名成员,由人工智能学术界、公司实验室,以及产业界的专家与了解人工智能的法律、政治科学、政治及经济方面的学者组成。他们计划在持续至少100年的时间内,跟踪和预测人工智能产业的发展。《2030年的人工智能与生活》是这个百年计划发布的第一份报告137。
斯坦福大学这份报告首先列举了当前的人工智能热门研究领域,包括大规模机器学习、深度学习、强化学习、机器人、计算机视觉、自然语言处理、协同系统、众包和人类计算、算法博弈理论与计算机社会选择、物联网(IOT)、神经形态计算等。然后,报告概要分析了人工智能在2030年时最可能的应用场景,例如,包括智能汽车、交通规划、即时交通、人机交互等技术变革在内的交通应用,家庭服务机器人领域的应用,人工智能辅助的医疗应用,智能教育应用,在资源匮乏的社区内的应用,公共安全与防护方向的应用,就业与劳资关系,娱乐类应用,等等,并为政府和社会决策提供了一些政策性的建议。
2016年12月,高盛公司发布了长达百页的人工智能生态报告——《人工智能,机器学习和数据是未来生产力的源泉》138。作为金融服务、投资和战略咨询行业的顶级企业,高盛公司当然深知AI对于产业变革和经济走势的战略意义。他们这份报告的重点在于人工智能对经济发展的影响和人工智能时代的投资机会。高盛认为,人工智能在四个方面的影响力最为显著:
·生产率。根据高盛首席经济学家简·哈祖斯(Jan Hatzius)所说:“大体上而言,AI看起来似乎比上一次创新浪潮更有可能在统计数据中捕捉到更有价值的东西,人工智能可以降低成本,减少对高附加值生产类型的劳动投 入。”
·尖端技术。AI和机器学习在速度上的价值有利于构建一种在建设数据中心和网络服务时让硬件更便宜的趋势。
·竞争优势。我们看到了AI和机器学习具有重新调整每个行业的竞争秩序的潜力。未能投资和利用这些技术的管理团队在和受益于战略智能的企业竞争时,有很大的可能会被淘汰掉,因为这些技术可以让企业的生产力提高,并为它们创造资本效益。
·创办新公司。我们发现了150多家在过去10年中创建的人工智能和机器学习公司。虽然我们相信人工智能的大部分价值都掌握在具有资源、数据和投资能力的大公司手中,但我们也期望风险投资家、企业家和技术专家可以继续推动新公司的创立,从而促进实质性的创新和价值创造,即使最后创业公司会被收购。
美国政府也不甘落后。2016年10月至12月,美国白宫科技政策办公室连续发布了三份人工智能战略报告,分别是《为未来人工智能做好准备》《国家人工智能研究与发展策略规划》和《人工智能、自动化与经济》139。
白宫认为,生产率增速放缓和收入增速放缓的问题正困扰着大部分发达国家,而人工智能驱动的自动化技术,是进一步释放生产力,全面提升全要素生产率增长,并广泛提高美国人的收入与生活水平的关键。考虑到人工智能已经进入一个最为重要的发展时期,美国政府需要为科研、产业、教育等领域的相关发展提供一个战略方向上的指导。为此,《国家人工智能研究与发展策略规划》140提出了七个重点战略方向:
·策略1:对人工智能研发进行长期投资。将投资重点瞄准在下一代人工智能技术上,推动发现和深入了解,确保美国在人工智能领域始终居于世界领先地位。
·策略2:开发有效的“人—人工智能”协作方式。大部分人工智能系统将通过与人类合作来实现最佳绩效,而非代替人类。需要开展充分研究,从而达到人与人工智能系统间的有效交互。
·策略3:理解并应对人工智能带来的伦理、法律和社会影响。我们期望所有人工智能技术能够遵循和人类相同的正式与非正式道德标准。研究理解人工智能的伦理、法律和社会影响,并开发用于设计与伦理、法律和社会目标一致的人工智能研发方法。
·策略4:确保人工智能系统的安全。在人工智能系统广泛应用之前,需要确保系统能以可控的、明确的、已充分理解的方式安全操作。需要深入研究以应对人工智能系统所存在的威胁,设计可靠、可依赖、可信任的系统。
·策略5:开发人工智能共享公共数据集和测试环境平台。训练数据集的资源的深度、质量和准确度极大地影响人工智能的性能。研究人员需要开发高质量数据集和环境,并使可靠访问高质量数据集以及测试和培训资源成为可能。
·策略6:建立标准和基准评估人工智能技术。标准、基准、试验平台和社会参与是人工智能进步的基础,它们将指导及评估人工智能的进展。需要进一步的研究以形成一系列可评估技术。
·策略7:更好地了解国家对人工智能研发人才的需求。人工智能的发展需要一支强劲的人工智能研究团队。要更好地了解当前及未来人工智能研发对人才的需要,以确保有足够的人工智能专家应对计划中概述的战略研发任务。
白宫发布的三份人工智能报告,无论从深度和广度上都值得其他国家科技战略规划人员研究。不过,从另一个角度来说,美国政府在产业发展中所起到的作用历来有限。历史上,发生在美国的历次技术革命更多都是由科研机构或企业主导,而非政府主导。奥巴马在任时的白宫科技政策办公室在特朗普上台后,到底还有多少政策持续性,更是值得怀疑。
《人工智能时代》的作者杰瑞·卡普兰就完全不相信美国政府发布的所谓战略规划能有多大的约束力。杰瑞·卡普兰介绍说,许多年以前,美国启动了一个叫作“第五代计算机”的项目。日本政府也认为他们需要做类似的事情。政府认为他们可以主持建造所谓的第五代计算机——拥有大量CPU单元以提高性能的计算机。美国政府一度大力推动计划的实施,但这个计划从未变成现实。日本政府所做的类似努力让日本经济倒退了好几年,因为他们投入了数十亿美元却收效甚微。2009年,奥巴马总统启动了一个投资太阳能的项目。政府决定去做投资,我认为这是一件好事情。政府在不同公司投入了资金。在这些公司里,有一家叫Solyndra的公司拿到了5亿美元的投资,其中大多数来自政府。但这家公司在2011年倒闭了。当时,政府和民主党饱受批评。奥巴马总统的声誉遭受严重打击,因为是他推动设立了这个项目。能源工业在这些公司身上投入巨资,却因此而损失了数亿美元。141
杰瑞·卡普兰认为,当我们看到美国政府的类似计划时,我们必须持一种怀疑的态度。美国所谓的政策,很多时候不过是一群拥有美好愿望的人召开了一次政府会议,并发布了一些相关文件。这些东西通常并不具有约束力。白宫能做的事情非常有限。他们必须劝说工业界,劝说人们去做这件事。中国的公众看到美国公布了什么人工智能国家战略,也许会很焦虑。中国公众会想,我们也需要在这个领域做些什么,因为美国政府认为这很重要。但是,这种报告和政府声明在美国和中国的意义截然不同。中国政府拥有比美国政府强大得多的能力来将计划付诸行动。
显然,在讨论所谓“国家科技战略”的时候,我们需要认清不同国家在制定、实施相关政策时不同的角色和行动能力。对中国来说,政府和整个社会一向注重科技发展。今天是一个最好的将AI提升到科技发展战略层面,加强全社会协作与资源共享,发挥人才优势,快速占领AI产业制高点的机会。
从谷歌的“AI先行”看科技企业的AI战略
假如在互联网公司里找一家总是引领科技潮流的“前沿标杆”,那很多人都会想到谷歌。这绝不是因为谷歌有免费的美食和乐园一般的办公环境。谷歌之所以为谷歌,最重要的是,无论在哪一次重大的技术变革中,谷歌几乎都能敏锐地捕捉到先机,早早建立起领先竞争对手一两年乃至三五年的巨大技术优势。
当年,在移动互联网还在襁褓之中的时候,谷歌高层就极为重视,连续通过自研与收购相结合,为移动互联网打造了Android操作系统和Chrome浏览器两大基础平台。2009年前后,当i Phone手机和Android手机刚刚出现在普通人视野之中的时候,谷歌内部就要求大家按照“移动先行”(Mobile First)的战略来安排产品设计和技术布局,包括最核心的搜索引擎、地图、You Tube等在内的全系列产品早早就与移动应用场景接轨。拿产品用户界面来说,早在移动用户占比还不足全部流量的40%时,谷歌内部就要求所有产品的用户界面必须重点适配当时还特别狭小的手机屏幕——这一决策对谷歌产品的全面“移动化”至关重要。
要知道,在移动互联网时代,评论者经常嘲笑谷歌错失社交网络的绝好机遇,也经常揶揄谷歌连续关停Google Reader等人气产品。如果只看具体的应用级产品,谷歌在移动互联网时代的表现确实毁誉参半。但如果上升到战略层面,那么,谷歌对互联网技术大格局的认知之早、把握之准,实在是傲视同侪,比竞争对手高明太多。这就是谷歌能够顺利跨越互联网到移动互联网的转型关口,始终保持全球领先优势的原因所在。
同样地,这一次人工智能热潮到来之前,谷歌早早就做好了技术积累与铺垫。早在我刚加入谷歌、开始创立谷歌中国的2005年,谷歌研究部门的总监彼得·诺维格(他也是《人工智能:一种现代的方法》的作者)就在谷歌中心园区的43号楼举办了一个每周一次的机器学习课程。那时,在谷歌内部的研究团队和工程团队里,依赖机器学习技术解决实际问题的场景还不算多。但彼得·诺维格的课程已经吸引了包括大牛杰夫·迪恩在内的许多工程师,每次讲课都济济一堂,课程还被录成视频,在谷歌全世界的几十个办公室传播。
图54 深度学习在谷歌内部项目中的应用呈现迅速递增的态势142
2006年到2010年,深度学习在理论和实际应用上连续取得里程碑式的突破。对技术极为敏感的谷歌研究员和工程师几乎在第一时间注意到了技术革命的曙光。杰夫·迪恩带领谷歌内部最为精干的技术团队,开始打造神秘的谷歌大脑——这绝对是高科技公司内部第一次基于深度学习理论,建立如此大规模的分布式计算集群。谷歌大脑的意义,绝不仅仅是打造了一个可以进行深度学习计算的高性能平台这么简单。实际上,随着谷歌大脑成为谷歌内部越来越多技术项目的基石,谷歌也自然而然地喊出了“AI先行”(AI First)的战略口号。
从2012年到2015年,谷歌内部使用深度学习(绝大多数都依赖于谷歌大脑)的项目数量从零迅猛增长到一千多个。随着谷歌Tensor Flow深度学习框架的开源,谷歌以外得益于谷歌大脑的项目更是数不胜数。到了2016年,“AI先行”在谷歌已经不只是一句口号,而是随处可见的事实了。
2015年,谷歌创始人拉里·佩奇和谢尔盖·布林宣布成立母公司Alphabet,而谷歌则变成了Alphabet旗下诸多子公司之一。
图55 谷歌母公司Alphabet旗下的主要子公司一览
为什么拉里·佩奇和谢尔盖·布林要重组公司结构,将谷歌置于母公司Alphabet的旗帜之下?有人说,这是在分离健康盈利的资产和暂时亏损的早期项目;有人说,这是在给每个独立业务的未来发展提供更广的成长空间;有人说,这是在用兄弟公司打造生态系统,实现相互加持……
我认为,上述说法都有道理。但拉里·佩奇和谢尔盖·布林之所以要重组公司,还有一个重要原因就是要以谷歌大脑为基础,建立一个面向人工智能时代的新技术平台。在这个平台上,基于深度学习的谷歌大脑是驱动引擎,几乎每一家Alphabet旗下的子公司都像是安装了这一引擎,在不同赛道上飞驰的赛车。这里面既有人工智能驱动的生物医疗项目Calico,也有智能家居项目Nest,既有曾风光无限的自动驾驶项目Waymo,也有面向智慧城市的Sidewalk Labs。当然,Alphabet旗下最能带来现金收益的龙头老大,还要数早已将人工智能作为核心竞争力的搜索与移动互联网巨头——谷歌。
所有这些围绕人工智能技术建立的战略方向,让整个Alphabet集团变成了世界上最大的AI平台!
谷歌的“AI先行”战略为谷歌带来了展望未来的最好资本。其他互联网巨头或高科技公司也不甘示弱,纷纷展开面向AI时代的战略布局。
老牌IT公司IBM未来10年的战略核心是“智慧地球”计划,希望在智慧能源、智慧交通、智慧医疗、智慧零售、智慧能源和智慧水资源等领域全面发力。IBM Watson作为知识解决服务的代表,营收已占IBM总营收的22.17%143。今天的IBM Watson已经不再是一个单一的智能系统,而是被分解成不同领域里的人工智能组件,隶属于40多种不同的产品,分别解决不同行业、不同场景下的AI问题。
图56 2016年3月至2017年2月,英伟达(NVIDIA)公司股价的走势144
在显卡芯片领域深耕多年的英伟达(NVIDIA)公司在人工智能时代迎来了最好的机会。因为深度学习天生青睐于显卡中图形处理器(GPU)的强大计算能力,英伟达公司在AI时代一跃成为比英特尔CPU还要抢眼的核心驱动力。虽然深度学习的底层计算、加速芯片还远未达到一种技术包打天下的地步,GPU架构之外尚有ASIC、FPGA等多种不同的基础架构,但在深度学习的芯片市场上,英伟达已占据先机。与此同时,英伟达又多点布局,全面开展对深度学习加速软件、高性能深度学习计算服务器、自动驾驶解决方案等产品的研发。过去一年里,英伟达的股价一路飙升,这基本反映了英伟达在人工智能技术体系内的重要程度。
社交网络巨头Facebook不但将深度学习“三巨头”之一的扬·勒丘恩招至麾下,还挖到了著名深度学习框架Caffe的作者,曾在谷歌大脑工作的贾扬清。2016年11月,Facebook宣布,贾扬清的技术团队基于Caffe开发了一个基于移动设备的深度学习框架Caffe2go,首次在运算能力受限的手机上实现了实时的图像与视频捕获,以及后续基于深度学习的分析、处理。贾扬清说:“随着我们的不断进步,你可以想象,可以在(移动)设备上运行的实时AI技术将能帮助这个世界变得更加开放,让人与人之间的联系得以加强,特别是在无障碍应用和教育等领域。可以拿在手上的智能设备将会持续地改变我们对智能的定义。”145
谷歌、Facebook等互联网巨头不但在战略上纷纷布局人工智能,在技术层面加大人工智能的研发力度,还在最近五六年的时间里,大幅提高了对人工智能初创公司的收购力度。例如,谷歌收购Deep Mind公司并推出震惊世界的Alpha Go的故事早已成为人工智能领域最值得称道的投资案例。事实上,据不完全统计,从2011年开始,谷歌、IBM、雅虎、英特尔、苹果等科技巨头总计收购了140家初创的AI公司,其中,仅2016年一年,科技巨头对AI初创公司的收购案例就多于40件。
图57 按季度统计的AI初创公司被收购和并购的数量146
迄今为止,人工智能方向金额最为庞大的一笔收购发生在自动驾驶领域。2017年3月初,据报道,英特尔公司以153亿美元的巨资收购曾经为特斯拉Autopilot辅助驾驶方案提供技术的以色列公司Mobileye。这一收购创下以色列科技公司被收购的最高价,也深刻影响了整个人工智能的创投格局。例如,所有研发自动驾驶技术的创业公司在下一轮融资时,也许都会用这个收购案作为对标依据。
人工智能已经成为高科技企业制定战略规划时无法忽视的一部分。无论是依靠自身力量建立人工智能团队,还是通过收购、并购的方式获得相应的研发能力,高科技企业越早重视人工智能,越早拥有人工智能技术力量,就越容易掌控未来竞争。
科技“巨头”的潜在威胁
科技巨头全面拥抱人工智能,这当然是驱动技术革命的重要力量。但另一方面,科技巨头在人工智能领域的巨大投入也隐隐让专业人士为之担忧:AI时代,数据为王。谷歌等行业巨头坐享地球上最为丰富的大数据资源,利用这些庞大数据资源帮助人类克服挑战、解决问题当然最为理想,但谁又能从法律、道德等层面保证,对这些大数据资源的垄断不会成为行业巨头谋求一己私利的壁垒与工具?
硅谷著名投资人、网景公司(Netscape)联合创始人马克·安德森(Marc Andreessen)说,大企业在AI领域拥有几个巨大的优势147:
·懂得如何创建AI系统的人数非常有限。大企业可以为他们支付比创业公司更多的薪酬,就像雇用体育明星。大企业差不多可以把他们都收入麾下,留给其他企业的人才将少之又少。
·AI项目通常都非常大、非常复杂。这是全新的科技领域。亚马逊的Echo智能音箱是大约1500名工程师开发4年才完成的(注:马克·安德森这里说的工程师人数应该是有些夸大了,亚马逊CEO杰夫·贝索斯2016年5月在另一个场合的说法是:经过4年发展,Echo团队目前已有超过1000名员工148)。创业公司可没法投入如此多的资源。
·此外,还有对数据的需求。你需要巨大数量的数据集来创建AI应用。谷歌和Facebook之类的大型企业可以访问浩如烟海的数据资源,而创业公司则只能望洋兴叹。
2016年9月,谷歌(包括Deep Mind)、亚马逊、Facebook、IBM和微软等甚至结成了AI联盟(Partnership of Artificial Intelligence),并宣称:“我们相信人工智能技术必将改进人们的生活质量,并可帮助人类解决气候变化、粮食、不平等、健康和教育等全球性问题。为了更好地造福人类和社会,AI联盟致力于引导研究,组织讨论,分享观点,提供思想领导力,征询第三方建议,回答公众和媒体的疑问,并创建教学资源以推动包括机器感知、学习、自动推理等领域的AI技术普及。”149
巨头围绕AI技术结成伙伴关系,共同推动AI发展和合理应用,从这样的角度来看,这当然是件好事。但从另一个角度来说,巨头联盟只会加剧资源的进一步集中甚至是封闭。
我在参加瑞士达沃斯经济论坛时,曾和维基百科创始人吉米·威尔士等人讨论平台的力量。我们觉得,在国际化、资本、互联网趋势等共同作用下,未来的AI将会形成非常强大的平台,美国如谷歌、Facebook,中国如微信、淘宝。这些平台将汇集、整合原本零散的内容或应用,并因此大幅改善用户体验,使更多用户更容易享受到AI的巨大价值。
但专业人士和普通公众也有理由对这些集中了大量数据和计算资源的AI平台提出合理的质疑。例如,这些平台特别是巨头联盟的力量将特别强大,它们对整个科技圈的舆论影响将是决定性的。体量较小的平台发出的不同声音,很难在巨头世界里传达给普通公众。
同时,巨头围绕AI建立的平台也缺乏足够的透明性,较难与外界保持有效的沟通。一旦这些AI平台的利益与公众利益不符,在商业上也找不到可以制衡这些大平台的第三方力量。举个例子,假如Facebook借助庞大的社交网络资源,希望通过智能算法主动引导信息流动,并进而影响美国总统大选时的选民倾向,这在技术上几乎是完全可行的。我们当然知道,目前的谷歌、Facebook等巨头对人类的实际贡献远多于它们“作恶”的可能性,但从法律、道德角度,我们又必须想办法防范这一潜在风险。因为再友善的巨头本质上也是商业公司,巨大的商业利益永远是诱惑它们“作恶”的诱饵。
技术开源和数据开放方面,其实谷歌已经算是做得非常好的了。谷歌开源的Tensor Flow框架,已经成为业界深度学习的标准框架之一。谷歌在过去的几年时间里,连续开源You Tube 8M、Open Images、Audio Set等包含数百万份视频、图片、音频的标注数据集,为人工智能领域的科研发展提供“原材料”。但我们也必须知道,谷歌、Facebook这样的大企业很难主动开放那些关乎它们核心业务的网页标注、结果排序的特征、用户点击次数、广告转换指标等,对这些数据的垄断将AI世界里的大数据海洋分割成了一个个相互隔离的区域。
更糟糕的是,巨头建立的AI平台以及巨头之间的结盟关系,有可能让数字鸿沟变得越来越严重。信息在人工智能算法的组织、管理下,会更多地向有信息理解和处理能力的平台、企业、终端用户倾斜,接受过高等教育、积极参与网络生活的用户更加容易获得信息和人工智能应用的帮助,而教育水平低、较少参与网络生活的用户则难以找到可以改善自己生活的有效信息。想一想电子商务平台上的智能推荐算法:一个用户越是频繁购物,就越容易得到最适合自己的商品信息。类似的场景会在许多有真实信息需求的领域存在,信息或大数据世界里的富者愈富、穷者愈穷现象并不是危言耸听。
对于这样的“巨头风险”,我觉得我们应该从法律和制度建设层面,多做些有前瞻性的事情,包括:
·提高大数据和人工智能应用领域的透明度,鼓励公开那些不涉及用户隐私和商业机密的研发成果,鼓励开源。
·更多地鼓励利用区块链技术管理数据和信息流动,从技术和制度双方面打破科技巨头对大数据的垄断。
·成立有社会责任感的VC基金,专注于新兴的大数据和人工智能方向。
·多关注能够帮助落后人群获取信息、享受AI福利的平台。
·鼓励大众和媒体去监督行业巨头的商业行为。
在瑞士达沃斯,我受邀与麻省理工学院媒体实验室负责人伊藤穰一探讨巨头可能对AI的垄断。我的看法是,目前的体系会持续促使大型科技企业不断发展。它们有能力垄断资源、垄断数据,在商业利益和激烈竞争的驱使下,它们会不断地竞逐更为精进的技术能力,为公司赚取更大的利益。对于较小企业,进入AI市场的难度的确比移动互联网时代的创业高出非常多。我呼吁大力推动AI生态系的开放性。在创新工场北京总部和我们所投的创业公司体系中,已经启动了全新的AI技术相关研发工作。近期,创新工场也成立了人工智能工程院,带着孵化中国AI生态系的目标投入大量资源,招聘培训一批年轻工程师入门AI领域,展开可公开数据集的采集和标注。我们也积极寻求在中国和全球资本市场的融资和成长机会。
我觉得,目前有些公司采取所谓公开透明的做法,其实是很讨喜的宣传手段。但我也确实担心,下面这种两难问题会不会出现:一些公司选择通过自律或推动立法来限制错误的发生,但另一些公司不会这么做。自然而然,比较规范自律的公司由于发展顾虑更多、更全面,相对发展速度上可能放缓;而较不顾虑错误发生的企业,反而可能成为最快速或最成功的那一方。这很难说是一个好的还是不好的发展态势。
例如在自动驾驶技术的开发上,谷歌很小心谨慎,把保护驾乘人员和行人放在了极其重要的位置上,技术不成熟就不推广;相反,特斯拉的Autopilot就很激进,会直接把测试版产品拿给公众进行试验。然而现在看来,特斯拉造出好的自动驾驶汽车的可能性也许要更大一点儿。所以,这个难题对任何规模、任何阶段的企业,都是一个道德层面的决策。
伊藤穰一则认为,随着世界愈发紧密互联,要以“赢家通吃”的玩法去垄断市场越来越难。现在,如果某个个体试图进行垄断行为,会自动触发市场机制。市场竞争会形成限制:如果某方采取垄断动作,对标竞争的另一方会花数百上千万美元去找到超级优秀的AI博士们来迎头赶上。现今人才培养的源头已经到位,但我担心,当某个企业实现了垄断甚或做上了寡头的时候,自然而然能顺势招募AI领域的全球才俊,吸引能够负担他们百万美元酬金的投资人,种种多方因素都正汇聚在一起。市场单方面依赖竞争机制进行调节并不完善。
伊藤穰一说:“因此,我对开复和创新工场在中国推动的开放做法特别感兴趣。而且,资本主义的市场竞争是不会激励大家分享数据、资源和市场的。传统的政府监管方式过去曾经行之有效,但在面对互联网的开放和动态结构时,这种传统的监管方式将会失效。现在这些AI、比特币和其他所有领域中的问题,都不是过去10年、20年间学者们研究的题目,而是真正在资本市场能够快速赚钱的技术。然而相较于开放的互联网,行业不曾充分在开放领域来探讨这些技术衍生的问题和现象,这是我的担忧所在。”150
总的来说,巨头垄断大数据资源、垄断科研与舆论的风险客观存在。而在国家政策层面、法律法规层面甚至道德层面,我们还缺乏应对这种潜在风险的有效体系。
我感觉,尽管存在潜在威胁,但这就像人类站在一道刚刚开启的大门面前,门外是一个美丽而神秘的新世界,既流光溢彩又暗藏危机。勇敢者必会脚踏实地,正视问题,大胆实践。因为大门外面,是人类真正的未来。
AI创业是时代的最强音
伟大的创业需要生逢其时
创业大潮里,有的创业者脱颖而出,有的创业者负重前行。我们虽不以成败论英雄,但如果一定要找一条诞生伟大公司的必要条件,我会选择“生逢其时”。
雷军创立小米的传奇让“风口论”深入人心——只要站在风口,猪也能飞起来。有人说,这是绝对的机会主义。但在创业的时代大潮中,是否符合科技大趋势的确是决定创业成败的第一要素。
同样生于1955年的比尔·盖茨和史蒂夫·乔布斯在竞争桌面电脑时代的王者地位时,两个人都才20岁出头,他们都年轻气盛,也都有着傲人的天资。但设想一下,如果盖茨和乔布斯在20世纪70年代就开始投入互联网创业(我这个假设并不是异想天开,因为20世纪70年代,早期互联网已经开始连接几所美国大学并开展实验运行),那他们恐怕连足够支持创业的投资都拉不到。
生于1964年的杰夫·贝索斯在1994年创立亚马逊,生于1968年的杨致远同样在1994年创立雅虎。1994年,那时互联网刚刚开始在欧美普及,欧美之外很多地方的电脑用户还不知互联网为何物。贝索斯和杨致远在30岁上下的年纪,抓住了互联网萌芽、兴起的最好时期,用他们的创业天分,为互联网时代打下了带有个人特色的烙印。
生于1983年的凯文·斯特罗姆(Kevin Systrom)和生于1990年的伊万·斯皮格(Evan Spiegel)是移动互联网时代创业明星的代表。无论是凯文·斯特罗姆在2010年创立的图像社区Instragram,还是伊万·斯皮格在2011年创立的社交工具Snapchat,他们这种类型的创业必须依附于移动互联网的“风口”。如果这两个年轻人在移动互联网时代硬是要去创立一个新的PC机品牌,与戴尔、联想、惠普竞争,那无论他们俩的个人天赋怎样,创业都必将以失败而告终。
同样地,在中国,李彦宏创立百度、张朝阳创立搜狐,他们都抓住了20世纪90年代互联网普及的“红利期”,而马化腾、马云则分别在正确的时机站到了社交工具与电子商务的潮头。移动互联网时代,中国科技产业尤其异彩纷呈。前两年一场O2O浪潮,就如大浪淘沙一般,数以千计的初创公司昙花一现,但美团、滴滴等明星公司也脱颖而出。
雷军2010年创办小米时,移动互联网的大格局才刚刚显现。第一批移动互联网用户大都在使用相对昂贵的i Phone手机和Android手机,中国大量普通用户的痛点是难以接受高性能手机的高昂价格。小米在最恰当的时间,为移动互联网的普及注入了一针强心剂——性价比超高的智能手机。无论手机市场今后如何发展,我们都无法抹杀小米在中国手机发展史上的关键地位。小米之后,“小米模式”成为业界竞相研究的对象,智能手机的性价比如何,也成为大量用户选购手机时的重要考虑因素。如果没有小米在最好的时机做了这样一件“生逢其时”的事情,中国移动互联网的普及肯定会来得迟一些。2010年时的雷军本人,就是“风口论”的最佳实践者。
那么,今天呢?
刚好20岁、30岁,有志创业的年轻人,该如何寻找今天的创业“风口”呢?我想,看过这本书的读者,心中应该已经有了一个最好的答案——人工智能!
人工智能时代刚刚到来,人工智能领域的各种创业机会还处在相对早期的发展阶段。未来四五年对于人工智能时代的意义,和20世纪70年代、80年代对于PC时代的意义相比,绝对毫不逊色。几乎可以预言,如果人工智能时代也会出现苹果、微软、谷歌、百度、阿里、腾讯等伟大公司的话,那么,这些伟大公司一定会有相当数量是在这四五年里创立的。
在这样一个大时代、大格局来临的前夕,世界各国都加强了人工智能发展的布局,支持和鼓励人工智能方向的创业。不用说,在美国,世界最成熟的风投资本几乎步调一致地将目前的投资重点由移动互联网转向了人工智能。因为资本、人才和市场三位一体的优势,美国的人工智能初创企业不仅数量最多,而且质量最高、类型最为齐全。从旧金山到硅谷,从西雅图到纽约,在AI芯片、AI平台、自动驾驶、智慧金融、智能医疗、机器人、智能物联网、智能教育、智能客服等领域里创业的公司数不胜数。有兴趣的读者,可以从CB Insights发布的前100家人工智能初创企业名录151中,寻找一下美国当下人工智能创业的趋势和脉络。
英国是另一个人工智能创业的乐园,研发Alpha Go的Deep Mind就是一大批英国AI创业明星中的代表。2017年1月,我和伦敦市长萨迪克·汗(Sadiq Aman Khan)讨论英国人工智能创业氛围时了解到,英国之所以在人工智能创业领域独具特色,主要是因为英国有足够优秀的人工智能科学家,在科研领域处于世界顶尖水平,但在资本、市场等大环境上,英国仍无法与美国相比,这是包括Deep Mind在内的许多英国创业团队都被美国公司收购的原因。萨迪克·汗觉得,英国应当加强自己的资本生态系统(英国支持科技创新的资本总量比美国、中国还是差了不少),同时需要让本土技术能更快地走向美国、中国等更大的市场。152
加拿大是人工智能创业的“科研型孵化器”。深度学习三巨头中,杰弗里·辛顿和约书亚·本吉奥都在加拿大的大学教书,这直接促成了加拿大极为出色的人工智能研究氛围。大批人工智能方向的优秀学生从加拿大的大学毕业。他们中的相当一部分都“南下”美国工作或创业,但也有不少人选择在加拿大开始他们的创业历程。2016年10月,约书亚·本吉奥启动了一个名叫Element AI的创业孵化项目,专注于深度学习技术研发,帮助蒙特利尔大学和麦吉尔大学的人工智能研究项目建立初创公司。约书亚·本吉奥说:“我将努力在蒙特利尔大学建立一个‘人工智能’生态。”153
中国的人工智能创业几乎与世界同步。根据《乌镇指数:全球人工智能发展报告2016》154的统计:人工智能领域,美国与欧洲投资较为密集,数量较多,其次为中国、印度、以色列。美国共获得3450多笔投资,位列全球第一;英国获得274笔投资,位列第二;中国则以146笔投资位列第三。美国人工智能企业总数为2905家,全球第一。仅加州的旧金山/湾区、大洛杉矶地区两地的企业数量即达到1155家,占全球的19.13%。中国人工智能企业数量虽不及美国,但在北京、上海、深圳三大城市,也集中了一批高质量的人工智能团队。北京、上海、深圳的AI企业数量占全球总数的7.4%,在东亚地区位列前三。其中,北京的AI企业就有242家。
AI时代,最大“风口”就是人工智能本身。肯定不是所有猪都能在风口飞起来,但要做一飞冲天的创业英雄,就一定要看准科技大势,选择最正确的时机做最正确的事。
人工智能的商业化路线图
本质上,过去20年的互联网和移动互联网是一个不断将线上、线下的业务场景紧密连接,同时也不断促使数据产生、流转、集中和再利用的过程。如果把世界看成一个大市场,互联网和移动互联网的作用就是让这个大市场中的信息更透明,让信息流通更顺畅,以此降低交易成本,消除信息不对称。
但在知识、数据的积累达到一个顶峰,业务流程也因为信息的高效流转而顺畅连接到一起后,如何进一步提高生产率,降低业务成本,提升业务收入呢?我们认为,下一次生产率革命的关键是“自动化”,而人工智能正是帮助现有流程实现自动化的最好工具。
从投资人的角度看,AI兴起的最大契机还不是深度学习技术的发明,而是过去20年互联网、移动互联网的高速发展对自动化的强烈需求。有了这个需求,有了成熟的业务流程和高质量的大数据,深度学习技术的突破就是“万事俱备,只欠东风”的事了。
所以,战略方面,我们丝毫不用担心AI能否落地、能否商业化。谷歌、Facebook、百度等互联网巨头的搜索和广告业务本质上就是机器学习驱动的,而且早已被证明是成功的。我们需要关心的只是人工智能在接下来的时间内,以何种趋势、何种方式在其他领域落地的问题。
创新工场管理合伙人、资深投资人汪华认为,人工智能的商业化大致可分为三个主要阶段:
第一阶段,AI会率先在那些在线化程度高的行业开始应用,在数据端、媒体端实现自动化。这一过程会首先从线上“虚拟世界”开始,随着在线化的发展扩张到各个行业,帮助线上业务实现流程自动化、数据自动化、业务自动化。
互联网和移动互联网的发展已经在许多领域为AI做好了业务流程和数据上的准备。拥有高质量线上大数据的行业会最早进入人工智能时代。例如,大家常说金融行业是目前人工智能应用的热点,这正是因为金融行业特别是互联网金融已经做好了使用AI的准备。此外,美团等公司将餐饮服务与线上业务连接了起来,滴滴、摩拜单车等公司将交通出行与线上业务连接了起来,在这些拥有线上业务流程和高质量数据积累的地方,AI同样开始发挥作用,大幅提高线上业务的自动化程度。
第二阶段,随着感知技术、传感器和机器人技术的发展,AI会延伸到实体世界,并率先在专业领域、行业应用、生产力端实现线下业务的自动化。
可以感知实体世界信息的传感器和相关的感知技术会越来越成熟,越来越便宜。在线下业务中,计算机系统可以通过物理方式接收线下信息或帮助完成线下操作。这个转变意味着人工智能从线上的“虚拟世界”走进了线下的实体世界。这个阶段,人工智能的商业化会首先从生产力的角度切入,整个世界的生产制造会逐渐被AI渗透。工业机器人、仓储机器人、物流机器人等将在这个阶段实现大范围的普及。
第三阶段,当成本技术进一步成熟时,AI会延伸到个人场景,全面自动化的时代终将到来。
随着技术的日趋成熟,相关的智能产品价格大幅下降,AI终将从企业应用进入个人和家庭。那时,每个人的工作和生活中,大量的应用场景都会因为AI的帮助而更加自动化、更有效率,人类的生活质量终将因AI的普及而大幅提升。这个阶段里,AI商业化的核心目标是创建全面自动化的人类生活方式。
根据汪华的判断,我们目前正在进入AI商业化的第一个阶段,也许只需要3年左右的时间,AI就可以在各种在线业务中得到普及。AI商业化的第二个阶段,要花五六年、六七年的时间才能充分发展起来。而标志着全面自动化的第三阶段,也许需要十几年或更长的时间。
就像过去20年互联网和移动互联网的商业化所走过的历程一样,人工智能的商业化会以自己的节奏,分阶段、分步骤地渗透到人类生产、生活的方方面面。而且,AI对整个社会的改变,可能比过去20年互联网革命所带来的改变要大得多。能否准确把握AI商业化的脉络,是AI时代的创业能否站在“风口”上的关键。
AI创业的五大基石
每个时代的创业有每个时代的特点。人工智能创业就与此前的互联网时代创业、移动互联网时代创业很不相同。
图58 人工智能创业的五大基石
按照我的归纳和总结,人工智能时代的创业有五个前提条件:
·清晰的领域界限:人工智能创业,要解决的领域问题一定要非常清晰,有明确的领域边界,因为这一类问题是今天以深度学习为代表的人工智能算法最善于解决的。例如,同样是做机器人,如果做一个借助视觉传感器更好地规划扫地线路、提高清洁效率的扫地机器人,将机器人的需求限定在一个有限的问题边界内,这样的解决方案就相对靠谱;如果上来就要做一个长得像人一样、可以与人交流的人形机器人,那以今天的技术,做出来的多半不是人工智能,而是“人工智障”。
·闭环的、自动标注的数据:针对要用AI解决的领域问题,最好要在这个领域内,有闭环的、自动标注的数据。例如,基于互联网平台的广告系统可以自动根据用户点击以及后续操作,收集到第一手转化率数据,而这个转化率数据反过来又可以作为关键特征,帮助AI系统进一步学习。这种从应用本身收集数据,再用数据训练模型,用模型提高应用性能的闭环模式更加高效。谷歌、百度等搜索引擎之所以拥有强大的人工智能潜力,就是因为它们的业务,比如搜索和广告本身就是一个闭环的系统,系统内部就可以自动完成数据收集、标注、训练、反馈的全过 程。
·千万级的数据量:今天人工智能的代表算法是深度学习。而深度学习通常要求足够数量的训练数据。一般而言,拥有千万级的数据量是保证深度学习质量的前提。当然,这个“千万级”的定义过于宽泛。事实上,在不同的应用领域,深度学习对数据量的要求也不尽相同。而且,也不能仅看数据记录的个数,还要看每个数据记录的特征维数,特征在相应空间中的分布情况,等等。
·超大规模的计算能力:深度学习在进行模型训练时,对电脑的计算能力有着近乎“痴狂”的渴求。创新工场曾经给一个专注于研发深度学习技术的团队投资了1000万元人民币。结果,团队建设初期才两三个月时间,仅购买深度学习使用的计算服务器就花掉了700多万元。今天,一个典型的深度学习任务,通常都要求在一台或多台安装有4块甚至8块高性能GPU芯片的计算机上运行。涉及图像、视频的深度学习任务,则更是需要数百块、数千块GPU芯片组成的大型计算集群。在安装了大型计算集群的机房内,大量GPU在模型训练期间发出远比普通服务器多数十倍的热量。许多机房的空调系统都不得不重新设计、安装。在一些空调马力不足的机房里,创业团队甚至购买了巨大的冰块来协助降温。
·顶尖的AI科学家:今天的人工智能研发还相当依赖于算法工程师甚至是AI科学家的个人经验积累。水平最高的科学家与普通水平的算法工程师之间,生产力的差异不啻千百倍。人工智能创业公司对顶尖AI科学家的渴求直接造成了这个领域科学家、研究员的身价与日俱增。谷歌雇用杰弗里·辛顿、李飞飞,Facebook雇用扬·勒丘恩,据说都开出了数百万美元的年薪。国内AI创业公司如旷视科技,也用令人瞠目的高薪,将机器视觉领域的顶尖科学家孙剑“挖”了过来,担任公司的首席科学家。
AI创业的泡沫现象及六大挑战
当然,看到人工智能创业机遇的同时,我们也必须保持足够清醒的头脑。2016年到2017年,人工智能的创业和投资明显存在无序、失衡、过热的情况。人们常常担忧的泡沫现象的确存在。
看一看如星火燎原一般在美国、中国、以色列等地建立的自动驾驶创业团队吧,自动驾驶这个行业确实巨大,但真的需要那么多早期创业团队吗?要做一个第4级或第5级的自动驾驶,技术难度异常大,非要投入巨资和最顶尖的研发人才不可。那么,这么多初创的自动驾驶团队里,究竟有几个是可以在自动驾驶普及的那一天幸存下来并成长为行业巨人的呢?
家用机器人的概念就更别提了。那么多号称开始研发家用机器人的公司,如果是做亚马逊Echo那样限定使用场景的智能家电还好说,如果上来就要做语言交流、人形外观的机器人,那几乎一定会因为技术水平无法达到人类用户的预期而走向失败。这道理很好理解,越是长得像人的机器人,用户就越是会用人的标准去衡量、评价它,希望越大,失望也就越大。
语音和自然语言处理方面的创业也有类似问题。今天的语音识别虽然做得相当不错,但机器的能力仅限于感知领域,只能完成听写这种以转录为主的任务。也就是说,机器目前只能很有效地将语音转换为文字,但根本无法直接理解文字的含义。只有限定一个非常特定的领域,技术才能解决问题,如果要求自然语言处理算法支持通用的人机对话,那就不切实际了。目前有许多从事智能客服、智能聊天机器人创业的团队,这些团队如果不善于界定问题领域,就很容易将需求问题变复杂,以至于人工智能技术也爱莫能助。
基于人脸识别技术的身份认证、安防类应用是中国人工智能创业的特色领域,并已经产生了至少四家独角兽或接近独角兽规模的创业公司。但这个领域的市场空间绝对不会像自动驾驶那么宽广,目前二三十家公司都要削尖脑袋挤进人脸识别市场的情况显然是过热了。
基于人工智能的辅助医疗诊断刚刚起步,就出现了一大批瞄准这一方向的创业公司。但只要是熟悉医疗行业的人都很清楚,在这个行业里,要得到闭环的、有标注的、数据量足以发挥深度学习效能的医疗大数据,其难度远超普通人的想象。没有符合要求的医疗数据,人工智能又该从何谈起?所以,在智能医疗领域,今后可以成功的初创公司,一定是那些既懂人工智能算法,又特别了解医疗行业,可以收集到高质量医疗数据的公司。
概括来说,目前的人工智能产业发展面临六大挑战:
一、前沿科研与产业实践尚未紧密衔接:除少数垂直领域凭借多年大数据积累和业务流程优化经验,已催生出营销、风控、智能投顾、安防等人工智能技术可直接落地的应用场景外,大多数传统行业的业务需求与人工智能的前沿科技成果之间尚存在不小距离。面向普通消费者的移动互联网应用与人工智能技术之间的结合尚处在探索阶段。科学家和研究者所习惯的学术语境,与创业者和工程师所习惯的产品语境之间还无法快速衔接。
二、人才缺口巨大,人才结构失衡:据Linked In统计,全球目前拥有约25万名人工智能专业人才,其中美国约占三分之一。这一数量级的人才储备远无法满足未来几年中人工智能在垂直领域及消费者市场快速、稳健增长的宏观需求。人才供需矛盾显著,高级算法工程师、研究员和科学家的身价持续走高。人才结构方面,高端人才、中坚力量和基础人才间的数量比例远未达到最优。
三、数据孤岛化和碎片化问题明显:数据隐私、数据安全对人工智能技术建立跨行业、跨领域的大数据模型提出了政策、法规与监管方面的要求。各垂直领域的从业者从商业利益出发,也为数据的共享和流转限定了基本的规则和边界。此外,许多传统行业的数据积累在规范程度和流转效率上还远未达到可充分发挥人工智能技术潜能的程度。
四、可复用和标准化的技术框架、平台、工具、服务尚未成熟:虽然Tensor Flow、Caffe、MXNet等深度学习框架已被数以万计的研发团队采纳,相关开源项目的数量也在飞速增加,但一个完整人工智能生态所必备的,从芯片、总线、平台、架构到框架、应用模型、测评工具、可视化工具、云服务的模块化与标准化工作,尚需3年或更长时间才能真正成熟。
五、一些领域存在超前发展、盲目投资等问题:目前的人工智能技术只有在限定问题边界、规范使用场景、拥有大数据支持的领域才能发挥最大效能。但创投界存在盲目追捧,不顾领域自身发展程度,或利用人工智能来包装概念等现象。由此产生的盲目创业和投资问题虽非主流,但仍有可能阻碍整个行业的健康发展。
六、创业难度相对较高,早期创业团队需要更多支持:与互联网时代、移动互联网时代的创业相比,人工智能创业团队面临诸多新的挑战。例如,对高级人才较为依赖,科学家创业者自身的商业实践经验较少,高质量大数据较难获得,深度学习计算单元和计算集群的价格十分昂贵,等等。
AI是中国创新、创业的最好机会
如前所述,AI创业既客观存在局部过热的泡沫,也有巨大的潜能尚待挖掘。总体来说,目前的人工智能大格局中,机遇是主旋律,泡沫和危机是必须克服的局部挑战。这一格局在全球如此,在中国亦如此。
而且,若专就中国AI创业环境来说,人工智能更是助力中国科技腾飞的最好机会之一。互联网和移动互联网时代,中国科技精英已经用淘宝、微信、摩拜单车等“中国创新”让世界看到了我们的创造力和执行力。人工智能时代,中国的人才优势、市场优势、资金优势、坚持多年创新的商业模式优势等,都是人工智能最好的生长土壤。如果措施得当,行动高效,中国甚至有可能借人工智能技术全面占据信息科技的制高点,在创新、创业领域真正成为引领者而不是跟随者。
AI领域,中国人/华人已是科研中坚
2016年,美国白宫发布的《国家人工智能研究与发展策略规划》报告从Web of Science核心数据库里查询提到“深度学习”或“深度神经网络”的文章,统计其数量变化趋势。报告说,从2013年到2015年,SCI收录的论文里,提到“深度学习”的文章增长了约6倍,同时强调:“按文章数计算,美国已不再是世界第一了。”
美国不是世界第一?谁是世界第一呢?报告指出,中国发表的相关论文数量在2013年及以前还落后于美国,而在2014年和2015年,中国的相关论文数量就跃居世界第一。如果只统计论文数量,中国在AI研究领域,已经是不折不扣的领跑者了。
白宫《国家人工智能研究与发展策略规划》中的数字统计,其实还是存在一些技术上的问题,比如,直接搜索关键字“深度学习”“深度神经网络”,是否真的能涵盖这些年人工智能领域的所有科学研究进展?统计论文数量时,是否要考虑论文所发表期刊的影响因子,以便衡量论文的重要程度?
创新工场使用更严格的条件,只统计Web of Science核心数据库中SCI影响因子较高的人工智能期刊中的论文,并在主题上涵盖人工智能相关的所有科研领域,做了一次独立的数据分析。
根据创新工场的统计,在2006年到2016年的时间段里,近两万篇顶级的人工智能文章中,由华人贡献的文章数和被引用数,分别占全部数字的29.2%和31.8%。近10年,华人用五分之一左右的作者人数,平均贡献了三成的顶级AI研究文章和被引用数。从统计角度来看,这已经是超出平均水平的科研贡献了。
图59 华人在人工智能研究领域的贡献占比
从变化趋势看,2006年到2015年,华人作者参与的顶级AI论文,占全部顶级AI论文数量的比例,从23.2%逐年递增到42.8%。而华人作者参与的顶级AI论文被引用次数,占全部顶级AI论文被引用次数的比例从25.5%逐年递增到55.8%。
图60 华人在人工智能研究领域贡献的变化趋势
举例来说,《IEEE模式分析与机器智能汇刊》(IEEE Transactions on Pattern Analysis and Machine Intelligence,简称PAMI)在2006年到2016年,引用数很多的前500篇顶级的人工智能论文中,作者一共1220人,其中华人科学家、研究者316人,占25.9%。所有作者单独累加计算的被引用数总和是231361次,其中,华人科学家、研究者被引用数总和是63846次,占27.6%。如果单看2014年(当年华人的文章数、引用数均较高)的数据,华人科学家、研究者被引用数占51.8%,超过了半数。
也就是说,即便只统计顶级出版物里的顶级文章,中国人/华人在人工智能领域的贡献,在发展趋势上也和白宫报告中揭示的规律一致——无论从哪个角度来说,中国人/华人正在人工智能领域里发挥举足轻重的作用,而且,从2014年和2015年开始,中国人/华人已经处于人工智能研究的领先地位,占据了人工智能科研世界的半壁江山!
当然,需要特别指出的是,我们不能单看这些反映整体趋势的统计数据就沾沾自喜。事实上,上述数据所表现的,仅仅是中国AI科学家以及全世界的华人AI科学家作为一个整体,已成为AI科研的最大阵营这一事实。但从突破性科研贡献的数量和质量上说,中国还无法与美国相比。如果只统计那种革命式的、里程碑式的突破,中国人或华人的占比就会少很多了。深度学习“三巨头”中没有一个华人面孔,这个事实至少说明,中国或世界华人科研群体中,还缺少顶级大师式的人物。用围棋的段位来比喻的话,就是中国在人工智能领域拥有不少六段、七段甚至八段的高段位棋手,但暂时还缺少九段的顶级高手。
一方面,客观承认中国与美国在AI前沿科研上仍存在较大差异;另一方面,我们也必须看到中国AI科研力量的蓬勃兴起。中国国内的研究者和分布在世界各地的华人研究者,他们在人工智能领域共同构成了一个巨大的人才储备库。无论是从国家的层面,还是从投资者、创业者的层面,我们都应该想办法培育好、用好这个人才库,尽量鼓励海外华人科学家回国创业,或者帮助国内创业团队尽快赶超世界水平。
中国有独具优势的AI创业环境
尽管存在诸多挑战,但我仍然大胆预测,在未来5年内,中国将会诞生许多世界级水平的人工智能企业。为何我会如此坚定?因为中国具备了人才储备、行业需求、庞大市场、生态系统等许多极有利于人工智能发展的条件。
人才储备方面,除了上节提到的中国科研力量不可忽视之外,中国人也普遍对国内的数学等理工科的教学水平感到自豪。高水准基础科学、工程学教育可以造就大批高素质的年轻人才,这是任何一个新兴产业赖以发展的关键。
中国学生普遍理工科较强,数学较强。这在人工智能时代里,显然有巨大的优势。庞大的理工科学生基础,造就了一大批高素质的人工智能科学家、工程师。同时,即便是没有专门去学计算机科学的学生,他们中有很多已经具备了非常扎实的数学知识,这些学生在需要时可以通过培训,较快地成为掌握深度学习等人工智能技术的算法工程师。目前,创新工场正和许多致力于人工智能发展的企业一道,加强与高校的合作,努力培养更多的人工智能人才,同时也投入资金,开展人工智能科研数据集和竞赛的建设,让更多的人有机会参与到人工智能技术的普及和提高中来。
行业需求方面,中国的传统行业较为薄弱,但这种状况反而给中国带来了一种后发优势。如今,中国许多传统企业在技术转化领域还大幅落后于美国企业。但是这些中国企业坐拥的是海量数据和充沛资金。它们有热情也有动力去投资那些能帮助企业拓展业务、提高收益、降低成本的人工智能技术与人才。
此外,中国有全球规模最大的互联网市场,网民人数近八亿,大量的互联网公司正在深耕市场。很多非人工智能的互联网公司成长到一定规模之后,为了转型升级、扩大规模,都需要引入人工智能技术。而且,中国市场既开放又有许多独特性。尽管美国人工智能企业领先全球,但它们要想进入中国市场必须跨越重重阻碍,因为中国市场需要的是最“接地气”的本地化解决方案。此外,对于人工智能的探索性和试用性需求,中国往往会采取相对开放和鼓励的路线,这也可能促进行业的超速发展。
也就是说,中国虽然在人工智能的前沿研发中不如美国,但中国有独具优势的AI科研和创业环境,有机会实现弯道超车,后发先至。
举例来说,美国的金融行业已经发展得非常成熟,金融企业使用的营销、风控等模型是数十年经验积累的结果,让美国金融企业转变思路,采用基于深度学习的新一代人工智能系统,这要花费大量的时间与精力。反观中国的金融系统,各种新型金融机构十分活跃,基于互联网的金融产品几乎每年都在进行模式创新。中国的新兴金融机构没有那么多历史包袱的束缚,反而可以更快地试用或部署深度学习算法,帮助自己改进业务流程,提高效率。
现在正是将人工智能技术转化为产业应用,解决现实社会问题的黄金时期。抓住人工智能热潮中的机遇期,中国应当会有一番大作为。
AI黄埔军校——微软亚洲研究院
说到今天的中国AI创业,就不能不提一所培养人工智能人才最多,输出人才质量最高的人工智能黄埔军校,这就是我于1998年回国创立的微软亚洲研究院(1998年创立时的名称是微软中国研究院)。
我非常怀念1998年创立微软亚洲研究院的时光。那段时间,就像我自己的“阳光灿烂的日子”一样,似乎只要你有足够的热情,就可以将全球范围内最具实力的华人科学家聚拢在一起,共同从事机器视觉、语音识别、智能交互、多媒体、图形学等前沿领域的研究,共同享受科研带来的快乐。
那个时候,虽然刚刚经历国际象棋领域的“人机大战”,但科研界和产业界还处于人工智能发展的低谷期,人工智能科学家还不像今天这样被高科技企业以重金“哄抢”。太多太多急功近利的科研人员耐不住人工智能领域的寂寞,都匆匆转向其他更容易完成产业转化的领域。
但微软亚洲研究院不同。我们从一开始就制定了面向未来的主导原则,确定了围绕人工智能各技术领域组建高水准研究团队的基本思路。敢于设想别人不敢想的未来,敢于做别人不愿做的研究,这是微软亚洲研究院之所以能在数年之后成为国际人工智能领域科研重镇的关键。
图61 一张珍贵的照片:1998年,微软中国研究院(微软亚洲研究院前身)的初创团队合影
在那段“阳光灿烂的日子”里,我亲自聘请或招募到微软亚洲研究院的科研精英们一个个都那么年轻,那么有活力。今天,他们中几乎每个人的名字都在科技大潮中熠熠生辉。尤其是在人工智能领域,今天中国最好的AI创业团队里,首席科学家的人选中,许多都曾经在微软亚洲研究院工作过。
1999年加入微软亚洲研究院的张宏江是视频检索领域的“开山鼻祖”。张宏江在微软亚洲研究院期间,就曾带领和指导视觉计算组解决人脸识别的问题。今天,人脸识别在中国的金融和安防两个垂直领域得到了广泛应用,人脸识别方向的优秀初创团队,几乎都能从师承关系上回溯到张宏江当年指导过的这个研究组。例如,商汤科技创始人汤晓鸥曾在微软亚洲研究院担任视觉计算组主任,商汤科技的核心技术团队也基本来自微软亚洲研究院。2016年加盟旷视科技(Face++)担任首席科学家的孙剑曾在视觉计算组工作了十几年,是沈向洋的得意门生,而旷视科技的技术骨干差不多都是孙剑和汤晓鸥的学生。
图62 微软亚洲研究院创立早期,我和张亚勤在清华大学与计算机系学生交流
此外,像郭百宁、芮勇、马维英、颜水成等一大批青年科学家,当年都曾在微软亚洲研究院从事人工智能相关的科研项目。今天,郭百宁担任微软亚洲研究院的常务副院长,芮勇则在2016年加入联想担任CTO,马维英于2017年2月出任今日头条副总裁,颜水成现在是360公司首席科学家、人工智能研究院院长。更年轻的人工智能大牛中,旷视科技的创始人印奇、商汤科技的杨帆、初速度(Momenta)的创始人曹旭东、依图科技的创始人林晨曦、Linkface的创始人夏炎、深度学习框架Caffe的作者贾扬清等,都有在微软亚洲研究院实习或工作的经历。
当年接替我担任微软亚洲研究院院长的张亚勤,他的研究方向主要在多媒体领域,但也和人工智能有很多交集,例如对视频的压缩、分类、理解,都需要AI的帮忙。相关的三维图形学研究,会慢慢由纯粹的图形学问题逐渐演变为使用人工智能算法理解空间结构等AI问题。此外,微软亚洲研究院当年从事搜索、大数据等方向研究的,最后都需要融合机器学习特别是深度学习技术。应该说,当年我和张亚勤为微软亚洲研究院规划的几个研究组,除了其中偏重人机交互界面技术的小组(当年由王坚领导的小组。王坚后来成为阿里云的创始人)外,其他研究组都或多或少与人工智能相关。
图63 微软亚洲研究院的四位历任院长:李开复、张亚勤、沈向洋、洪小文
当年我在微软亚洲研究院开创的一番事业,许多年后,在人工智能领域真的结出了让人欣慰的果实。几十年来,人工智能技术几起几落,但始终有那么一批志存高远的科学家、研究员、大学生埋头科研,探索未知。正是因为有微软亚洲研究院等一批面向未来的科研机构存在,人工智能才得以在今天蓬勃发展起来。
创新工场的AI布局
2009年,我离开谷歌,创办了帮助青年人完成创业梦想的风险投资机构——创新工场。迄今,创新工场已在移动互联网和各垂直领域投资了近300家创业公司,其中包括30余家以人工智能技术为核心驱动力的公司。创新工场对人工智能目前和未来落地的主要应用场景有着透彻的理解和深厚的经验积累。
把握时机对创业和投资至关重要。创新工场根据技术成熟度和未来发展趋势,将人工智能各应用领域划分为现阶段已成熟、3到5年成熟、5到10年成熟、10年后成熟等不同类型,并分别设计相应的投资策略。
图64 创新工场在人工智能领域的投资布局
如图中所示,创新工场将人工智能领域的应用划分为大数据、感知、理解、机器人、自动驾驶等不同门类,每个门类中,按照人工智能技术的应用成熟度,将具体应用领域排列在时间维度上。
总体来说,人工智能在互联网、移动互联网领域的应用,如搜索引擎、广告推荐等方面已经非常成熟。在商业自动化、语音识别、机器视觉、手势识别、基础传感器、工业机器人等方面,人工智能可以立即应用,立即收效。
金融类人工智能的应用虽然已经起步,但尚需一段时间才能真正普及。智能教育、智能医疗、AR/VR中的人工智能、量产的传感器、商业用机器人等,预计会在3到5年成熟可用。
可以供普通技术人员乃至非技术人员使用的人工智能平台(包括计算架构、算法框架、传感平台、云服务等),会在3到5年后趋于成熟并拥有足够大的商业机会。
通用的自然语言对话工具、智能助手、普及型的家用机器人等,则至少需要10年甚至更长的时间,才有可能完成商业化。
另外,在自动驾驶领域,3到5年内,必将是第2级到第3级的辅助驾驶最先大规模商用,而且,鉴于安全考虑,这些自动驾驶应用也会是限定场景、限定道路等级的。真正意义上的“无人驾驶”,即第4级或第5级的自动驾驶,还需要5到10年才能上路运行。
除了直接投资,创新工场还宣布成立人工智能工程院。这是一个专门面向人工智能的创业人才培养基地和创业项目孵化实验室,其使命是为人工智能创业提供人才与技术、产品和商业经验、市场推广、软硬件平台、高质量大数据源等多方位的支持。
人工智能领域的高级人才和高水准技术团队如果已经有了清晰的商业模式和成熟的产品规划,创新工场可直接提供投资支持;如果商业模式或产品规划尚未清晰,创新工场人工智能工程院则可使用孵化的方式,帮助创业者实现创业梦想。
创新工场人工智能工程院的主要工作任务包括:
·对接科研成果与商业实践,帮助海内外顶级人工智能人才创业:创新工场人工智能工程院面向海内外招聘顶级人工智能科学家和驻场创业家(EIR),利用创新工场丰富的产品化和商业化经验,协助他们完成前沿科研成果向商业应用的转化,同时也可根据需要,为他们匹配优秀的创业伙伴,搭建高效的创业团队,对接有价值的商业渠道,发展成熟的商业模式。
·培育和孵化高水准的人工智能技术团队:创新工场人工智能工程院招聘人工智能相关的算法工程师、架构工程师、应用开发工程师等高级人才,并在高校相关专业招聘实习生。来自谷歌、微软等顶级工程与研究团队的技术专家将作为导师,带领并培养年轻工程师、研究员,孵化高水准的人工智能技术团队。
·积累和建设人工智能数据集,促进大数据的有序聚合和合理利用:大数据是人工智能科研与产业化的关键。创新工场人工智能工程院计划在科研数据和商业数据两个方面投入资金与技术力量,推动数据集建设和大数据聚合,探索在高效利用大数据的同时切实保证数据安全和用户隐私的技术、流程与规范。
·开展广泛合作,促进人工智能产业的可持续发展:创新工场正与国内顶级高校合作建设人工智能相关课程,同时也积极与技术社区、科技媒体、教育机构等开展合作。创新工场计划利用算法竞赛、技术俱乐部、论坛和会议等方式全面推动技术交流与人才培养。创新工场还希望加强与政府相关部门、国内外高科技公司的合作,促进人工智能相关的技术、格式、接口、服务的标准化,提高人工智能在更大范围内的普及程度,建立规范、合理、健康、可持续发展的人工智能产业生态。