02 人工智能的历史使命:让人类知道更多,做到更多,体验更多(第3/7页)

现在,百度、谷歌、微软、脸书等公司都在朝着“广义AI”的方向努力。判断人工智能的能力,或者判别是否真正是人工智能的标准仍然是,人类是否因此知道更多,做到更多,体验更多。比如,百度基于海量的搜索数据做的很多技术分析,以前靠人去做几乎不可能,而现在通过人工智能计算技术,我们得出了许许多多前所未有的知识和结论,人类因此而知道更多,也能因此去做很多前所未有的判断,去实现更多不可能的功业。如具有代表性的无人驾驶技术、自然语言交互技术,使得人类的运动方式、感官方式都在逐渐发生变化。以前人类用眼睛来看、用耳朵来听,以后我们可能不需要眼睛也可以看到,不需要耳朵也能听到,人类将逐步拥有新的感知方式,也将体验崭新的世界。

因此,一切做人工智能的公司是否名副其实,都可以从以上角度来衡量:它属于四个象限中的哪一块?有没有实力让人类和机器一起知道更多,做到更多,体验更多?

美国和中国都有很多公司说自己是人工智能公司。有的公司说云计算是人工智能,有的说大数据是人工智能,但这些都只是人工智能系统的一部分,最终判断人工智能实力的是大数据、云计算、算法、训练时间及其总投入以及软硬件综合实力等。

这种实力不是一蹴而就的,也无法一概而论。地上本没有路,在披荆斩棘的道路上有不同的角色,也有不同的站点,每个人、每个企业达到的程度都不一样。有人刚起步,有人身后已经留下大片果实。

百度大脑可以看作人工智能综合实力的一个典型,对它的能力分解,能使我们更明晰人工智能行业的入门门槛及基本标准。如果一家号称人工智能的公司以下能力皆不具备,那只能说这家公司还没准备好真正进入这个领域。

百度大脑是硬件基础、数据基础和算法能力的紧密结合,是云计算、大数据和人工智能的三位一体,是百度技术战略的核心。云计算是基础设施、大数据是燃料、人工智能是发动机,联合驱动着“互联网的物理化”,将数字世界的互联网技术和商业模式又送回到物理世界,全面改变社会。

云计算,名字在云端,却是百度大脑最底层、最实体的部分,是IaaS(Infrastructure as a Service,基础设施服务)。

百度大脑的超强计算能力就来源于这一层,是高性能计算硬件的集团军。这个集团军拥有数十万台服务器,并且采用先进的集群操作系统来统一管理,堪称人工智能超级计算机。

为了深度学习训练的需要,百度自主研发了GPU和FPGA(现场可编程门陈列)异构计算服务器,单机可扩展至64块GPU/FPGA卡,对比传统服务器密度提升16倍,一台服务器即可完成千亿数据模型训练;百度开创性地研制了基于FPGA的人工智能处理器,提供10Tops的计算性能,相对主流的20核服务器,计算效率提升60倍,在人工智能和大数据应用上,可以达到普通服务器4~8倍的性能。

但百度的优势不只是单台机器的优秀,更在于优良的系统,优秀个体的集成形成强大的总体作战能力。针对GPU集群的智能调度和资源管理系统,可以实现计算、存储和网络资源的池化管理和动态调度,计算集群整体效率和平均使用率达到80%。将异构硬件用于线上产品,用户请求时延降至1/5,计算效率提升数十倍。

这个系统涵盖了国内最大的GPU/FPGA集群(全新的芯片技术),最大的HADOOP/SPARK集群(全新的并发数据处理技术)和运营效率最高的数据中心[全新的异构计算技术、整机柜服务器技术、100G RDMA(远程直接数据存取)通信技术和运维技术],可谓马力十足,提供了开发人工智能所需的计算能力。

它同样燃料充足。基于多年服务于大规模业务,比如通过搜索和视频技术,百度积累了大量的数据:万亿级网页数据,数十亿次搜索数据,百亿级视频、图像和语音数据,百亿级定位数据等。数据就是人工智能算法的燃料,是发展人工智能的又一基础条件。

让硬件与燃料结合的是优秀的算法和模型。百度汇聚了全球顶级科学家和工程师,在理论和实践方面持续创新,搭建了全球最大的深度神经网络,支持万亿级参数、千亿级样本、千亿级特征训练,神经网络层数远远突破100层。

硬件动力、数据燃料和算法灵魂的结合,才产生出百度的PaaS(Platform as a Service,平台服务)。百度PaaS与众不同之处在于,人工智能作为一种横向的服务贯穿全平台。通过深度学习和机器学习技术,结合超强计算、海量数据和优秀算法,在语音、图像、自然语言处理等方面拥有杰出的能力,打造出独特的知识图谱、用户画像和商业逻辑,并且向用户全面开放。用户可以非常方便地使用各种算法模块、开发工具、数据引擎为自身的商业目的服务。我们形象地把不同的平台称作天算、天像和天工,分别针对智能大数据、智能多媒体和智能物联网这三个领域提供服务。

在最上层的SaaS(Software as a Service,软件服务),百度的人工智能很容易凝结成许多垂直行业解决方案,渗透到各行各业。但我们更追求与合作伙伴一起打造智能产业生态,例如教育云、金融云、交通云、物流云等。我们认为,对智能产业生态的构建能力也是判定人工智能价值的重要标准。

在硬件、数据、算法之上还有一个重要的衡量标准,那就是人工智能企业的文化,即人工智能企业的“软实力”。搜索技术是人工智能的先驱,也是最早的互联网数字化世界的门户,其开发流程和技术核心为未来的人工智能奠定了基础。首先,搜索引擎必须与很大规模的数据打交道;其次,搜索引擎必须同时有大规模的机器学习,人工来做是不可能的事,因为数据规模太大了;最后,也是最根本的一点,搜索引擎的开发流程和工程开发文化与人工智能系统的开发是非常吻合的,都以数据为主,通过抽取其中的特征、模式,然后用这个模式给用户带来价值。人们在搜索业务中结成的协作关系,形成的业务能力和工作习惯,都很适合人工智能业务发展,与海量数据一样,积淀为人工智能企业的文化。所以陆奇在微软的做法是,培养人才先从Bing开始。你做过Bing,你到其他什么部门都可以做,那些技术在搜索看来都是很简单的技术。这个文化当然并不完美,但正如神经网络一样,可以在正确的方法指引下不断发展完善。