在人工智能的发展历程中有三个流派。符号主义流派希望用公理和逻辑体系搭建一套人工智能系统,逐渐发展出启发式算法、专家系统、知识工程等技术。连接主义流派主张模仿人类的神经元,用神经网络的连接机制实现人工智能,逐渐发展出脑模型、感知机、反向传播算法、神经网络模型等技术。行为主义流派源于控制论,基于感知-行动模式形成生物控制论、智能机器人、强化学习等技术。这三个流派日趋融合,催生出图神经网络、贝叶斯决策、深度强化学习等新技术。
人工智能发展新阶段的最大特征是“关系”。神经网络中的连接关系构成了数据通路,知识图谱中的关联关系构成了图结构通路,决策树中的因果关系构成了执行路径等。这些关系形成了高维空间中多点间开放的、不确定的近似计算。在人工智能发展的新阶段,算法的发展对算力及其环境提出了新的需求;相应地,支撑算力及其环境需求的体系结构和软件栈也有新的发展。
算法发展对算力及其环境的需求分析
人工智能算法向无监督的方向发展。为了适应部分领域“小数据”的现实情况,减少数据收集和标注开销,人工智能算法向无监督的方向发展,主动学习、迁移学习、强化学习等技术成为研究热点。主动学习中,算法主动提出标注请求,将一些经过筛选的数据交给专家标注,需要人机交互能力和数据整合能力。迁移学习用来增强训练好的模型,解决目标领域中仅有少量带标签样本数据的问题,需要大算力的预训练和数据处理能力。强化学习用智能体(agents)构成系统来描述行为并给予评价和反馈学习,需要信息采集能力和概率计算能力。这些技术需要计算环境能够支撑人、机、物的高效交互以及多模式紧密耦合。
可解释性在人工智能领域越来越重要。可解释的模型可以应对人工智能模型的泛化能力不足、训练样本分布不均带来的失效、复杂到不可调试等挑战。按照可解释能力,可将人工智能模型分为透明模型、事后可解释模型以及不可解释模型三类。可解释技术包含文本解释、可视化、特征关联等,需要在可解释性与性能、准确性、应对攻击能力之间权衡。实现可解释的人工智能不仅需要为现有的软件框架增加可解释的接口,还需要重构以人为中心的计算环境,实现决策理论驱动的可解释人工智能框架。
人工智能模型的自学习、自演化能力不断发展。自动机器学习(AutoML)利用大量算力开展自动化的人工智能模型设计和优化。在此基础之上,带限制约束条件的AutoML可以应对不同应用需求和不同硬件设备,不设初始条件的自演化AutoML极大丰富了模型设计空间。这些技术的发展不仅需要动态计算框架支撑,还需要大规模并行计算支撑和设备多维建模支撑等。
为了解决多模态、多过程问题,需要多模型、多算法的有机组合。人工智能应用流程变得愈加复杂,涉及不同的设备、环境、算法、模型,需要计算环境能够支撑动态、多样的应用需求,提供计算、存储、网络等硬件资源的动态可扩展能力,支持复杂模型、复杂软件的协同和交互。
人工智能基础软硬件环境需要关注应用全生命周期。全生命周期中的不同任务具有不同的时间特性、空间特性和计算需求,工作流程包括模型设计、数据预处理、模型训练和优化、模型部署和推理、模型保持和更新等。在数据流水线上,数据积累以年计,数据准备以月或周计,模型训练以周或日计,模型推理以秒计。这需要计算环境能够支撑复杂系统相关资源和服务的流程动态编排和调度。
人工智能模型和算法对分布式、分散式的需求越来越突出。超大规模的复杂模型处理海量数据,需要高性能计算机的并行计算支撑。联邦学习等分散场景需要分布式机器学习原生算法,使多个参与者可以在不共享数据的情况下构建通用、健壮的机器学习模型。这需要计算环境满足安全、隐私、公正等需求,能应对通信挑战和系统异构挑战,支撑多任务、多用户的协同,并支撑云、边、端融合。
人工智能应用中具有多种形式的不确定性。这些不确定性来自于从环境中感知的动态信息、情景特异的知识、受限于计算和通信的计算实现等。随着认知理论的进一步突破,人工智能的发展逐渐从计算、感知扩展到认知、意识,或将突破图灵可计算理论。概率计算部件、类脑或仿脑体系结构以及模拟计算都可在一定程度上应对这些不确定性,因此计算环境需要支持新型智能体系结构。
综上,人工智能发展趋势对计算及其环境的需求包括:关系、概率、近似计算更突出,非必须支持高精度、高容错,节点上计算简单,“人在环路中”需求明显。新一代人工智能应用可能会超越传统计算模式,呈现人机协同、场景适应、群智开放、自主操控、模糊动态等新特征。需要提供分布式智能计算(云、边、端融合)的环境及服务,人在智能系统中的环境及服务,感知、认知、决策、行动融合的环境及服务,适应新型智能体系结构的环境及服务,以及动态、异构的智能计算环境及服务。