前沿探索
建设智能世界的假设与愿景
要使AI更好地服务于人类社会,就要使AI的目标与人类一致,并且正确和高效地执行。文章分析了AI在理论、技术上面临的挑战和未来的发展方向,并分享了华为在AI领域的探索与实践。
文/华为战略研究院院长 周红
在迈向智能世界的过程中,核心是信息的感知、连接和计算,以及由此带来对物质和现象、生命和能量等的更高认知和掌控能力。要建设智能世界,就要解决未来通信和未来计算两大问题。
在通信领域,75年前,香农基于经典电磁场、离散无记忆信源、简单传播环境提出了香农定律。而在后香农时代有很多新的发现:
1987年Durnin发现具有自愈性的非衍射波束可以绕过障碍物而继续传播;
1992年Allen等人提出的旋转轨道角动量电磁场传播,在同一方向上有无数个正交量子模态,每个量子模态都可以提供一个香农容量;
2016年继AlphaGO之后,人们发现可以通过大模型来很好描述具有先验知识的世界,这表明很多信息并不是离散无记忆的;
2018年5G的MassiveMIMO规模商用,在城市高楼大厦林立的复杂传播环境中,通过很多独立传播通道可以大大提升通信的容量;
这些新现象、新认知和新环境有条件超越香农定律最初的假设条件,为未来通信开启了十年百倍的发展空间。
在计算领域,智能应用迅速发展,尤其是AI模型可能帮助解决应用碎片化的问题,引发了模型规模的爆发式增长。在AI自动编程、AI辅助科学研究、定理自动验证和自动证明等方面,学术界和产业界也已经有很多探索。随着计算模式的不断优化、算力的不断提升、更多和更好的数据,AI将能更好地服务于人类社会的进步。
机器认知世界面临三大挑战
在AI能力快速提升的情况下,就需要考虑AI的目标如何与人类一致、并且正确和高效地执行。除了AI的伦理和监管外,从理论、技术的角度看,目前还面临AI的目标定义、正确性和适应性、以及效率的挑战。
挑战一,是对AI的目标定义缺乏共识。什么是我们认可和需要的智能?如果没有定义清楚,就很难确保AI发展的目标与人类一致,也很难合理地度量、分类和科学地计算。杜克大学物理学家Adrian Bejan教授在《生命的物理学》中列出了对智能的二十多种理解,有的强调理解和认知能力、有的强调学习和适应能力、有的强调抽象思考和解决问题的能力等等。人工智能在历史上也有不同的流派,它们还没有很好地融合起来,缺乏共识的目标定义可能是重要的原因之一。
挑战二,是正确性和适应性。依靠大数据统计规律进行的学习,存在过程不透明、结果不稳定和偏见的风险。比如采用统计和相关计算模式来识别香蕉,有时候容易受到背景组合和微小噪声的影响。如果我们在香蕉边上放一些其他图片,识别结果可能从香蕉变成烤箱,中间还有一定的比例是鼻涕虫。这些人眼来看是一目了然的,但是机器为什么会犯错便很难解释,也无法调试。
挑战三,是效率问题。第60届全球超级计算机Top500中排名第一的Frontier,计算性能约1102PFLOPS,能耗是2千1百万瓦;而人脑只需约20瓦就能等效处理约30PFLOPS的计算。可见当前这些超级计算机单位能量的计算效率,要比人脑低大约三万倍到十万倍。除了能效,还有数据效率。除了通过从大数据中得到统计规律来认识和理解世界外,能否从小数据中进行思考,发现逻辑性,形成概念,抽象出原则和规律?
应对AI挑战的突破与愿景
应对AI三个挑战,可以从假设开始寻求突破。
我们假设:
- 知识是从外部环境和我们自身的事实和现象的经验中,归纳抽象出来的概念和属性、及其关系和运行规律;
- 智能是通过感知与交互、计算或者试错,在复杂的环境和有限的资源下达成目标的能力。
- 实现智能的手段,除了从已有大数据中提取其概率分布来进行拟合和推演,也可以从小数据甚至没有数据中,考虑因果推理、给出假设和进行试错、提出问题和创造性地解决问题。
在此基础上,建议从实用的角度,来发展知识和智能。
方向一,是将系统工程与AI结合起来,发展高正确性的自主智能系统。近几年学术界有很多跳出Transformer之外的新型AI架构的思考,建议在此基础上通过重点发展感知与建模、知识自动生成、求解与行动三个部分,通过从多模态感知融合与建模,到“知识+数据”驱动的决策,实现更高正确性的自主智能系统。感知与建模是对外部环境以及自身的表征与抽象,知识的自动生成应该将人已有的经验融入到策略模型或评价函数当中,提升正确性。求解可以是在已有知识的基础上结合内外部信息进行演绎推理,或者通过试错、归纳找到解决办法。希望这些技术能够映射到未来的自主系统中,更好地支持自动驾驶网络、自动驾驶汽车、云服务等领域。
方向二,发展更好的计算模式、计算架构与计算部件,持续提升智能计算的效率。我曾与菲尔兹奖教授Laurent Lafforgue讨论,当前在视觉与空间计算上,不是仅采用像素点来表达物体,而是增加几何流形来进行表达和计算,是否能更好地抓住物体的不变性,提升正确性与效率?EPFL的Gestner和Kistlei等教授在《神经动力学》一书中介绍了人大脑皮层的功能柱、以及功能柱中的六层连接情况,这样的浅度神经网络架构,能否比当前的深度学习更高效?另外,当前AI计算面临的存储瓶颈导致我们要花比计算多上百倍的时间去读写和搬迁数据,今后能不能抛开传统的冯·诺依曼架构的处理器、指令集、总线、逻辑器件和存储器件,围绕先进AI计算模式的需要来定义新的架构与部件?
以实践促进价值创造
华为在AI领域做了一些探索与实践。AI4Industry通过行业大模型促进价值创造。华为针对行业的开发难题,比如样本标注工作量大、模型维护困难、泛化能力不足、行业人手短缺等,在视觉、语言文字、图网络、多模态等专用L0基础大模型之上,形成L1行业专用大模型,来降低开发门槛、提升泛化能力,解决应用碎片化的问题,帮助电力、煤矿、交通、制造等行业提升作业效率、提升安全性。华为机场与轨道军团在呼和浩特、武汉、西安、深圳、香港等地与客户及合作伙伴们一起探索城轨、铁路与机场的数字化转型,不仅提升作业安全性与效率,还提升用户体验与满意度。比如在深圳机场,通过基于云和大数据以及AI创新,实现了智能机位分配,每年可以节省260万旅客免坐摆渡车,成为全球数字化转型的标杆。
利用AI4Science提升科学研究能力。比如,通过构造新型的、地理信息3D Transformer编码结构,以及层次化时域聚合方法,华为推出盘古气象大模型,用更精准、高效的学习与推理机制,从大自然历史运转出来的数据中提取出全球气象先验知识,代替传统科学计算的超大规模偏微分方程的时序求解,从而可以实现快速完成全球未来1小时到7天的天气预报,预测精度比欧洲中期天气预报中心高20%以上。
在软件编程上,除了用传统AI在大量已有代码中进行检索和推荐外,华为也在发展科学的模型驱动和形式化方法。尤其是在大规模并行化的情况下,很多处理是相互纠缠和前后关联的。华为探索出了一套名为Vsync的方法,实现了操作系统内核的自动化验证和并发代码优化,在提升性能的同时也确保可靠性。在Linux社区,Vsvnc仅用20多分钟就发现且修复了一个社区专家要两年多才修复的一个内存屏障Bug。
华为也在研究新的计算模式,来实现定理自动证明。拓扑斯理论是可能的途径之一,将有助于探索范畴证明、同余推理系统、以及理论的自动导出能力,以提升定理证明器的自动化水平,希望解决形式验证中的状态爆炸问题和自动模型抽象问题,增强形式验证能力。
同时,华为也在探索先进计算部件。基于余数理论,解决实际应用中的变换效率以及溢出等,希望能将最基本的加法和乘法在芯片和软件中实现,提高智能计算的效率。
在迈向智能世界的过程中,在通信和计算两大基石的驱动下,从狭义人工智能,到通用人工智能与超级人工智能,首先要发展好人工智能的理论和技术、伦理和治理,通过支持万物智联,来促进社会的进步;其次要不断拓展思想的边界,增强我们对智能的认知水平、提升对智能的掌控能力;最终,希望用正确目标和有力的手段,牵引人工智能的发展,真正助力人类超越极限,实现文明的进化,增强生命,创造物质,控制能量,跨越时空,征服星辰大海。
- 标签:
- AI