摘 要:机器如何像人一样认知,又如何不像人那样认知?这是当下人工智能学者必须回答的问题。我们要研发的是受脑科学启发的认知机器,它是物质的、机械的、电子的物理装置,不是类似生物神经元组织的虚拟细胞体,并不构成人工生命。生命不能重来,机器则可以重启;机器没有意识但可拥有智能,记忆可以保留而不遗忘;机器可以暴力思维,物质硬构体很难约束思维软构体想象的范围和内容;机器里的物质硬构体没有新陈代谢,但可以被更新换代;智能可以不受人具身的生理局限。这些都大大丰富了认知机器的功能和性能,以替代越来越多的人类社会劳动岗位,机器越来越像人,甚至在一些方面远超人。但是,人不能越来越像机器,人需要有新的创造。未来社会,人和机器的认知互补迭代,高效协同,非常重要。机器越智能,人类越智慧,人类智慧引领着机器智能。
关键词:机器智能 激活 思维软构体 认知物理学 认知互补 迭代的智能
图灵在 1950 年发表的著名论文《Computing machinery and intelligence》(计算机器与智能)[1]中,发出振聋发聩之问 “机器能思维吗?” 他在论文中指出: “在我看来,生命与非生命之间的差别, 远远大于人类和其他生命之间的差别。” 当前一个众所周知的事实是:人和机器都可以作为认知的载体,机器可以学习,可以思维,机器的围棋智能已经超过了人,机器与人之间的自然语言聊天已经通过了图灵测试。 但是,两者认知的机理是不同的,需要在机器认知和人的认知要素中,找寻更底层的相同之处。为此,我们站在薛定谔、图灵、维纳等科学巨人的肩上,提出“认知物理学”,即用物理学的原理和方法,讨论物质、能量、结构、时间四个基本要素之间的关系,试图揭开智慧之谜,解释认知的底层逻辑,解释生命中的认知活动如何在和物理世界的交互中产生,尤其是解释智能的生成和发展,从而形成物质硬构体和思维软构体的相互纠缠,发明像人又不像人的认知机器。笔者的《机器如何像人一样认知》[2]《机器如何不像人那样认知》[3]两篇论文已经发表在2022年和2024年的《中国计算机学会通讯》上。这次重点讨论了机器如何不像人的方方面面,成为新版。
1.生命不能重来,但认知机器可以重启
硅基机器是无机物质构成的电子装置,不可能是人脑神经元细胞组织,它们是由物质、能量、结构和时间四要素组成[4],是在图灵机模型和冯·诺依曼存储程序的通用计算机架构基础上发展起来的。它们的结构和时间寄生在物质和能量上,形成诸多物质硬构体。把各种硬构体按照结构设计组装到一起,就成为物理的机器。机器中的软构体是承载或者寄生在硬构体上的;当然,它也可以寄生在已有的软构体上。如同人的精神寄生在硬构体之上一样,机器里一定要有一个最基本的时钟。时钟赖能量为生,时间寄生在时钟上,形成时序。激活机器的钥匙是时钟、时序和递归。机器中的物质硬构体和思维软构体在加电后的纠缠导致涌现,表现在时钟、芯片、机器主板、基本输入输出系统(basic input and output system, BIOS)和操作系统(operating system, OS)在自举状态的递归复用,让机器“活”起来。作为工具的机器,结构寄生在物质上。要激活机器,需要提供能量。能量激活时钟,时钟产生节律,如同生命有节律一样。机器利用时钟形成时间和节律,可以在当前的周期内为下一个周期提供一个更新的输入。总是存在下一个周期,它能够保持思维的连续性,机器思维才能活动起来。这是图灵的划时代贡献,堪和牛顿、爱因斯坦媲美,可惜没有得到广泛认可。正是图灵和冯·诺依曼的计算机体系结构设计中的CPU(控制单元和运算单元),保证了指令能像数据那样存储,使得指令和数据形式上无区别,并将程序指令存储器和数据存储器合在一起,然后顺序执行程序,让机器能够自举。这过程依靠只读取存储器(read-only memory,ROM)中的基本输入输出系统(ROM-BIOS)引导,然后到激活操作系统,让机器一步一步地进入认知就绪的工作状态。ROM-BIOS是一组固化到计算机主板ROM芯片上的程序。它保存着计算机最重要的基本输入输出程序、系统设置信息、开机上电自检程序和系统启动自举程序,为计算机提供最底层、最直接的硬件设置和控制。然后,操作系统接管BIOS,再到认知就绪。这是硬构体和软构体纠缠的正反馈过程,导致涌现,形成新的宏观有序状态。碳基生命通过繁衍实现基因遗传,通过摄食和新陈代谢实现生长,进行思维活动;而硅基机器里物质和能量是分开的,通过认知核[5]更新来完成升级换代。认知核包含机器具身物质硬构体,如时钟、集成电路芯片、主板等,也包含思维软构体,如机器指令、BIOS和OS等。生命不能重来,而机器可以关闭后重启。生命只能活一次,人的寿命不过百年,有一定程度的自愈能力,但新陈代谢不能中断,不能永生。机器则不然,它是由物质、能量、结构和时间四个基本要素构成的复杂硬构体和复杂软构体之间的相互作用。机器如果失去了能量供给,如断电,便会停止工作;恢复供电后机器又可以再次自举,通过激活操作系统,重新进入认知的工作状态。硅基机器中的物质硬构体不能自繁衍、自成长、自修复,只能被组装,被生产,被修复,被升级,实现更新换代。硬构体老化了、失灵了,修复之后可以重启,死活多次。如果有新的硬构体、软构体加进来,只要适配,升级换代之后可以提高机器认知的能力。
2.机器没有意识但有智能,记忆可以不被遗忘
生命先有意识[6],后有智能,而意识和智能会相互纠缠。生命里有记忆和遗忘,可以交错;机器没有意识,只有智能,认知机器里存储的知识可以保存不遗忘,机器也不会“痴呆”。人类智慧是机器智能望尘莫及的,这是硅基机器认知和碳基生命认知的很大不同。对于高等生物而言,意识是智能的根基,意识和智能是智慧的核心,两者常常纠缠在一起,时隐时现,难以分离。智慧还强调生机活力和灵感气质,特别是高等生物的智慧会涉及情感,生物的情绪又会反过来影响其智能。但凡意识、情感都是内省的、自知的、排他的,不可以人造。当人类感知这个物理世界的时候,可以完全有意识,也可以完全无意识,还有中间的情况存在。那些有我们的感觉和知觉,也可能有行为参与的一系列事件在以同样的方式屡屡重复时,它们就渐渐地脱离意识的范畴,变成技能或者智能。例如,小孩迈出第一步的尝试是有意识的,成年人边讨论边走路时的步伐却是无意识的。智能是建立在通过重复练习而习得的过程之上的。这个过程称为记忆,而记忆是智慧之母。当感觉、知觉和行为成为本能、技能或智能时,可称为意识隐退,它对于人的智能具有重要的意义。即便如此,起初闯入意识领域的只是那些变化或“差异”,使得新事件区别于以前的事件,因而需要新的思考。当新情况及引发的新反应出现时,意识又冒了出来。一旦场合或者环境条件与以前不同,事件的发生就是有意识的,可称为意识复现。意识是生命进化范畴内的一种现象。人的意识和人的智能,就是如此纠缠着,又释放着,时而隐退,时而复现[7]。
然而,意识和智能也是可以分离的。人工智能的发展史表明人工智能可以脱离意识而存在,非生命的工具和机器,不可能有意识、欲望、情感和信仰,其具身甚至没有边界感,无法区分“我”和“非我”。人工智能是人类智能的体外延伸,就像发明油灯、电灯、望远镜可提升人的视力,发明算盘、计算尺、计算机可延伸人的计算智能,发明驾驶脑可代替驾驶员的驾驶认知。虽然非生命体的人工智能没有意识,但是可以人为地赋予人工智能以情感。那是第三人称的“外显”,情感机器人只是外显的情感。
我们的理性思维和认知过程,有时也会被意识、情绪、欲望和习性所困扰扭曲。意识并不总是有助于人类的认知,并不总是有助于发展人类智能。此外,智能还常常离开意识被单独释放到体外。例如,在科技图书馆里,我们阅读大量的专著、学位论文和专利的正文,几乎不涉及作;者们的意识、欲望、情感和性格。又例如,当我们阅读进化论之父查尔斯·达尔文1859年的名著《物种起源》[8]时,我们怎么也没有想到,他的“自然进化、物竞天择”的生物知识和他钟爱的妻子(一个虔诚的基督教徒)的信仰竟然如此冲突。这说明智能和信仰、价值观是可以分离的。再例如,计算机70余年的发展表现出非凡的计算智能,但计算机始终没有意识。由此看来,能思维会创造的机器没有被意识和欲望困扰。只有智能,且受控于人,才是件大好的事情。这样的机器可以始终集中注意力工作,不知疲倦,不闹情绪,表现出一以贯之的工具性,更不会在以后的工作中患上癌症、痴呆之类的生理疾病。认知机器的使命由操控者把持和驱动。机器的工具性正是人类的智慧所在,人类不会让人工智能跑偏。智能机器是人类可控的工具,作为我们体力、智力的体外延伸,我们能自如地调用它,迭代它,主动权在人类手里。从这个意义上说,机器永远受控于人。目前,人工智能不和意识、欲望、性格、情感纠缠,但智能机器将使人类彻底改变世界,其中能思维、会创造的智能机器正在体现出这种力量!
3.机器可以暴力思维,物质硬构体很难约束软构体想象的范围和思维的内容
机器的思维能力,不受限于机器具身的行为能力,而机器学习和接受训练比起人的认知要快很多很多,还可暴力思维。机器思维的速度是生命体望尘莫及的,其思维软构体可以自我复制、自我组合、自我拓展。人类思维是基于细胞的生命认知,是一个生物化学的过程,如神经元传递信号时会通过化学物质(神经递质)的释放和接收来完成,只能具有毫秒级别的生物电的反应速度,很难更快;人的记忆分为短期记忆与长期记忆[9]。一次性学习之后都是短期记忆,间隔性学习之后能形成长期记忆。重复学习的时间间隔非常重要。要有效地转化,从短期转化成长期记忆,必须在一个最优的时间间隔来进行。最佳间隔可以达到最高的强化效果,但如果间隔时间太长,就不能强化。机器学习则不然。如今,认知机器里的思维组块,从集成电路芯片、高通处理器和存储器,都是基于电流和电路设计来工作的,信号传递和处理速度非常高,传递距离又非常短,实际的延迟可用纳秒(10-9)、皮秒(10-12)来衡量,机器里的时钟精度已经可达到飞秒(10-15),甚至亚飞秒(10-16),原子钟芯片的时间精度可达到10-11,正在走向商用量产。机器里无论是复杂机器指令还是精简机器指令的执行,抑或是寄生在机器语言上的各种软构体的执行,都通过递归复用,表现出高超的秩序。例如,在不到1秒的时间内,机器通过“翻译”“查重”等操作,可以判断分别用英文和汉语表达的两段相当长的文档中,是否有重复使用的词句。对于人来说,思维具有随机性和模糊性,缺少形式上的精确性,完成这个任务费时费力。如果将“翻译”和“查重”任务扩大到检查全球范围的学术论文抄袭,这是人工不可能完成的事,但对于机器而言并无太多困难。基于时序的机器认知,可以做到纳秒(10-9)、皮秒(10-12),甚至飞秒(10-15)级的反应速度。倘若机器以飞秒计算,人以秒计算,一飞秒与一秒的比例,相当于一秒和3200万年的比例,我们可以用皮秒和飞秒模拟人的思维活动周期。思维软构体通过抽象,自我复制,自我拓展,引发联想和类比,由此及彼,触类旁通。结构和概念是人类认知过程中抽象的结果。抽象源于想象,抽象就是去伪存真,由表及里,去粗取精,使得认知具有一般性和普遍性。机器可以模拟重演物理、化学、生物、材料等学科中大多数快速变化的过程,例如研究单分子的振动和转动、化学键的断裂和形成等。由此可见机器暴力思维的威力。作为高等生物的人类,在计算π值的进程中,把小数点精度提高1个位数,用了1700 年;再提高4个位数,又用了800年。而计算的机器通过物质硬构体的更新换代和思维软构体的自我改进,物质硬构体从早先的电子管到晶体管、到集成电路的不断升级,现在可算到小数点后万亿位,全程仅用了70 年。无论是人算还是机器算,历史的进程呈现了π值无人非议的唯一性解。所以,机器能通过暴力计算和暴力仿真,完成蛋白质折叠的结构预测[10],也就不奇怪了。物质硬构体很难约束想象的范围和思维的内容。思维软构体低成本的可重组导致的幻想力是创造力的来源,但如果不和物理世界实时沟通验证,机器也可能过度幻想,陷入思维的死循环。
4.机器具身可以不受人的具身生理局限
人的生命是在蛋白质大分子层面,而非原子层面的物质结构的某种运动表现形式。人体具身的成长过程与细胞的分裂紧密相关,而细胞增殖包含有丝分裂和无丝分裂。在细胞分裂后,新产生的细胞会吸收营养物质,随后体积逐渐增大,发生细胞分化。人体内所有细胞都含有相同的遗传信息,但不同细胞表达的基因不同,分化为具有特定结构和功能的细胞,如心脏细胞、神经细胞和肌肉细胞。生物体发育过程中,为了维持内环境稳定,还存在细胞凋亡。在胚胎期受精卵经过多次有丝分裂形成胚胎,细胞分化形成各种组织和器官;在婴儿期和儿童期,骨骼和肌肉系统快速发展;在青春期出现第二次生长高峰,性成熟是其重要特征;在成年期,生长速度减慢,细胞分裂、分化和凋亡处于动态平衡状态,维持具身功能的稳定;到了老年期,细胞分裂和修复能力下降,人体开始衰老,走向死亡。人的具身成长过程是一个耗时的、个性的、复杂的生物学新陈代谢过程。生命智能的前提是生命体自身必须具有新陈代谢的能力,把物质转化为能量,能量转化为物质,让生命能够成长并保持正常有序运转的能力,这样生命体便有了负熵。新陈代谢是人体摄取营养物质,将其分解、转化为能量供给各器官和肌体使用的过程。几乎所有生物都需要周期性睡眠休息,这是新陈代谢的需要。如果没有健康的代谢,生命智能难以为继,就谈不上认知。人体的新陈代谢已经进化了千万年才达到今天的状态。而认知机器的具身就完全不是这么一回事了。
认知机器中的物质和能量是截然分开的。机器中没有类似生物神经元组织的虚拟细胞,没有分子马达和离子泵,不构成人工生命。机器具身中的物质硬构体,无论其结构和组成多么复杂,它是一次性地被批量生产出来的,直接靠外部能量供给就能运转。物质硬构体没有自我复制能力,不需要自成长,无需睡眠,靠外界阶跃式地更新换代,完全免除了生物学的具身新陈代谢过程。在机器被激活之后,只要用合适的能量维持时钟、时序和正常交互认知的秩序,就可以一以贯之地工作,保持良好的思维状态。一般地说,物质硬构体的正常老化几乎不影响机器当前的智能,而这正是我们所期望的。
宇宙中的物质和能量通过结构和时间的相互作用,孕育出生命,是一个复杂而漫长的演化过程。生命起源于最初始、最基本的自我复制能力。从蛋白质分子到单细胞,单细胞到多细胞,植物到动物,低等生物到高等生物,大自然用了40多亿年才完成。而认知机器里,物质和能量截然分开,完全忽略了从毫无生机的非生命物质到高等生命具身的漫长演化,全然不顾及物质硬构体具身必须具有的新陈代谢,不顾及作为物质硬构体的大脑层神经生化组织的代谢重塑,仅仅考虑认知空间里思维软构体的自我复制和重组,只要机器里的物质硬构体能够支撑思维软构体的认知活动,机器就可以拥有智能。计算机拥有计算智能,围棋机器拥有博弈智能,无人驾驶汽车拥有驾驶的时空智能、记忆智能、计算智能和交互智能,这些都是突出的案例。
对任何一台智能机器,我们希望它一专多能,但不奢望它全知全能、无所不能。机器可配置各种各样的感知传感器,设计各种各样的动力机械,形成各种各样的具身动力学行为,这就大大丰富了机器的功能和性能。机器能自主操控,以替代越来越多的人类社会劳动岗位,尤其是恶劣环境里的劳动岗位。机器所感知的世界,由其配置的异构传感器所决定,传感器的种类和精度决定机器感知的质量,决定机器所观察到的物理世界的极限,影响机器的认知和智能。可以不受碳基生命感知器官的生理限制,给机器配装上各种各样的硅基传感器和识别系统,比如让它配上显微镜、望远镜,看到偏振光、电磁场,听到超声波、次声波。还可以配置北斗定位接收机完成位置识别,甚至把特定形式的语言,如编程语言、美术语言、化学语言、材料配方语言等赋予不同的机器个体,让它用专业的术语和人类专家交互。机器的行为,即具身智能,和机器机械具身动力学性质息息相关。例如汽车的自驾驶行为和车辆动力学相关,水面舰艇的自航行行为和船舶海洋动力学相关,飞机的自飞行行为和机身空气动力学相关,盾构机的自操控行为和其伺服系统能力相关,手术机器人的自操作行为和手术刀的灵巧性相关,等等。人类完全可以通过机器的不断升级换代,给机器设计各种各样或强大或精准的感知装置,给机器设计各种各样的机械形态和具身动力学性质。认知机器不再受碳基生命的感知器官和肉身能力的局限,辅助科学和科学家,辅助工程和工程师,辅助艺术和艺术家,让人类从此进入智能时代,智创未来,未来已来,这是一件多么令人欢欣鼓舞的划时代的事情啊!
5.结束语
我们从生命的物理观和机器的生命观两个视角来研究智能。尽管机器越来越像人,这个似是而非的生命甚至在一些方面正在远超人类,但是人不能越来越像机器,人更要有新的创造。人类变得智能不是进化的必然,进化只是给了人出生后认知二次扩张的潜力。人类发明的机器可以有很高的认知起点,可以大批量生产和迭代更新,可以一以贯之地工作。未来社会中人和机器的认知互补和高效协同非常重要。人机互动,人机共生,不再是带有时延的“输入-输出”单向关系,也不是简单的“人围着机器转”或者“机器围着人转”的主从关系,而是人机之间无时不在的多通道、跨模态的自然交互和迭代发展的共生关系。人类进入智能时代,并不存在人工智能毁灭人类的威胁。不必把人工智能神话化,只有可能是人毁灭自己,但这种概率极小。我们相信,人类一定会越来越智慧,机器一定会越来越智能;人类智慧将引领机器智能,而人类本身一定会更加尊严、更加自律、更加优雅地生活。
[1] TURING A M. Computing machinery and intelligence (1950)[J]. Mind, 1950, 49: 433−460.
[2]李德毅.机器如何像人一样认知——机器的生命观[J].中国计算机学会通讯,2022,18(10):11−14.
[3]李德毅. 机器如何不像人那样认知[J]. 中国计算机学会通讯, 2024, 20(7): 54−57.
[4] 李德毅, 殷嘉伦, 张天雷, 等. 机器认知四要素说[J]. 中国基础科学, 2023, 25(3): 1−10, 22.
[5] 李德毅. 人工智能基础问题: 机器能思维吗?[J]. 智能系统学报, 2022, 17(4): 856−858.
[6] EDELMAN D B, SETH A K. Animal consciousness: a synthetic approach[J]. Trends in neurosciences, 2009, 32(9): 476−484.
[7]SCHRÖDINGER E. What is life?: with mind and matter and autobiographical sketches[M]. Cambridge: Cambridge University Press, 1992: 50−58.
[8]查理·达尔文. 物种起源[M]. 韩安, 韩乐理, 译. 北京: 新星出版社, 2020: 55−69.
[9] ENGLE R W, TUHOLSKI S W, LAUGHLIN J E, et al. Working memory, short-term memory, and general fluid intelligence: a latent-variable approach[J]. Journal of experimental psychology general, 1999, 128(3): 309−331.
[10] JUMPER J, EVANS R, PRITZEL A, et al. Highly accurate protein structure prediction with AlphaFold[J]. Nature, 2021, 596(7873): 583−589.
作|者|介|绍

中国工程院院士,欧亚科学院院士,中国人工智能学会和中国指挥控制学会名誉理事长,清华大学博士生导师,主要研究方向为计算机工程、不确定性人工智能、数据挖掘、自驾驶和认知物理学。
