特约文章丨概念认知学习——认知启发下的人工智能新范式

中国人工智能学会 2025-10-13 17:41


文 / 郭豆豆,徐伟华

摘  要:本文以概念认知学习为主线,梳理了该领域的国内外研究现状,综述其理论基础、发展脉络、研究进展及其机遇与挑战,为后续深入研究提供相关支撑与参考。


关键词:概念认知学习;形式概念分析;粒计算;认知智能


2024年4月26日,孙凝晖院士在十四届全国人大常委会专题讲座中指出:“人工智能与数据要素已成为新质生产力的典型代表”。智能计算作为人工智能的核心驱动力,正在重塑从基础研究到产业应用的各个层面,成为社会发展的强大推动力。随着智能计算的空前普及与飞跃发展,人们对“智能”这一概念的界定也得到了极大的拓展。尽管通用人工智能在模拟人类表观能力方面已取得显著进展,但在处理联想、记忆、推理、决策等复杂“认知”问题时,仍远未达到预期。数据-知识双驱动的认知智能范式仍是当前智能化研究的主旋律之一,推动了一系列相关课题的发展。在此背景下,概念认知学习(concept-cognitive learning,CCL)近年来迅速发展。下面以概念认知学习为主线,将从四个方面介绍一种认知启发下的人工智能新范式——概念认知学习,包括其理论基础、发展脉络、研究进展,以及机遇与挑战。


1 概念认知学习的理论基础


近来,Gemini和ChatGPT等新兴技术的出现,再次引发了人们对人工智能和认知计算的关注。与此同时,如何定义“智能”这一概念的相关问题也再次成为学术界和工业界讨论的焦点。事实上,认知计算和人工智能最初的目标相同,均涉及人脑的认知建模,包括记忆、注意力、感知、推理、规划、决策等。因此,两个领域之间存在着密切关联。研究各种有价值的认知计算范式,对于深入理解和实施人工智能的基本假设至关重要。尽管通用人工智能在模拟人类逻辑思维方面取得了显著进展,但其可信度和可靠性仍未达到智能机器系统的预期。正如Lake等所言,人类学习新概念通常可以从极少数例子中成功概括,而机器学习算法往往需要数以千百记样例才能达到类似的精度。概念作为人类认知系统的核心要素,构成了感知、学习、记忆与思维等高级认知功能的基础。然而,机器认知主要依赖于统计关联,而非真正的概念建构与理解,在知识处理过程中,缺乏人类特有的抽象、概括、推理及适应等认知能力。由此可见,机器学习研究应当更加关注于人类层面的认知学习。从这个角度来看,概念的认知学习无疑是一种有价值的认知智能范式。


“概念”这一术语源于哲学,它是人类在认识世界的过程中对事物本质特征的认识,并进一步高度抽象为获取的知识。借助概念,人们能够构建起精神与现实之间的映射,在辨识事物的同时,探索事物的发展规律,即认知。在概念的经典定义中,其通常由内涵、外延和概念名三个方面组成。一般地,根据其中任意2个就可以得到第3个。内涵指的是概念的具体特征描述,外延则是指概念所指代的个体范围,而概念名则表示其映射下内涵和外延的描述表示。通常来讲,内涵和外延是可以唯一确定的,由此二者所相互指代的概念是独特的,故而可以用于描述不同类型的事物。以“素数”概念为例,定义为“只能被1和其自身整除的自然数”。这里,“素数”是概念名,内涵是“只有1和本身这2个因数的数”,外延则是“满足该定义的自然数集合,如{2,3,5,7,11,13,…}”。


概念是人类思维的最基本单元。关于概念的哲学阐释,不同学派对其本质、形成及作用各有见解,观点不尽相同。通常,仅用于表达单一事物的概念可称为个体概念,其所指代的对象为个体(例如天安门、北京、中国);而用于表达多个事物的概念则可称之为一般概念或普通概念(例如古建筑、城市、国家)。无论是哪种概念,均可视为人类认知过程的质变,源自人脑通过抽象表征和加工所获得。因此,自然也存在诸如金山、乌托邦等虽然不存在但赋予特定意义的概念,可称之为虚假概念或伪概念。值得注意的是,基于哲学中的概念发展而来的形式概念分析(formal concept analysis, FCA) 理论,从数学的角度刻画概念的内涵与外延,用以描述事物的本体特征,称为形式概念(简称概念)。在此,形式概念同样被选作本文概念认知学习研究的知识载体,用以从数据中挖掘与融合知识。通过数据与经验的积累,人们可以获取事物的本体概念,并基于这些概念进行判断、推理和论证。同时,概念的获取依赖于对概念的表征与学习。


起初,为了深入研究概念的形式化描述,德国数学家Wille最早提出了形式概念分析理论。形式概念分析(formal concept analysis,FCA)(或称概念格)的核心思想是从形式化背景出发,使用严格的数学语言描述组成本体的对象、属性和它们之间的关系,进而将所有概念及其之间的泛化与特化关系构建成一个完备格,即概念本体模型,用以刻画本体的知识结构。随后,为了增强不同场景下概念本体适用性,概念可以具体表示为形式概念、粒概念、三支概念、模糊概念、面向对象和属性概念等形式。据悉,相关研究已经在数据挖掘、云计算、模式识别、情感计算、社交网络等领域广泛应用。


由此可见,概念具有严格的数学定义,要求概念的内涵与外延的统一。从哲学的角度来看,认识过程即是内涵与外延统一的过程,即通过对内涵的理解进一步认识外延,或通过对外延的认识推动对内涵的判断。


2 概念认知学习的发展脉络


概念格(concept lattice ,CL)是FCA理论中核心数据结构,充分描述了对象和属性之间的二元关系,并展示出概念之间的泛化与特化关系。概念格对应的Hasse图则完美展示出数据中隐含的知识结构,使得概念间的层次关系一目了然。FCA理论正是得益于概念对数据的知识结构表征,成为认知学习的强有力工具。追溯至2007年,张文修教授与徐伟华教授基于现有的FCA研究成果,深入分析形式概念、粒计算和认知计算之间的内在联系,建立了基于粒计算的认知模型,形成了概念认知学习理论的早期雏形。随后,不少学者从认知计算、认知信息学和粒计算的角度研究了概念学习框架,为概念认知学习的进一步发展奠定了坚实基础,同时也为早期认知概念学习的研究指明了方向。


在2013—2018年间,随着认知概念学习的兴起,许多学者相继关注到这一领域,探索并提出了各种认知概念学习的具体模型和方法。例如,双向概念学习通过充分和必要学习描述了概念学习过程;利用形式概念分析来研究双向联想记忆的认知功能;从认知角度提出基于粒计算的概念学习模型。尽管这些研究对认知概念学习的发展做出了重要贡献,但大多数工作集中在粒计算的框架内。自2018年以来,“概念认知学习”一词开始被广泛接受和认可。与形式概念分析和传统认知概念学习不同,概念认知学习以概念为知识基本载体,研究事物的认知与学习过程,旨在从认知角度探索人类层面的信息处理和概念知识学习机制。在概念认知学习理论中,从数据中挖掘与融合知识的过程离不开一个特定的信息表——形式背景(formal context)。


如图1所示,自2007年以来,概念认知学习术语先后经历了3个不同发展阶段,即基于粒计算的认知模型、认知概念学习、概念认知学习。值得一提的是,近年来概念认知学习与机器学习的结合,极大拓宽了该领域的研究视野。在此背景下,概念认知学习逐渐成为数据挖掘、智能计算、认知计算和智能决策等领域的研究热点。

特约文章丨概念认知学习——认知启发下的人工智能新范式图1

图1概念认知学习的发展阶段


随着概念认知学习理论在模型推广、方法设计和实际应用等方面的深入研究,越来越多的学者加入对这一新兴领域的探索。特别是,概念认知学习与机器学习的有效结合,进一步拓宽了该领域的研究视野。目前,概念认知学习主要研究内容可归纳为概念认知机制、概念学习机制、概念生成机制、认知系统构建机制、复杂决策优化机制等方面。具体模型包括双向概念认知学习、增量概念认知学习、模糊概念认知学习、多视图概念认知学习、半监督概念认知学习、不完备概念认知学习、多标记概念认知学习、高维概念认知学习、三支概念认知学习、多注意力概念认知学习、区间概念认知学习、加权概念认知学习、动态概念认知学习,以及L-模糊概念认知学习等。首篇关于概念认知学习的中文综述《概念认知学习的若干问题与思考》已由李金海等于2020年发表;首篇关于概念认知学习的英文综述Concept-cognitive learning survey: Mining and fusing knowledge from data已由郭豆豆等于2024年发表;首部关于概念认知学习的专著《概念认知学习理论与方法 》已由徐伟华等于2023年出版。


3 概念认知学习的研究进展


基于上述研究脉络,本章将通过展示CCL领域的关键词、作者、机构、论文和期刊之间的联系,分析研究热点、发展趋势,以及相关的学术合作网络,综述概念认知学习领域的研究现状及进展。为此,分别在中国知网数据库以“概念认知学习”和ISI Web of Science 数据库以cognitive concept learning 与concept-cognitive learning为关键词进行期刊文献检索,检索日期范围涵盖近10年(自2015年1月1日至2025年3月1日),并展开ESI高被引论文、出版刊物分析、关键词分析、作者合作网络和机构合作网络5方面内容分析。


经过数据库检索,共获得79篇文献的相关记录,其中有9篇文献入选ESI高被引文章,约占据总文献数的11.4%。表1详细记录了这9篇ESI高被引论文的信息。从ESI高被引论文的发表年份来看,在8篇高被引文章中有5篇的发表年份在近3年,说明了概念认知学习在近年来的活跃度不断上升,研究热度和影响力逐年增加。由此可见,CCL作为独立研究课题的逐渐成熟,并且在学术界的关注度持续提高。此外,从入选ESI高被引文章数量来看,国内学者徐伟华、李金海、钱宇华、丁卫平、郭豆豆位居前5,展现了国内学者在CCL领域做出的重要贡献。


表1近10年来概念认知学习领域的ESI高被引文章

特约文章丨概念认知学习——认知启发下的人工智能新范式图2


图2展示的是概念认知学习的出版刊物情况。由图2可见,CCL研究成果已在35种著名学术期刊上发表,其中Information Sciences、International Journal of Approximate Reasoning、International Journal of Machine Learning and Cybernetics、Knowledge-Based Systems and Cognitive Computations是目前发表数量排名前5的学术期刊。同时,注意到CCL的最新成果也陆续开始发表在Information Fusion 、IEEE Transactions on Neural Networks and Learning Systems、IEEE Transactions on Fuzzy Systems、IEEE Transactions on Knowledge and Data Engineering IEEE Transactions on Cybernetics、IEEE Transactions on Computational Social Systems、《计算机学报》《计算机研究与发展》《电子学报》等人工智能领域权威期刊。


此外,为了更好地理解概念认知学习领域的研究前沿及其相互关系,图3、图4和图5分别基于所获取的79条数据库检索记录,以网络结构图的形式展现CCL领域的关键词热度、作者合作,以及机构合作情况。网络结构中的节点均采用“年轮”形式,节点的颜色和大小各异,表示不同的属性。颜色根据年份分类,从冷色过渡到暖色,反映了研究的时间演变;节点的大小则表示其出现的频率,节点越大,表示该关键词(或作者或机构)的出现频率越高。节点之间的连线表示共现关系,所连线的节点表示其在同一篇文献中。

特约文章丨概念认知学习——认知启发下的人工智能新范式图3

图2概念认知学习的出版物


图3展示了关键词网络。图中每个节点均表示在论文中出现的关键词。特别地,当2个关键词在同一篇论文出现时,则通过1条线连接这2个关键词。此外,节点的大小与该关键词在文献中的出现频率成正比。由图3可知,概念认知学习、粒计算、概念格、三支决策和形式概念分析等关键词表示的圆圈节点相对较大,这说明了它们在这些文献中的出现频率较多,在该领域的研究关注度较高。同时,概念认知学习、三支决策、形式概念分析和概念学习等关键词的节点外圈颜色为紫色,突出了它们的高中心性,显示这些关键词在当前研究中的重要性和热点研究地位。此外,概念认知学习与粒计算、认知计算,以及机器学习领域中的其他相关关键词(如知识、属性约简、增量学习等)存在密切关联,进一步反映出当前CCL研究的主要方法和方向。值得注意的是,粒计算作为具有高中心性的关键节点,已成为概念认知学习研究中的核心方法。

特约文章丨概念认知学习——认知启发下的人工智能新范式图4

图3概念认知学习的关键词网络


图4展示了作者协作网络,包含116个节点。图中每个节点均代表作者,节点之间的连线表示作者之间的协作关系。节点的大小反映了该作者在文献中的合作频次,节点越大,表示该作者发表的合著文章数量越多。相关节点与其他节点的连接越多,表明该作者在合作网络中的影响力越大,与其他作者的连接更紧密。由图4可知,徐伟华和李金海的紫色外圈的节点具有较高的中心性,表明他们经常与其他作者合作发表论文,起到了协作桥梁的作用。徐伟华的节点最大,统计数据显示共有22篇合著论文,在作者中排名第1。尤其是徐伟华、郭豆豆、钱宇华和丁卫平等作者的节点呈深紫色,表明他们在近3年内合作发表了大量论文,处于领域的领先地位。此外,李金海有16篇合著论文,占总论文数的20.3%,进一步凸显了其在领域的影响力。然而,图4也显示了几个相对独立的群体,这表明在这些不同的作者群体之间,仍然需要进一步促进合作与互动,以推动跨领域的合作研究。

特约文章丨概念认知学习——认知启发下的人工智能新范式图5

图4概念认知学习的作者合作网络


图5展示了机构协作网络,包含54个节点。图中每个节点的大小和节点的颜色分别代表该机构在概念认知学习领域的发文数量和发文时间。节点之间的连线表示不同机构之间的合作关系。由图可知,CCL领域的主要研究力量包括以西南大学、昆明理工大学和燕山大学为代表的3个研究团队。其中,西南大学的节点最多,达到12个,反映出该机构与其他院校保持密切合作。此外,在图中的众多紫色节点,首推加拿大里贾纳大学较早关注概念认知学习,并与其他的机构不断推动和研究这一研究方向。目前,西南大学、昆明理工大学和中国科学院大学的发表频次排名前3,对概念认知学习的理论研究与方法创新上具有重要学术贡献。

特约文章丨概念认知学习——认知启发下的人工智能新范式图6

图5概念认知学习的机构合作网络


此外,综合观察图3、图4和图5,可以得出下述分析结果。


(1)图3的关键词网络图揭示了概念认知学习领域中不同研究主题之间的关系。随着研究的深入,概念认知学习、粒计算、三支决策、概念学习、形式概念分析、认知计算等已成为CCL领域的主要研究方向。


(2)图4的作者合作网络图表明,概念认知学习领域中的大多数的论文是由多个研究者合作完成的。徐伟华、李金海、钱宇华、丁卫平、张涛、郭豆豆、米允龙等在概念认知学习的发展中起到了重要作用,特别是近年来徐伟华和李金海的贡献尤为突出。


(3)图5的机构合作网络图表明,概念认知学习的研究机构之间联系紧密,且当前主要研究力量集中在中国。其中,西南大学、昆明理工大学、燕山大学和中国科学院大学是积极推动该领域发展的重要机构。


4  概念认知学习的机遇与挑战


“大数据时代”如约而至。随着全球信息技术产业持续化推进,大数据逐渐上升为国家战略性资源。利用大数据技术进行知识发现与智慧决策,已经在机器学习、风险评估、图像处理、决策科学等众多研究领域取得突飞猛进的发展。针对大数据的信息处理技术,成为人工智能、工业制造和医疗健康等多个行业的关注焦点。特别地,如何从具有海量、高维、动态等特征的大数据中发掘有价值信息,是近年来人工智能领域的重要研究课题。实际中,大数据资料的数据质量往往无法保证,导致在信息处理、加工过程的不确定性因素增多,决策分析难度加大。传统基于经验数据的统计学模型和机器学习方法,难以满足大数据时代的信息处理需求。借鉴机器学习方法研究概念,诞生出人工智能领域的一类重要研究课题——知识发现。由此可见,在大数据时代背景下,基于概念的知识发现与决策分析是大数据智能信息处理领域的重要方法之一。


大数据的发展为人工智能研究开辟了全新的视角。作为人工智能的基础支撑,数据时刻制约着人机智能的发展。众所周知,数据-信息、知识-智慧(data-information-knowledge-wisdom,DIKW)层次结构是大数据分析领域的重要研究框架,具体表现为:从数据中挖掘信息,从信息中发现知识,从知识中产生智慧。而从数据到信息再到知识的过程,离不开对概念的表征和学习。在过去43年间,形式概念分析理论成功吸引了众多学者的研究关注,也取得了一定的研究成效。然而,FCA理论过于关注概念格的构建研究。事实上,概念格的构建是一个NP-hard问题,这使得FCA理论在大数据时代的发展受到极大制约。与此相对,尽管机器对概念的认知则依赖于大量样本数据的训练,但是人类的概念学习只需通过总结和归纳少数几个案例完成。自然,可以结合概念学习与概念认知进行交叉研究,自此诞生了一个全新的课题——基于概念的认知学习。概念认知学习从认知角度重新审视了概念问题:结合人脑在求解复杂问题时的认知机制,探讨数据的知识结构和认知机理,提供了一种与传统数据分析和知识表示方法截然不同的思路,逐渐成为当前认知计算和人工智能领域的重要研究方向。


一般而言,数据处理与分析的最终目标在于形成概念和规则,指导人们的决策与行为。特别是大数据因其蕴藏的巨大经济和社会价值,正受到社会各界的广泛关注。尽管概念认知学习在人工智能、认知计算、知识发现等领域已取得显著进展,但在处理和分析复杂大数据方面,仍未取得令人满意的效果。如何从复杂的大数据中挖掘有价值的信息,已成为多个行业的研究焦点。然而,数据呈现出高维性、动态性、异构性等复杂特点,对概念认知学习方法而言无疑是巨大的挑战。例如,海量数据场景概念学习复杂性,高维空间中的样本稀疏性与特征的冗余性,以及动态环境中数据的实时更新和知识的灾难性遗忘等。现阶段,大部分现有的概念认知学习方法仍然集中在低维和小规模数据分析及规则提取上,未充分考虑大数据时代的背景。事实上,大规模数据的结构复杂性以及高维空间中知识的弱演化能力,往往会导致概念的有效性和实用性降低。而在面对实时更新的动态环境时,知识的灾难性遗忘问题则会严重影响概念系统的可持续性。因此,考虑大数据背景对概念认知学习的影响更贴合现实需求。


5 结束语


“概念”一词源于哲学,是人类在认识世界的过程中对感知事物的共同本质特征进行抽象与概括的产物。概念认知学习是一种以概念为知识载体,研究事物认知学习过程的科学,它从认知视角重新审视概念学习问题,致力于揭示人脑学习和认知规律。通过系统梳理概念认知学习领域的研究成果,本文从理论创新与实际应用2个维度,深入分析了CCL的演化与发展,探讨了CCL的理论起源与最新进展。可以看出,作为一类融合概念学习和认知建模的新范式,概念认知学习正不断拓展其研究边界,与多个人工智能分支交叉融合,发展出一系列新的研究课题。例如,可以同许多数据科学分支结合起来得到新的人工智能研究课题。比如与复杂网络结合产生复杂网络下的概念认知学习,和模糊数学方法相结合得到模糊概念认知学习,同粒计算理论交叉研究演化出多水平概念认知学习,乃至多粒度概念认知学习,所有这些研究将共同构建起概念认知学习的基本研究框架。从另一方面来看,概念认知学习作为一类认知启发下的人工智能新范式,拥有概念描述事物的辨识能力和概念规则的天然可解释性,自然可以完成众多人工智能领域的场景任务,例如分类、识别、预测等。


当前,概念认知学习正逐步成为人工智能和认知计算领域中富有潜力的新理念与新方法。相关研究成果充分体现了CCL在概念学习与认知机制方面的优势,已在多个方向取得初步成效。然而,仍有诸多关键问题尚未得到系统深入的探讨与有效解决,尤其是在复杂应用场景中的推广与实践方面,CCL仍面临严峻挑战。在大数据广泛渗透社会各个层面,成为核心生产要素与战略资源的当下,研究中如何有效应对大数据带来的高维、高噪声、动态变化及多模态融合等复杂特性,已成为推动CCL方法发展的重要机遇与挑战。因此,发展适用于海量、高维、动态及多模态数据环境下的概念认知学习方法,深入研究概念认知学习机理,构建面向复杂数据挖掘任务的高效知识建模机制十分重要且必要。此外,作为一个新兴研究领域,CCL的研究范围、研究目标及方法体系仍处于不断拓展与深化过程中,相关理论与实践方式尚需进一步明确和完善。未来,有必要从更广阔的视角推动其理论创新、模型演化与跨领域融合,不断夯实其作为新一代认知智能技术支撑体系的研究基础。



特约文章丨概念认知学习——认知启发下的人工智能新范式图7

郭豆豆

西南大学人工智能学院博士研究生。主要研究方向为不确定性人工智能与大数据学习。


特约文章丨概念认知学习——认知启发下的人工智能新范式图8

徐伟华

中国人工智能学会高级会员,粒计算与知识发现专委会秘书长,西南大学教授,重庆市学术技术带头人。主要从事粒计算、认知计算、信息融合与知识发现等研究。



选自《中国人工智能学会通讯》

2025年第15卷第9期

粒计算技术前沿与应用探索


特约文章丨概念认知学习——认知启发下的人工智能新范式图9

扫码加入学会
获取更多学会资源

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
人工智能
more
特约文章丨概念认知学习——认知启发下的人工智能新范式
【报告】人工智能专题三:智能社会发展与治理标准化指引-2025版(附PDF下载)
政务领域人工智能大模型部署应用指引【AI战略洞察】
课程日程安排公布 工业和信息化部人才交流中心“人工智能赋能材料科学关键技术应用”高级研修班火热报名中 名额有限 报完即止
这些初创公司正在将你的大脑与人工智能融合
会议详细议程公布!中科院、深圳人工智能产业协会、宁德时代、中南大、哈工大等出席2025先进电池产业集群论坛
学会动态丨为“人工智能+医疗”把脉开方,2025CAAI具身智能与智慧医疗前沿论坛在广州成功举办
【教育】联合国教科文组织(UNESCO)于2025年9月发布的《人工智能与教育未来:变革、困境与方向》
巴西教育代表团访问清华大学人工智能国际治理研究院
活动预告丨2025CAAI大模型关键技术与应用前沿论坛—人工智能女性菁英论坛将在南昌举办
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号