专业级美学理解大模型书生·妙析ArtiMuse上线，让“美”可量化

科学的发展往往始于对精确的度量与推理的追求。在艺术领域，审美判断的背后是否也存在可量化的美学原则？

近期，上海人工智能实验室与中国美术学院联合推出国内首个专业级美学理解大模型——书生·妙析ArtiMuse。该模型利用超过30万张图像作为训练集，其中包含1万张自建的精标注图像，具有80亿参数，能够对多种类的图像进行精细化、多维度的分项评估，还能生成具有专业水准的美学点评，为艺术教育、审美评价、美育普及提供了精确的量化工具。

ArtiMuse还首次将中国传统美学思想与评价体系融入AI算法逻辑，为我国在AI美学标准制定方面赢得话语权奠定技术基础。

欢迎扫码体验ArtiMuse

AI与艺术的双向奔赴

作为ArtiMuse研发团队负责人，上海人工智能实验室青年科学家刘翼豪面对自己用AI生成的图片受到“差评”，常感到不解。在中国科学院大学求学期间，他曾参与学校官方微信公众号的运营工作。当时，他为科普文章精心绘制的配图，收到了直率的反馈：“‘理工直男’配图。”从事科研工作后，他和实验室的伙伴们产生了共鸣——现有的图像质量与美学评估的量化指标似乎不太准确。

一个古老而深刻的命题摆在了这支平均年龄只有20岁出头的年轻团队面前：什么是美？在各种机缘巧合下，他们找到了中国美术学院教授姚大钧带领的一支交叉学科研究团队。艺术家们致力于AI与艺术创作相结合，正需要AI技术支持。

生成与评价是AI艺术创作中相辅相成的两个方面，但当前的研究和应用大多关注生成能力的提升，相比之下，如何评价这些生成作品仍处于缺位的状态。

“能否用AI来构建一个更懂‘美’的评价模型”这一设想被提出时，双方一拍即合。从研究需求来看，上海人工智能实验室的团队有算法与工程能力，中国美术学院的团队有艺术理论、审美判断与评价体系构建的经验。

一场AI与艺术的双向奔赴就此开启。这支年轻团队不满足于让AI只做理工科的“解题机器”，而是希望让AI拥有情感、理解美，参与艺术创作。

从“小学生”到掌管美的“神”

“一千个读者心中有一千个哈姆雷特”，对艺术作品的理解常常带有强烈的主观色彩。但在艺术家看来，审美并不完全主观，存在着规律和共识。那么，如何将这种看似主观的审美进行量化，是团队亟须解决的关键问题。

为此，中国美术学院的艺术专家团队根据多年积累的艺术理论和美学标准，提出了7个维度的评价体系，包括构图设计、视觉元素、技术执行、想象创意、主题传达、情感反应、整体完型等，最后形成综合评价。

基于这些标准，一批高质量的数据集构建起来，包含超过10,000张图像。据了解，每张图像不仅有一个总评分，还有针对7个维度的具体分数，每个维度还附有详细的评语，解释该维度的具体得分原因。

有了这些理论和数据基础，如何教AI“学会”这些美学知识？上海人工智能实验室团队先从互联网上搜集了数十万张公开图像及用户评价，对AI进行美学“启蒙”，培养它成为“小学生”；在此基础上，再采用前述专业数据集对这名“小学生”进行专业训练，带它上大学教授的“课程”，逐步提高自身“艺术素养”。历经4、5个月时间，它“毕业”了，达到与“本科生”甚至“研究生”相当的水平。

令人眼前一亮的是，AI不仅能给艺术作品打分，还能像专业评审一样，说出“为什么美”，以及“哪里不足”。团队为这个模型取了一个意味深长的英文名——ArtiMuse，其中“Muse”是指缪斯（古希腊掌管美的神），中文名则定为“书生·妙析”。

团队成员充分享受着创新的过程，“玩梗”和“搞技术”并行。一次，大家突发奇想，既然模型可以评价摄影、书法、绘画，能不能评价论文配图？他们甚至约定：以后论文配图要是得分低于6.5分，一律不准进论文！全员立刻兴致勃勃地用模型给自己的配图打分，然后互相支招优化，这让科研气氛瞬间变成“图像审美改造大赛”。在他们看来，这种既好玩又较真的态度，恰恰是年轻科研人的独特魅力。

根植中国文化，弥补东方美学AI数据缺失

ArtiMuse不仅具备专业的美学判断力，其审美内核根植于中国文化，流淌着属于中国的美学血脉，是目前最懂徐悲鸿、张大千的AI大模型。

在研发团队看来，大模型的发展长期以来由西方主导，训练所用的语料和数据也来自以英文为主的互联网内容，难以对中国传统的水墨画或书法作品给出客观、专业的评价。这是由于在它的训练数据中极少包含这类艺术形式，缺乏对“留白”“意境”“笔墨气韵”等东方美学概念的认知，会将其误判为模糊、杂乱或不完整的作品。

“如果全球普遍依赖这些带有文化偏见的模型进行美学判断，长此以往可能让人误以为西方审美是‘标准’，而中国传统艺术‘不够好’。”刘翼豪强调，“中国传统文化的审美理解，要靠中国人自己来解决。”

为此，团队专门收集了大量中国传统绘画、书法等艺术作品，由艺术专家团队深入解析与专业点评，并纳入标注数据集中，有效弥补了现有AI在东方美学数据上的缺失。

例如，徐悲鸿的一幅骏马图总分为9.47分，“艺术执行”单项得到了满分10分，评价为：“细腻的笔触和柔和的色彩营造出活力与动感，构图平衡和谐。”张大千的一幅荷花图总分为9.55分，评价为：“光影交织，视觉冲击力强，具有永恒美感。”

ArtiMuse”对荷花图、骏马图的评价

与ArtiMuse一起成长，也让科研人员的艺术水平得到了提高。例如，为科普文章创作的配图只得到了4.47分，模型会点评“哪里不好看”：“整体视觉元素构成简单，色彩搭配不统一，卡通形象与现实物品结合突兀。”