一周AI丨多位华人入选AI百人榜;OpenAI杀入语音模型;谷歌正式发布nano-banana;xAI限时免费智能代码生成模型…

世界人工智能大会 2025-08-29 17:45
资讯配图


要闻列表

AI万象

联合国大会决定设立AI独立国际科学小组与全球AI治理对话机制


国务院印发“人工智能+”行动意见,提出实施六大重点行动


时代2025 AI百人榜出炉:任正非、梁文锋、王兴兴、彭军、薛澜等入选

大平台动作

OpenAI杀入语音模型大战,祭出最强GPT-RealTime,加量还降价


谷歌正式发布nano-banana图像模型,官方名称:Gemini 2.5 Flash Image


xAI推出智能代码生成模型Grok Code Fast 1,限时免费开放


英飞凌与英伟达合作,以实现具有精确运动和效率的人形机器人


IBM联手AMD开发量子超级计算架构

新力量崛起

美国初创公司推出巨型配送机器人:一次能送10单,3美元送到家

投融资风向

AI硬件Haivivi完成2亿元A轮融资,即将发布行业首款端到端AI玩具





01

联合国大会决定设立AI独立国际科学小组与全球AI治理对话机制




AI万象

资讯配图


联合国大会当地时间26日通过一项决议,决定设立“人工智能独立国际科学小组”和“全球人工智能治理对话”这两项人工智能治理新机制。


联合国秘书长古特雷斯同日通过发言人发表声明,表示联大的此项决议标志着全球在利用人工智能惠益与应对其风险方面的努力迈出重要一步。

“全球人工智能治理对话”机制将在联合国框架内为各国及利益攸关方提供包容性平台,共同探讨当前人类面临的人工智能领域关键议题。

而“人工智能独立国际科学小组”则由40位专家组成,定位为前沿人工智能研究与政策制定之间的重要桥梁。该小组将通过提供严谨独立的科学评估,协助国际社会预判新兴挑战,并就这项变革性技术的治理作出明智决策。

联合国秘书长古特雷斯将于近期启动公开征集人工智能科学小组成员的提名程序。该小组将分别于2026年7月在日内瓦、2027年在纽约举行的全球人工智能治理对话会议上提交年度报告。


新闻拓展:

https://baijiahao.baidu.com/s?id=1841658641102130879&wfr=spider&for=pc




02

国务院印发“人工智能+”行动意见,提出实施六大重点行动




AI万象

资讯配图


8月26日,国务院发布《关于深入实施“人工智能+”行动的意见》(以下简称《意见》)。


《意见》明确提出,到2027年,率先实现人工智能与6大重点领域广泛深度融合,新一代智能终端、智能体等应用普及率超70%,智能经济核心产业规模快速增长,人工智能在公共治理中的作用明显增强,人工智能开放合作体系不断完善。到2030年,我国人工智能全面赋能高质量发展,新一代智能终端、智能体等应用普及率超90%,智能经济成为我国经济发展的重要增长极,推动技术普惠和成果共享。到2035年,我国全面步入智能经济和智能社会发展新阶段,为基本实现社会主义现代化提供有力支撑。

《意见》提出加快实施6大重点行动,包括“人工智能+”科学技术、“人工智能+”产业发展、“人工智能+”消费提质、“人工智能+”民生福祉、“人工智能+”治理能力、“人工智能+”全球合作。

《意见》强调,从8方面强化基础支撑能力,包括提升模型基础能力、加强数据供给创新、强化智能算力统筹、优化应用发展环境、促进开源生态繁荣、加强人才队伍建设、强化政策法规保障、提升安全能力水平。

《意见》表示,推动模型算法、数据资源、基础设施、应用系统等安全能力建设,防范模型的黑箱、幻觉、算法歧视等带来的风险,加强前瞻评估和监测处置,推动人工智能应用合规、透明、可信赖。


新闻拓展:

国务院关于深入实施“人工智能+”行动的意见(附全文+图解+答记者问)




03

时代2025 AI百人榜出炉:任正非、梁文锋、王兴兴、彭军、薛澜等入选




AI万象

资讯配图


当地时间8月28日,美国《时代》杂志发布2025年全球100位最具影响力AI人物。


入选人物包括Cloudflare联合创始人兼首席执行官Matthew Prince、xAI创始人Elon Musk、OpenAI首席执行官Sam Altman、英伟达首席执行官黄仁勋、Meta创始人兼首席执行官Mark Zuckerberg等人外,今年还出现了更多的华人面孔,并且有许多是第一次登上 AI 领域的榜单。

华人入选中,企业家代表亮眼:华为创始人任正非、DeepSeek CEO梁文锋、宇树科技CEO王兴兴、小马智行CEO彭军,分别在大模型、人形机器人、自动驾驶领域深耕突破。学界与行业领袖亦占据重要席位:Meta首席AI官汪滔(Alexandr Wang)助力国际AI协作;清华大学薛澜、斯坦福大学李飞飞,分别在AI伦理研究、计算机视觉与教育普及领域贡献突出。

但真正有趣的不是榜单本身,而是编辑部对今年AI行业的观察:人才争夺已经疯狂到像职业体育。扎克伯格开出九位数的价格挖人,AI研究者被当作NBA全明星一样哄抢。
 
更夸张的是投资规模。当前AI投资可能达到曼哈顿计划的25倍,调整通胀后仍是如此。这是人类史上最大规模的资本部署,决策权却集中在扎克伯格、马斯克、奥特曼、孙正义等少数几个人手里。


新闻拓展:

https://time.com/collections/time100-ai-2025/




04

OpenAI杀入语音模型大战,祭出最强GPT-RealTime,加量还降价




大平台动作

资讯配图


8月29日凌晨,OpenAI发布为开发人员打造的语音转语音模型GPT-RealTime,并同步更新了包括远程MCP服务器支持、图像输入和SIP(通过会话发起协议)电话呼叫支持的API功能。


OpenAI称这是其迄今为止最先进的语音合成模型,GPT-RealTime在遵循复杂指令、精确调用工具以及生成更自然、更具表现力的语音方面有所改进。该模型可以自然朗读重复的字母、数字,无缝切换语言,甚至可以捕捉笑声等非语言信号。

OpenAI还发布了两个新语音Cedar和Marin,它们将在Realtime API中独家提供。

定价方面,通用版Realtime API和新的GPT-RealTime模型从今天起对所有开发者开放,GPT-RealTime每百万token音频输入价格为32美元,缓存输入每百万token为0.4美元,每百万token音频输出价格64美元,GPT-RealTime相比gpt-4o-realtime-preview价格下调20%。

OpenAI增加了对对话上下文的细粒度控制,允许开发者设置智能token限制,并一次截断多个回合,显著降低长会话的成本。

语音模型方面,当下国内外进展都在加速。本月初,国内大模型六小虎之一MiniMax就推出了语音生成模型Speech 2.5,覆盖超40个语种;今年年初,豆包App也更新了实时语音通话功能,免费向用户开放,其可以模仿不同声线,进行情绪感知等;与OpenAI同天,微软推出了首款高度表现力和自然语音生成模型MAI-Voice-1,同一提示词可以生成不同表现的音频。

新闻拓展:

OpenAI杀入语音模型大战!祭出最强GPT-RealTime,加量还降价




05

谷歌正式发布nano-banana图像模型,官方名称:Gemini 2.5 Flash Image




大平台动作

资讯配图


当地时间8月26日,谷歌DeepMind正式推出了其最先进的图像生成与编辑模型Gemini 2.5 Flash Image,代号“纳米香蕉”(nano banana),并已提供预览,数周后将推出稳定版。


该模型在测试中获得“全球评分最高编辑模型”,在角色一致性、精准编辑等方面表现优异。Gemini 2.5 Flash Image定价为每百万输出token 30美元,每张图像消耗约1290 token(约合0.039美元),低于OpenAI同类模型的每百万token 40美元定价。

该模型在图像质量、编辑控制和应用场景上有大幅改进,支持多图合成、多轮次修改与风格迁移等复杂操作。谷歌DeepMind还开发了可定制的模板应用,方便用户体验模型在角色一致性、基于提示的精准图像编辑、融入现实世界知识和多图像融合等方面的能力。

AI图像模型已成为科技巨头的核心竞争领域。OpenAI、Meta和Black Forest Labs等均有相关动作。谷歌希望通过Gemini 2.5 Flash Image缩小与OpenAI的用户差距。目前,ChatGPT的周活跃用户已超7亿人,而Gemini的月活跃用户为4.5亿。

谷歌为Gemini 2.5 Flash Image设置了安全防护机制,禁止生成“未经同意的私密图像”,并为AI生成的图像添加视觉水印及元数据标识,以应对深度伪造图像问题。


新闻拓展:

隐姓埋名的小香蕉,悄悄吊打了所有生图模型。




06

xAI推出智能代码生成模型Grok Code Fast 1,限时免费开放




大平台动作

资讯配图


8月29日,xAI宣布推出最新智能代码生成模型Grok Code Fast 1,将在包括Cursor、GitHub Copilot、Cline、opencode、Windsurf、Roo Code和Kilo Code在内的主流智能编程平台上限时免费开放。


智能代码生成工具是一种依托AI技术的软件应用,可自主完成各类编码相关任务。

据介绍,该模型采用了全新的架构,从头开始构建,其预训练语料包含丰富的编程内容,并在反映真实世界编码任务的数据集上进行了训练后优化。Grok Code Fast 1尤其擅长TypeScript、Python、Java、Rust、C++和 Go语言,能够在最少的监督下处理各种编程任务,从构建新项目到修复漏洞均可胜任。

该模型的定价为每百万输入token 0.20美元,每百万输出token 1.50美元,每百万缓存输入token 0.02美元,对开发者而言是一个经济实惠的选择。

xAI方面表示,该模型的“核心优势在于以经济实惠的精简架构实现强劲性能,使其成为快速、低成本处理常见编码任务的灵活之选”。

目前,OpenAI、微软等AI企业均在重点推进AI代码助手的用户普及工作。今年 5 月,微软在年度Build开发者大会上推出了代码生成工具GitHub Copilot功能。该公司CEO萨提亚・纳德拉曾在4月透露,微软目前20%至30%的代码由AI编写生成。而ChatGPT开发商OpenAI旗下的代码生成工具Codex,则已于6月向ChatGPT Plus订阅用户开放使用。

此外,xAI于本周一已在美国得克萨斯州联邦法院对苹果公司及OpenAI 提起诉讼,指控两家公司非法合谋,意图遏制AI领域的市场竞争。


新闻拓展:

比Claude效果更好、且便宜近 100 倍?xAI祭出“白菜价”AI编码模型掀桌子!网友:便宜没好货




07

英飞凌与英伟达合作,以实现具有精确运动和效率的人形机器人




大平台动作

资讯配图


8月25日,英飞凌科技股份公司(Infineon Technologies)宣布将利用英伟达(NVIDIA)技术加速人形机器人的开发。此次整合将英飞凌在微控制器、传感器和智能执行器方面的专业知识与NVIDIA Jetson Thor系列模块相结合,使原始设备制造商(OEM)和原始设计制造商(ODM)能够为人形机器人打造更高效、更强大且可扩展的电机控制解决方案。


人形机器人正越来越多地应用于制造、物流和医疗保健等各个重要领域,这些领域需要高效可靠的解决方案来实现精确的运动。

英飞凌首席执行官Jochen Hanebeck表示:“凭借从功率半导体、微控制器、传感器到连接技术的广泛产品与解决方案,英飞凌为人形机器人的关键功能模块提供全面支持,使其能够完成感知、运动、行动与连接等任务,同时保障系统的安全性与可靠性。”

英伟达副总裁Deepu Talla也表示:“英飞凌将其丰富的产品与技术带入Jetson Thor生态系统,助力客户打造更高效、强大、可扩展的电机控制系统,从而加快人形机器人产品的上市速度。”

英飞凌推出的PSOC和AURIX微控制器系列具备网络安全机制,能有效防御网络攻击与未授权访问。这些微控制器还提供多核实时处理能力,是构建安全、响应灵敏且具备自适应能力机器人系统的重要基础。此外,通过近期对Marvell汽车以太网业务的收购,英飞凌进一步丰富了产品线——其BRIGHTLANE系列带来高速以太网功能,这也正是人形机器人的核心组成部分。


新闻拓展:

英飞凌携手NVIDIA为人形机器人打造精准运动与高效解决方案




08

IBM联手AMD开发量子超级计算架构




大平台动作

资讯配图


8月26日晚间,IBM与AMD共同宣布,将合作开发基于量子计算机和高性能计算相结合的下一代计算架构,即以量子为中心的超级计算。


目标是结合IBM领先的量子计算与软件技术,以及AMD在CPU、GPU及FPGA领域的人工智能加速器与高性能运算技术,打造一个强大且可扩展的混合运算平台。合作的主要目的是加速生成式人工智能的发展,并弥补双方在该领域面对NVIDIA与Google同盟的相对落后。

IBM董事长兼首席执行官阿温德·克里希纳(Arvind Krishna)表示:“量子计算将模拟自然世界,并以全新的方式呈现信息。通过融合IBM量子计算机与AMD先进的高性能运算技术,我们将建立一个突破传统运算极限的混合模型。”

该架构将采用开源策略,方便全球研究机构和开发者探索量子计算在药物发现、材料设计、供应链优化等复杂问题上的应用。

IBM和AMD计划于今年晚些时候进行首次技术展示,AMD还将支持量子计算的即时运算错误纠正功能,助推IBM实现"本十年内交付容错量子计算机"的愿景。
此外,合作将利用IBM安全的混合云环境,为企业用户提供扩展性强、性能先进的AI解决方案。


新闻拓展:

https://newsroom.ibm.com/2025-08-26-ibm-and-amd-join-forces-to-build-the-future-of-computing




09

美国初创公司推出巨型配送机器人:一次能送10单,3美元送到家




新力量崛起

资讯配图


当地时间8月25日,美国洛杉矶的初创公司Robomart推出了其新型配送机器人RM5,旨在革新按需配送领域,使其在经济上更具可行性。


RM5是一款L4级自动驾驶车辆,外形酷似小型穿梭巴士,载重能力可达500磅(约 226.8 千克)。车内没有为人类司机预留空间,而是设置了10个独立的储物柜,用于存放不同客户的订单,这使得它能够在一次行程中完成多次配送任务。

Robomart计划推出自己的应用程序,让消费者能够浏览来自众多零售商、餐厅和杂货店提供的商品。Robomarts表示,顾客每单只需支付3美元的固定配送费,并承诺“无加价、无服务费、无需给小费”。据Robomart声称,这种模式将使配送成本比人类快递员降低70%,尽管该公司并未详细说明这一数据的计算依据。

Robomart 的联合创始人兼首席技术官Tigran Shahverdyan在公告中表示:“RM5平台的载货量是人行道机器人或无人机的50倍,这使我们能够在每小时服务更多客户,而不会受到传统方法在人力和运力方面的限制。”

客户下单后,Robomart将派遣车辆前往零售商处取货,之后车辆还可以前往其他多家店铺,然后出发进行配送。RM5车辆能够根据订单数量创建动态的多站点路线。到达目的地后,客户使用应用程序解锁为其分配的储物柜并取回订单,过程与人行道配送机器人类似。

Robomart表示,它已与包括Ahold Delhaize、联合利华、玛氏、艾利丹尼森和雅马哈汽车在内的多家零售商建立了合作关系。据TechCrunch报道,自2018年成立以来,该公司已筹集了不到500万美元的资金。

Robomart表示,其正在寻求与当地企业合作,为计划于今年晚些时候在得克萨斯州奥斯汀正式推出服务做准备。


新闻拓展:

https://techcrunch.com/2025/08/25/robomart-unveils-new-delivery-robot-with-3-flat-fee-to-challenge-doordash-uber-eats/




10

AI硬件Haivivi完成2亿元A轮融资,即将发布行业首款端到端AI玩具




投融资风向

资讯配图


8月25日,AI玩具公司跃然创新(Haivivi)宣布完成2亿元A轮系列融资。本轮融资由中金资本旗下基金、红杉中国种子基金、华山资本、愉悦资本领投,招银国际等参投,香港科技大学工学院原院长高秉强创立的Brizan Ventures等老股东加注,质变资本担任独家财务顾问。募集资金将用于公司系列新品的研发、人才梯队建设以及市场渠道拓展。


跃然创新融合创新科技和优质IP,致力于打造一个玩具总动员的世界,让玩具“活”起来。2024年6月,其率先将大模型引入玩具领域,推出全球首款AI玩具BubblePal。该产品支持角色扮演、多语言对话、AI故事共创、长期记忆等一系列功能,并运用最新AI技术,从音色、世界观、性格习性等维度还原了数十个经典IP角色。

目前,Haivivi已获得奥特曼、小猪佩奇、奶龙等知名IP的AI玩具授权,同时在开发自研IP。

8月27日,Haivivi正式推出旗下第二代AI玩具产品——CocoMate系列。新品采用可嵌入玩偶本体且支持拆卸的形态,灵活性得以大幅提升。与此同时,作为全球首款搭载端到端语音模型的AI玩具,CocoMate在交互方面将拥有更丰富表现力,具备更强的拟人化情感能力,并支持多重唤醒、主题卡游戏、聊天室等多种模式。新品首发阵容包括重磅IP奥特曼以及Haivivi首个原创IP“泡泡”。

业内人士指出,随着AI技术的持续迭代与情感消费需求的增长,AI玩具行业正迎来快速发展阶段。未来,伴随市场竞争的加剧,在头部聚拢效应的驱使下,AI玩具行业或趋于收敛。


新闻拓展:

一年 20 万台出货,AI 玩具公司 Haivivi 刚拿了 2 亿新融资,我们和创始人聊了聊



息来源:WAIC综合整理



资讯配图

资讯配图

资讯配图
资讯配图
资讯配图

资讯配图

点击阅读原文查看WAIC 2025精彩!

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
AI赋能电阻焊设备研发与创新!
港股AGI第一股“云知声”首战告捷:大模型贡献1亿收入,单客价直线提升116.2%,AI保险业务暴涨1386.8%
10年前押中英伟达:这位复旦学霸如何用AI Agent重新定义投资
OpenAI 发布 GPT-Realtime API 更新,用于生产级语音代理|附官方实时提示词指南
300万用户靠它谈“AI恋爱”?Janitor AI挤进全球AI应用百强
时代2025 AI百人榜出炉:任正非、梁文锋、王兴兴、彭军、薛澜等入选,华人影响力爆棚
iPhone 17 Air起售价6999元?
AI+“大健康”如何加快融合?华西医院提需求 9家蓉企组团上门“解题”
中小企业AI落地的难题,被联想用一个L3级智能体解决了
对话港科大戴希:AI是运动员,我们是教练,拓扑超导材料是下一步挖掘的重点
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号