腾讯研究院AI速递 20251225

腾讯研究院 2025-12-25 00:01

生成式AI

一、Anthropic在GitHub正式开源了Skills官方知识库

1. Anthropic官方开源Skills项目,包含16个生产级技能库,涵盖文档处理类(docx、pdf、pptx、xlsx)、创意设计类(算法艺术、前端设计)和开发技术类(Web测试、MCP构建);

2. 特别包含skill-creator元技能,可帮助用户创建新技能,极大降低自定义门槛,成为扩展性的关键体现;

3. 该项目展示从创意到企业级的完整谱系,证明Skills系统能处理高度专业化的重复任务,已在GitHub正式发布。

二、Seed Prover 1.5 Agentic 架构,更强数学推理表现

1. 字节跳动Seed团队推出Seed Prover 1.5,通过大规模Agentic RL训练,16.5小时内针对IMO 2025前5题生成完整Lean证明代码,换算成绩35/42达金牌分数线;

2. 模型采用全新Agentic Prover架构,可调用Mathlib搜索工具、Python代码执行和增量式引理验证,像人类一样先用草稿纸推理再调用工具验证;

3. 在Putnam 2025测试中9小时完成12题中的11题,在完整Putnam历史评估集解决88%问题,刷新多个评测集SOTA表现。

三、通义百聆语音交互模型Fun-Audio-Chat-8B开源

1. 通义百聆开源新一代语音交互模型Fun-Audio-Chat-8B,在OpenAudioBench、VoiceBench等多项权威基准测评中斩获SOTA,超过同量级开源模型;

2. 采用创新双分辨率端到端设计,音频帧率降至业界最低5Hz,通过压缩-自回归-解压缩架构节省近50%GPU计算,兼具高效低算力优势;

3. 具备出色共情对话能力,无需情绪标签可自动感知用户情绪,支持角色扮演和量身定制语音情绪、语速、音量等参数。

四、Second Me发布1.1 版本,目标AI原生交流革命

1. Second Me 1.1版本重塑对话框,AI从"被动回复"转向"主动交付",可根据上下文和情绪温度主动推送AI合拍、Rap Battle等社交玩法;

2. 通过独创的身份模型建模,每个人的Second Me可调用真实身份信息和记忆创作内容,用户可让AI替自己向投资人Pitch或面试候选人;

3. 从"社交图谱"升级为"Context图谱",连接介质从标签转向动态分层记忆模型,支持严格的记忆边界划分确保隐私安全。

前沿科技

五、52 分钟订单破千,5 小时登上热搜,Vbot 超能机器狗

1. Vbot超能机器狗发布会全网直播热度超千万,上线仅52分钟订单突破1000台,创万元级具身智能产品达成纪录;

2. 搭载128TOPS端侧AI算力(是主流竞品3倍以上)、自研N45高永磁电机(峰值扭矩24.5Nm),续航5小时,支持240W超级快充,可运行13.3km/h马拉松配速;

3. 9988元创始权益价打破高性能机器狗高价魔咒,构建"本体-空间-Agent"三重闭环,通过无需遥控的真智能定义消费级具身智能新标准。

报告观点

六、Bengio不认同Hinton:即便是「水管工」人类也保不住

1. 图灵奖得主Bengio在最新访谈中表示,认知型工作更易被AI取代,机器人技术虽暂时落后但只是时间问题,即便Hinton建议的"水管工"等体力工作也只是暂时安全;

2. Bengio认为训练AI就像养小老虎,AI不需要比人类聪明一千倍就能制造灾难,呼吁研究人员投资提升AI系统安全性而非继续冒极大风险;

3. 他强调即便只有1%的灾难概率也不可接受,建议孙子努力成为"美好的人"培养同理心和责任感,因为人类的情感连接价值会随技能自动化而提升。

七、谷歌的凡尔赛年度总结,哈萨比斯与Jeff Dean联手执笔

1. 谷歌由Jeff Dean和哈萨比斯牵头完成年度总结,将2025定义为AI Agent、推理和科学发现的一年,Gemini 3 Pro在LMArena排行榜榜首并在多项基准测试创纪录;

2. Gemini 3 Flash质量超越上一代Pro规模模型但价格仅为一小部分且延迟显著降低,延续"下一代Flash优于上一代Pro"的发展趋势;

3. AI在科学领域取得多项突破,AlphaFold已被190多个国家300多万研究者使用,量子计算、能源效率和机器人技术(Gemini Robotics、Genie 3)均有重大进展。

八、Notion CEO年度思考,AI职场人的黄金时代刚刚开始?

1. Notion CEO将AI比作无限心智的时代材料,认为知识经济将像钢铁和蒸汽改变城市一样被AI重塑,从佛罗伦萨升级为东京级别的组织规模;

2. 联合创始人西蒙已成为效能提升30-40倍的工程师,同时指挥3-4个AI编码智能体,证明知识工作者正从蹬自行车升级为开汽车;

3. Notion已有700多个智能体与千名员工协作处理重复性工作,未来组织将跨越数千智能体与人类、跨时区持续运转,以部分可解读性换取规模与速度。

九、Epoch AI年终大盘点来了!AI没有停滞,反而变快了

1. Epoch AI年终报告显示,自2024年4月起AI能力增长速度明显加快比之前快近一倍,推理模型更强和强化学习更受重视是核心原因;

2. TOP10洞察包括:LLM推理价格下降10倍以上、顶级开源模型与顶尖AI差距不到一年、英伟达芯片算力每10个月翻倍、GPT-4和GPT-5都是大飞跃;

3. 报告指出AI最大价值可能来自对经济体系工作的广泛自动化而非加速研发,推理能力增长存在明显边界,2024-2025年能力爆发式提升可能很快放缓。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
AWS Trainium3深度解密(一):性价比利刃,破局AI算力战
【新机】红魔11 Air曝1月发布 主动散热风扇回归
2个印度人,搞出全球第一「AI妖股」!0芯片、狂飙550倍看呆英伟达
200亿美元收购AI芯片公司?英伟达回应
这款硬刚 nano banana 的 AI 生图 Agent,凭什么让数万人每天都用?|AI 上新
ChatGPT推年终回顾;钉钉发全球首个AI智能工作系统;比亚迪11月欧洲销量同比增长235%,特斯拉下降超34%|极客早知道
微软拉响「红色警报」!纳德拉重回一线抓Bug,AI这仗输不起
深势科技完成超 8 亿元融资:AI for Science 如何叩开资本与产业的大门
别只盯着DeepSeek:上海推出“能调三维地图的AI”,政务大模型有了新答案
OpenAI考虑在ChatGPT内投放广告
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号