腾讯研究院AI速递 20260624

腾讯研究院 2026-06-24 00:05

生成式AI

一、OpenAI发布GPT-5.5-Cyber完整版,对标Mythos 5

1.OpenAI扩展Daybreak安全计划,推出GPT-5.5-Cyber完整版,在CyberGym上取得85.6%成绩,超过GPT-5.5与Anthropic Mythos 5;

2.同步更新Codex Security插件,已扫描超3000万次提交、覆盖3万多个代码库,并联合Trail of Bits发起Patch the Planet助开源项目修补漏洞;

3.推出Daybreak Cyber Partner Program,让安全伙伴在产品中接入带Trusted Access的GPT-5.5,把防御能力扩展到更多组织。

二、字节发布豆包大模型2.1,视频图像音频模型同步上新

1.字节火山引擎Force大会发布豆包2.1,含Pro与Turbo两型号,在Agent、Coding、VLM场景全面提升,对标GPT 5.5和 Opus 4.7;

2.视频模型Seedance 2.0升级支持原生4K,Seedance 2.5单段视频最长30秒、支持50个全模态参考素材,预计7月初上线;

3.图像模型Seedream 5.0 Pro支持14种语言文字生成与多图层分离,音频模型1.0可端到端生成影视级成品音频。

三、QQ邮箱推出Agently Mail,为AI智能体配专属邮箱

1.QQ邮箱推出专为Agent设计的Agently Mail,与个人邮箱数据完全隔离,让AI用独立身份收发邮件,安全可控可追溯,现已开启内测;

2.已支持Claude Code、Codex、Cursor、豆包超能模式、Kimi Work等主流Agent,可自主注册第三方平台、接收验证码、完成A2A自动对接;

3.适用于发票、订阅、求职、订单等重复规则化邮件场景,开通需实名认证,让AI独立跑通邮件流程。

四、百川发布医疗大模型M4,登顶HealthBench等榜单

1.百川智能与清华联合发布Baichuan-M4,在HealthBench及Hard、Professional三榜同列世界第一,综合68.6分领先GPT-5.5超10分,幻觉率低至3.3%;

2.模型主打深度问诊、全病程记忆、证据锚定、Agent调度四项能力,能像医生一样主动追问,长上下文临床记忆评测达86.9分;

3.首创证据锚定让每句结论精确对应原始论文段落,循证引用精度达90.0,远超GPT-5.5的54.7。

五、京东开源JoyAI-VL流式交互模型,监控胜率达100%

1.京东开源JoyAI-VL-Interaction,把视频AI从问答式轮次对话推进到持续在场、主动开口的流式交互,并获vLLM-Omni的day-0原生支持;

2.具备自主交互、实时响应、任务委派三大能力,靠AdaCodec与分层缓存把延迟压至亚秒级,世界杯红牌提醒平均延迟94毫秒;

3.在六类真实场景人类评测中,对豆包、Gemini整体胜率达77.6%与87.9%,监控预警项以8B小模型打出100%胜率。

前沿科技

六、英伟达发布Halos机器人安全系统,打造具身版安卓

1.英伟达在Automate 2026大会发布Halos for Robotics,覆盖芯片、传感器、操作系统到安全认证的全栈机器人安全系统,核心框架开源开放;

2.系统分平台安全、安全操作系统、算法安全、生态安全四层,迁移了自动驾驶逾18600工程人年积累与700万行验证代码;

3.波士顿动力、Agility、禾赛科技等43家以上公司加入生态,Agility已将Halos整合进Digit机器人在多家工厂上岗。

七、法拉第未来发布Faber轮臂机器人,公布工业生态

1.FF在Automate展发布美国首个工业级可交付EAI轮臂机器人Faber,含U、T、S三款,融合机械臂高精度、AMR移动与人形双臂协同能力;

2.全新Futurist定价89900美元,是全美首个原生支持NVIDIA Sonic全身运控的全尺寸人形机器人,含价值1万美元增强技能包;

3.FF集齐三大形态六大系列产品,6月出货预计超100台,并首次披露工业生态战略,约半年后举办正式发布会。

八、清华提出统一气候模态预测模型UniCM,登Nature子刊

1.清华李勇团队在Nature Machine Intelligence发表UniCM,首次从全球耦合系统视角统一学习七类海洋大气气候模态的动力学关系;

2.模型采用Globalformer与Modeformer双分支双向耦合,将ENSO有效预测提前期延长至19个月,超此前先进模型的15至16个月;

3.非ENSO模态平均预测技巧提升超22%,并能还原NPMM领先ENSO约4个月等物理联系,让AI从预测器变为科学发现工具。

报告观点

九、Ruff作者警示,AI生成PR正在冲击开源社区契约

1.Astral创始人查理·马什坦言现已很少手写代码全靠Agent,却被同事指出其AI生成PR需更费力审查,反映人类审核成本并未下降;

2.AI让提交PR门槛降到零,但优秀贡献者从反馈中成长的契约被打破,自动重写代码则是在拿已知Bug去赌未知崩溃;

3.他指出成为优秀工程师比以往更有用,AI的微优化可能掩盖原本能快100倍的系统设计,全自动测试是对抗糊代码的关键。

👇加入AGI数据库,AI智能问答 

腾讯研究院AI速递 20260624图1

👇订阅下方合集,获取每日推送

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
AI分身时代,你的“在场”正在被重新定价
全域AI入场券开抢:谁会定义下半场,谁将陪跑?
腾讯研究院AI速递 20260624
实测微信 AI 助手“小微”,查账、分析朋友圈...12 个场景看懂它的能力和边界
57场面试杀进OpenAI!华人博士开源「AI面经」,含泪推荐
Home Assistant 闹了个 AI 乌龙,但智能家居真要变天了
从智算中心到Token工厂:RISMA智算云平台重构AI算力生产体系
尴尬了!OpenAI刚派GPT-5.5-Cyber修补地球,Codex却爆出致命bug
狐讯 | 宇树科技与 GMO AIR 达成合作;三星电子官方公众号注销
战胜Mythos 5,OpenAI安全专用GPT-5.5-Cyber完全体来了
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号