Karpathy:强化学习是糟糕但必要的技术!模型靠蒙对答案骗奖励!

具身智能大讲堂 2025-10-27 22:00

加入社群

欢迎加入【具身智能大讲堂】读者讨论群,共同探讨具身智能机器人相关领域话题,共享前沿科技及产业动态。


添加微信号(19016903753)具身智能大讲堂客服 备注“具身茶谈”可进入交流群。


兼职作者&投稿

机器人大讲堂正在招募【兼职内容创作者】,如果您对撰写机器人【科技类】【产业类】文章感兴趣,可添加微信:具身智能大讲堂客服(19016903753,手机与微信号相同)。我们对职业、所在地等没有要求,欢迎朋友们的加入!



声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AR
more
OpenDataArena全面升级版正式上线,四大核心模块重构数据价值评估新格局
Marius Peelen:看与思——基于近期视觉认知神经科学的证据
法律AI明星初创Harvey收购产品演示工具公司Hexus,加速拓展企业法务市场
2026年半导体行业趋势观察(Part 1)- AI成为半导体增长的主要驱动力
Luminar激光雷达业务获更高竞标,MicroVision以3300万美元胜出
拒绝Reward Hacking!港科联合快手可灵提出高效强化学习后训练扩散模型新范式
近两百万人围观的Karpathy年终大语言模型清单,主角是它们
Omdia:到2035年蜂窝物联网(Cellular IoT)连接数将达到59亿
AR眼镜第一案,究竟在争什么?
独家丨ListenHub完成200万美元融资,靠“自来水”做到ARR 300万美元进军北美
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号