小米招聘多模态理解与空间感知等岗位(社招&校招生&科研实习生)

3D视觉工坊 2025-09-03 07:00

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

工作研究内容

  1. 多模态大模型研究与设计:负责设计和实现领先的具身多模态大模型,并探索其在自动驾驶和通用机器人领域的统一应用潜力。
  2. 多模态理解与空间感知:多模态场景理解:融合视觉、语言、雷达等多源信息,实现对动态、开放环境的深刻理解和空间感知。
  3. 语义推理与决策优化:让模型能够理解模糊、抽象的人类指令,并结合对物理世界的空间推理,生成安全、合理、可解释的行动序列。
  4. 强化学习与模仿学习:深入研究强化学习(RL)、模仿学习(IL) 及自监督学习方法,使模型能从海量数据和与环境的交互中持续学习和进化。
  5. 发表顶级论文:在CVPR、ICCV、ECCV、ICML、NeurIPS、ICLR、CoRL等顶级会议上发表高水平论文。

职位要求

候选人需在以下一个或多个领域具备深入的研究和实践经验:

  1. 编程与算法能力:精通Python,熟练使用至少一种主流深度学习框架(优先考虑PyTorch)。具备强大的算法设计与实现能力,能够处理大规模数据并高效进行模型训练。
  2. 多模态大模型:深入理解视觉语言模型(VLM)和视觉-语言-行动模型(VLA),具备从零到一构建或优化这些模型的实践经验。
  3. 具身智能与自动驾驶:优先考虑有复现具身智能和自动驾驶相关视觉语言模型(VLM)和视觉语言架构(VLA)经验的候选人。
  4. 科研能力:作为主要作者在CVPR、ICCV、ECCV、ICML、NeurIPS、ICLR、CoRL等顶级会议上发表过高质量论文,或在相关领域的权威竞赛中取得优异成绩。对科研有热情,励志做有影响力的工作优先。

简历投递

邮箱:xiaomivla2025@gmail.com

资讯配图

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
小米
more
宝马设计主管加盟小米?看完作品我替雷军捏把汗!
华为MatePad Mini发布;尊界S800星空顶涨价3万;前兰博基尼设计师加入小米汽车...
小米工程机意外曝光,米粉彻底看哭了!
小米SU7 Ultra:防撞梁什么样?
突发,前兰博基尼外饰设计师加入小米汽车!
劲爆!奔驰新车24小时比小鹏P7/小米YU7多跑1500公里!
曝国内小米汽车营收已反超小米手机,副业快干成主业了
25年第35周新势力销量排名,零跑汽车第一,小米第二,理想第三,小鹏蔚来其后
科技快讯 | 消息称 DeepSeek 正开发更先进模型;前兰博基尼设计师 Fabian Schmölz 正式加入小米汽车...
最新议程公布!新增20+品牌终端!吉利、长安、华为机器、小米、OPPO、vivo、迈瑞参加丨2025第十五届世界CMF大会
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号