返回 职位详情 登录/注册
强化学习运控算法专家
3.5-6.5万元/月
定位 深圳南山区留仙洞[地铁站]
更新 2026-01-14 17:30:22 浏览 980
职位详情
算法工程师 经验不限 强化学习、运控算法、机器人
【岗位职责】

负责四足机器人核心RL运控算法研发,在保证全地形鲁棒性的基础上,实现具备情感表达与个性化风格的步态。
基于IsaacLab/MuJoCo等平台搭建高保真仿真环境,实现大规模域随机化与并行训练。
负责算法从仿真到真机的Sim2Real全流程迁移,确保算法在商用产品上的批量稳定运行。
探索PerceptiveLocomotion,实现复杂环境下的灵活行动与自然交互。
与嵌入式团队配合,将算法部署至边缘计算平台,优化推理延时与算力占用。
【任职要求】

机器人、自动化、计算机、人工智能等相关专业硕士及以上学历。
具备1年以上基于RL的机器人控制算法开发经验(涵盖足式/轮式/双足/机械臂)
具备在知名企业或高校实验室2年以上足式机器人RL运控算法开发经验者,或在ICRA/IROS/CoRL等顶会发表过RLLocomotion相关论文者优先。
深刻理解RL算法原理(PPO,SAC,DDPG等),精通IsaacGym/IsaacLab/MuJoCo中至少一种仿真平台,具备大规模并行训练环境搭建能力。
精通Python与C++,熟练使用PyTorch,能独立完成算法从Python原型到嵌入式C++的工程化迁移。
公司信息
广州市仕博企业管理顾问有限公司
明细
广州市天河区黄埔大道中656号1012室
南沙人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!