强化学习运控算法专家招聘_广州市仕博企业管理顾问有限公司-南沙人才网

强化学习运控算法专家

3.5-6.5万元/月

深圳南山区留仙洞[地铁站]

更新 2026-01-14 17:30:22 浏览 980

职位详情

算法工程师经验不限强化学习、运控算法、机器人

【岗位职责】

负责四足机器人核心RL运控算法研发，在保证全地形鲁棒性的基础上，实现具备情感表达与个性化风格的步态。
基于IsaacLab/MuJoCo等平台搭建高保真仿真环境，实现大规模域随机化与并行训练。
负责算法从仿真到真机的Sim2Real全流程迁移，确保算法在商用产品上的批量稳定运行。
探索PerceptiveLocomotion，实现复杂环境下的灵活行动与自然交互。
与嵌入式团队配合，将算法部署至边缘计算平台，优化推理延时与算力占用。
【任职要求】

机器人、自动化、计算机、人工智能等相关专业硕士及以上学历。
具备1年以上基于RL的机器人控制算法开发经验（涵盖足式/轮式/双足/机械臂）
具备在知名企业或高校实验室2年以上足式机器人RL运控算法开发经验者，或在ICRA/IROS/CoRL等顶会发表过RLLocomotion相关论文者优先。
深刻理解RL算法原理（PPO,SAC,DDPG等），精通IsaacGym/IsaacLab/MuJoCo中至少一种仿真平台，具备大规模并行训练环境搭建能力。
精通Python与C++，熟练使用PyTorch，能独立完成算法从Python原型到嵌入式C++的工程化迁移。

公司信息

广州市仕博企业管理顾问有限公司

广州市天河区黄埔大道中656号1012室

南沙人才网温馨提示

求职过程请勿缴纳费用，谨防诈骗！若信息不实请举报。

相似职位

很抱歉,暂无相似职位！