机器人强化学习工程师，接受应届生招聘_四川晨奇人力资源服务有限公司-南沙人才网

机器人强化学习工程师，接受应届生

2-4万元/月

成都双流区高新创智广场

更新 2025-12-15 15:40:24 浏览 947

职位详情

机器学习经验不限 C/C++ · Python 强化学习算法工程化经验

岗位职责
•负责具身智能中强化学习核心算法的设计、开发与优化，重点聚焦真机强化学习、带力控的强化学习场景，熟练应用PPO、SAC等主流强化学习算法，助力算法在真实机器人场景中稳定落地。
•负责强化学习算法落地开发（包含reward设计、策略训练、超参调优与性能边界评估），攻克真机训练稳定性、强化学习迭代效率和成功率提高等关键技术难题，确保机器人在相关任务中动作精准、鲁棒。
•负责基于IsaacSim等仿真平台的强化学习仿真环境搭建。
•负责推动强化学习算法从仿真环境到真实物理环境（sim2real）的高效迁移落地。
•基于ROS（RobotOperatingSystem）完成强化学习算法与机器人硬件（含力控模块）的集成部署，搭建真机强化学习测试环境，与团队协同排查算法与软硬件交互过程中的问题。
•利用PyTorch/TensorFlow等深度学习框架构建、训练和评估强化学习模型，处理算法所需的多源传感器数据（视觉、力觉、触觉等），优化数据预处理流程，提升模型在真机力控场景下的泛化能力与鲁棒性。
•参与强化学习实验方案设计与执行，重点针对真机训练、力控交互等场景制定测试计划，记录实验数据，分析训练效果与力控性能，撰写技术文档，推动算法迭代优化。
岗位要求
1.学历背景：本科及以上学历，计算机/自动化/机器人工程/电子信息工程/人工智能/控制工程等相关专业，研究生优先；
2.核心经验：具备真实机器人强化学习开发经验（如参与过真机强化学习项目、带力控模块的机器人强化学习开发、协作型工业机械臂/人形机器人强化学习真机部署调试等），熟悉机器人硬件结构，有过强化学习算法在实体机器人（含力控组件）上落地及sim2real（仿真到真机迁移）技术攻关或落地经历者优先。
3.算法能力：
(1)精通强化学习核心原理与主流算法（PPO、SAC、DDPG、TD3、TRPO），深入理解sim2real关键技术（如域适应、动力学建模校准、仿真环境建模优化等）；
(2)掌握强化学习奖励函数设计、优化；
(3)掌握机器人运动学、动力学基础，能独立完成和机器人学相关的强化学习子模块的开发与调试。

公司信息

四川晨奇人力资源服务有限公司

南沙人才网温馨提示

求职过程请勿缴纳费用，谨防诈骗！若信息不实请举报。

相似职位

很抱歉,暂无相似职位！