返回 职位详情 登录/注册
机器人强化学习工程师,接受应届生
2-4万元/月
定位 成都双流区高新创智广场
更新 2025-12-15 15:40:24 浏览 947
职位详情
机器学习 经验不限 C/C++ · Python 强化学习 算法工程化经验
岗位职责
•负责具身智能中强化学习核心算法的设计、开发与优化,重点聚焦真机强化学习、带力控的强化学习场景,熟练应用PPO、SAC等主流强化学习算法,助力算法在真实机器人场景中稳定落地。
•负责强化学习算法落地开发(包含reward设计、策略训练、超参调优与性能边界评估),攻克真机训练稳定性、强化学习迭代效率和成功率提高等关键技术难题,确保机器人在相关任务中动作精准、鲁棒。
•负责基于IsaacSim等仿真平台的强化学习仿真环境搭建。
•负责推动强化学习算法从仿真环境到真实物理环境(sim2real)的高效迁移落地。
•基于ROS(RobotOperatingSystem)完成强化学习算法与机器人硬件(含力控模块)的集成部署,搭建真机强化学习测试环境,与团队协同排查算法与软硬件交互过程中的问题。
•利用PyTorch/TensorFlow等深度学习框架构建、训练和评估强化学习模型,处理算法所需的多源传感器数据(视觉、力觉、触觉等),优化数据预处理流程,提升模型在真机力控场景下的泛化能力与鲁棒性。
•参与强化学习实验方案设计与执行,重点针对真机训练、力控交互等场景制定测试计划,记录实验数据,分析训练效果与力控性能,撰写技术文档,推动算法迭代优化。
岗位要求
1.学历背景:本科及以上学历,计算机/自动化/机器人工程/电子信息工程/人工智能/控制工程等相关专业,研究生优先;
2.核心经验:具备真实机器人强化学习开发经验(如参与过真机强化学习项目、带力控模块的机器人强化学习开发、协作型工业机械臂/人形机器人强化学习真机部署调试等),熟悉机器人硬件结构,有过强化学习算法在实体机器人(含力控组件)上落地及sim2real(仿真到真机迁移)技术攻关或落地经历者优先。
3.算法能力:
(1)精通强化学习核心原理与主流算法(PPO、SAC、DDPG、TD3、TRPO),深入理解sim2real关键技术(如域适应、动力学建模校准、仿真环境建模优化等);
(2)掌握强化学习奖励函数设计、优化;
(3)掌握机器人运动学、动力学基础,能独立完成和机器人学相关的强化学习子模块的开发与调试。
公司信息
四川晨奇人力资源服务有限公司
明细
南沙人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!