微信-高级后台开发工程师-大模型训练框架
5-8万元/月
更新 2025-12-21 14:42:30
浏览 350
职位详情
大模型算法
3-5年
训练框架 · 深度学习 · RLHF · SOTA · 底层优化 · gCore
微信-后台开发高级工程师-大模型训练框架方向
工作职责
1.负责微信内部通用大模型训练框架gCore的设计与实现,支撑文本、多模态、文生图/视频等多种业务场景,覆盖预训练、SFT、RLHF等不同训练阶段。通过并行策略设计与算子级优化,保障gCore在各类模型架构下均能实现业界领先的训练效率。
任职资格
1.计算机相关专业本科及以上学历,具备2年以上相关领域开发经验,工程能力扎实;
2.熟练掌握至少一种深度学习训练框架,如PyTorch、TensorFlow、Megatron-LM、DeepSpeed、Transformers等,有框架底层优化或参与开源项目经历者优先;
3.具备良好的沟通协作能力,工作积极主动,乐于面对技术挑战。
工作职责
1.负责微信内部通用大模型训练框架gCore的设计与实现,支撑文本、多模态、文生图/视频等多种业务场景,覆盖预训练、SFT、RLHF等不同训练阶段。通过并行策略设计与算子级优化,保障gCore在各类模型架构下均能实现业界领先的训练效率。
任职资格
1.计算机相关专业本科及以上学历,具备2年以上相关领域开发经验,工程能力扎实;
2.熟练掌握至少一种深度学习训练框架,如PyTorch、TensorFlow、Megatron-LM、DeepSpeed、Transformers等,有框架底层优化或参与开源项目经历者优先;
3.具备良好的沟通协作能力,工作积极主动,乐于面对技术挑战。
相似职位
很抱歉,暂无相似职位!