大模型算法研发工程师
1.1-2万元/月
更新 2025-12-18 14:16:18
浏览 165
职位详情
大模型算法
3-5年
LangChain、 · RAG、Al Agent · NLP AI智能体 · PyTorch · TensorFlow/JAX · 深度学习 分布式训练 · Transformer
大模型工程师
岗位职责:
1、结合业务场景需求,基于LangChain、RAG及AIAgent技术,设计并持续优化模型架构,提升整体性能表现;
2、主导AI智能体及其应用产品的架构设计与系统构建,实现面向大模型的智能体技术体系,支持高效智能体开发;
3、承担NLP模型的训练、参数调优、效果验证与上线部署工作,保障模型在实际应用中的稳定与高效;
4、开展基于大语言模型的prompt工程优化、DSL语言设计、RAG检索排序策略改进,强化任务规划与工具调用能力,打造目标导向的智能体解决方案;
5、聚焦LLM推理过程的性能优化,提升大模型运行效率与输出结果的可用性;
【任职条件】
1、本科及以上学历,计算机科学、人工智能、电子工程、数学等相关专业背景,具备3年以上相关领域工作经验。
2、熟练掌握PyTorch,了解TensorFlow/JAX等主流框架;精通Python编程,熟悉至少一种深度学习平台;
深入理解Transformer结构与大语言模型核心技术(包括注意力机制、位置编码、激活函数等);
具备大规模分布式训练项目经验(如FSDP、DeepSpeed、Megatron-LM),掌握数据并行、模型并行、流水线并行等关键技术方案。
岗位职责:
1、结合业务场景需求,基于LangChain、RAG及AIAgent技术,设计并持续优化模型架构,提升整体性能表现;
2、主导AI智能体及其应用产品的架构设计与系统构建,实现面向大模型的智能体技术体系,支持高效智能体开发;
3、承担NLP模型的训练、参数调优、效果验证与上线部署工作,保障模型在实际应用中的稳定与高效;
4、开展基于大语言模型的prompt工程优化、DSL语言设计、RAG检索排序策略改进,强化任务规划与工具调用能力,打造目标导向的智能体解决方案;
5、聚焦LLM推理过程的性能优化,提升大模型运行效率与输出结果的可用性;
【任职条件】
1、本科及以上学历,计算机科学、人工智能、电子工程、数学等相关专业背景,具备3年以上相关领域工作经验。
2、熟练掌握PyTorch,了解TensorFlow/JAX等主流框架;精通Python编程,熟悉至少一种深度学习平台;
深入理解Transformer结构与大语言模型核心技术(包括注意力机制、位置编码、激活函数等);
具备大规模分布式训练项目经验(如FSDP、DeepSpeed、Megatron-LM),掌握数据并行、模型并行、流水线并行等关键技术方案。
相似职位
很抱歉,暂无相似职位!