大模型算法工程师
2.5-5万元/月
更新 2025-10-27 14:20:37
浏览 763
职位详情
大模型算法
1-3年
推理加速,模型压缩
职位描述:
研发大模型(LLM、多模态等)的纯算法级压缩技术,涵盖量化算法、稀疏化算法、轻量级架构设计、知识蒸馏、低秩分解等方向
负责大模型(LLM、多模态等)推理过程中的性能优化与加速,涉及动态批处理(DynamicBatching)、KVCache优化、SpeculativeDecoding等关键技术
设计压缩与微调协同优化的联合算法,提升压缩后模型的精度恢复能力
持续跟进学术前沿进展,推动先进算法在实际业务场景中的创新性应用落地
实现大模型压缩与推理加速算法的工程化部署及业务集成
任职要求:
机器学习、数学、计算机等相关专业博士学历,具备3年以上模型压缩或轻量化研究经验
深入掌握主流压缩算法(如量化、稀疏化、蒸馏)的理论基础与代码实现
深入掌握主流推理加速算法(如SpeculativeDecoding、VLLM)的原理与实践
熟练运用Python,具有良好的算法模块化开发与封装能力
在人工智能领域顶级会议(如NeurIPS、ICML、ICLR、AAAI)发表过论文者优先
研发大模型(LLM、多模态等)的纯算法级压缩技术,涵盖量化算法、稀疏化算法、轻量级架构设计、知识蒸馏、低秩分解等方向
负责大模型(LLM、多模态等)推理过程中的性能优化与加速,涉及动态批处理(DynamicBatching)、KVCache优化、SpeculativeDecoding等关键技术
设计压缩与微调协同优化的联合算法,提升压缩后模型的精度恢复能力
持续跟进学术前沿进展,推动先进算法在实际业务场景中的创新性应用落地
实现大模型压缩与推理加速算法的工程化部署及业务集成
任职要求:
机器学习、数学、计算机等相关专业博士学历,具备3年以上模型压缩或轻量化研究经验
深入掌握主流压缩算法(如量化、稀疏化、蒸馏)的理论基础与代码实现
深入掌握主流推理加速算法(如SpeculativeDecoding、VLLM)的原理与实践
熟练运用Python,具有良好的算法模块化开发与封装能力
在人工智能领域顶级会议(如NeurIPS、ICML、ICLR、AAAI)发表过论文者优先
相似职位