大模型技术专家
3.5-6.5万元/月

更新 2025-10-14 11:35:32
浏览 939
职位详情
大模型算法
5-10年
岗位职责:
1.技术方向引领与规划:
深入洞察大模型技术发展动态(涵盖架构设计、训练方法、对齐策略、推理优化、多模态融合、智能体构建等),结合企业战略目标,制定1-3年核心技术演进路径。
识别并牵头推进具备前瞻性和突破潜力的技术研究方向(如高效新型网络结构、超长上下文建模能力提升、精细化对齐算法、垂直行业大模型定制化方案等)。
主导公司大模型技术体系的关键技术选型与决策工作,包括开源基座模型评估、训练框架选择、推理引擎适配及应用开发平台搭建。
2.核心算法研发与创新:
牵头开展大模型核心模块的自主研发与性能优化,重点覆盖新型注意力机制设计、高效参数微调方法、模型轻量化压缩、鲁棒性对齐算法、知识增强注入技术等领域。
设计并实施先进的大规模分布式训练策略,有效应对训练过程中的效率瓶颈、收敛不稳定等挑战。
探索大模型在特定专业领域(如程序代码生成、科学模拟计算、金融数据分析、生物医药研究等)的应用场景与关键技术突破路径。
负责建立和完善大模型评估体系,持续优化评测基准,确保模型在性能表现、安全性保障、公平性控制等方面达到高标准要求。
3.技术难题攻关与落地:
主导攻克大模型研发和应用中的关键核心技术难题,包括千亿参数级模型训练效率优化、超长文本理解与生成能力提升、复杂逻辑推理能力强化、输出可控性增强以及安全伦理风险防范机制建设。
设计高可用、低延迟、可扩展的大模型推理服务架构,提出系统性优化方案以显著降低部署成本并提升响应性能。
推动前沿研究成果向实际产品与解决方案转化,实现技术成果在真实业务场景中的高效赋能与价值闭环。
4.团队建设与技术影响力:
作为核心技术带头人,指导中高级研发人员成长,持续提升团队整体技术水平与创新能力。
建立规范的技术交流与评审机制,促进知识沉淀与协同创新氛围形成。
代表公司参与高水平行业技术会议与社区活动,发表具有影响力的技术成果或报告,增强公司在人工智能领域的技术声誉。积极吸收并引入外部先进理念与技术实践。
岗位要求:
1.教育背景:计算机科学、人工智能、机器学习、数学、统计学或相关专业博士学位;或硕士学历并在业界取得突出成就者亦可考虑。
2.工作经验:
必需:具备7年以上机器学习或深度学习领域研发经历,其中至少2年专注于大型语言模型或同类大规模生成式模型的核心算法开发。
必需:拥有独立主导并成功交付复杂大模型项目的经验,涵盖技术路线规划、架构设计到最终落地的完整流程。
必需:具备将大模型技术应用于实际业务场景的项目管理与实施经验。
3.核心素质与能力:
具备扎实的独立科研能力,能够自主定义问题、设计实验、分析数据并得出有效结论。
拥有出色的复杂问题分析与解决能力,善于提出创新性技术方案并推动落地执行。
具备良好的技术领导力,能清晰传递技术愿景,带领团队达成技术目标。
保持高度的技术敏感性与前瞻性,持续关注领域最新进展,准确判断技术发展方向与应用潜力。
具备优秀的跨层级沟通能力,能够向技术人员、管理层及非技术相关人员清晰传达复杂技术内容及其商业价值。
以结果为导向,致力于通过技术创新驱动实际业务增长与效能提升。
4.优先条件:具有高级职称者优先,985高校博士学历者优先
1.技术方向引领与规划:
深入洞察大模型技术发展动态(涵盖架构设计、训练方法、对齐策略、推理优化、多模态融合、智能体构建等),结合企业战略目标,制定1-3年核心技术演进路径。
识别并牵头推进具备前瞻性和突破潜力的技术研究方向(如高效新型网络结构、超长上下文建模能力提升、精细化对齐算法、垂直行业大模型定制化方案等)。
主导公司大模型技术体系的关键技术选型与决策工作,包括开源基座模型评估、训练框架选择、推理引擎适配及应用开发平台搭建。
2.核心算法研发与创新:
牵头开展大模型核心模块的自主研发与性能优化,重点覆盖新型注意力机制设计、高效参数微调方法、模型轻量化压缩、鲁棒性对齐算法、知识增强注入技术等领域。
设计并实施先进的大规模分布式训练策略,有效应对训练过程中的效率瓶颈、收敛不稳定等挑战。
探索大模型在特定专业领域(如程序代码生成、科学模拟计算、金融数据分析、生物医药研究等)的应用场景与关键技术突破路径。
负责建立和完善大模型评估体系,持续优化评测基准,确保模型在性能表现、安全性保障、公平性控制等方面达到高标准要求。
3.技术难题攻关与落地:
主导攻克大模型研发和应用中的关键核心技术难题,包括千亿参数级模型训练效率优化、超长文本理解与生成能力提升、复杂逻辑推理能力强化、输出可控性增强以及安全伦理风险防范机制建设。
设计高可用、低延迟、可扩展的大模型推理服务架构,提出系统性优化方案以显著降低部署成本并提升响应性能。
推动前沿研究成果向实际产品与解决方案转化,实现技术成果在真实业务场景中的高效赋能与价值闭环。
4.团队建设与技术影响力:
作为核心技术带头人,指导中高级研发人员成长,持续提升团队整体技术水平与创新能力。
建立规范的技术交流与评审机制,促进知识沉淀与协同创新氛围形成。
代表公司参与高水平行业技术会议与社区活动,发表具有影响力的技术成果或报告,增强公司在人工智能领域的技术声誉。积极吸收并引入外部先进理念与技术实践。
岗位要求:
1.教育背景:计算机科学、人工智能、机器学习、数学、统计学或相关专业博士学位;或硕士学历并在业界取得突出成就者亦可考虑。
2.工作经验:
必需:具备7年以上机器学习或深度学习领域研发经历,其中至少2年专注于大型语言模型或同类大规模生成式模型的核心算法开发。
必需:拥有独立主导并成功交付复杂大模型项目的经验,涵盖技术路线规划、架构设计到最终落地的完整流程。
必需:具备将大模型技术应用于实际业务场景的项目管理与实施经验。
3.核心素质与能力:
具备扎实的独立科研能力,能够自主定义问题、设计实验、分析数据并得出有效结论。
拥有出色的复杂问题分析与解决能力,善于提出创新性技术方案并推动落地执行。
具备良好的技术领导力,能清晰传递技术愿景,带领团队达成技术目标。
保持高度的技术敏感性与前瞻性,持续关注领域最新进展,准确判断技术发展方向与应用潜力。
具备优秀的跨层级沟通能力,能够向技术人员、管理层及非技术相关人员清晰传达复杂技术内容及其商业价值。
以结果为导向,致力于通过技术创新驱动实际业务增长与效能提升。
4.优先条件:具有高级职称者优先,985高校博士学历者优先
相似职位