阿里云智能-工程开发岗位-多base地可
4-7万元/月
更新 2025-12-21 14:41:13
浏览 870
职位详情
Java
经验不限
Golang · Java · C++ · 分布式经验 · 资源管理调度 · AI工程 · 大模型训推 · SpringCloud · Hadoop · Kafka · AI智算 · 大数据经验 · 微服务经验 · 云计算经验 · Spark · 架构设计经验
岗位base地可选:北京、上海、杭州、深圳、西安、成都
岗位方向:大数据工程方向(管控平台、引擎都可以)、大模型训推加速平台、存储、AI智算工程(GPU异构集群管理)、网络研发、云原生开发(中间件、微服务、API网关、运维可观测等)、运维自动化开发、数据库研发(管控和引擎)、云管平台、安全服务后端研发等
岗位职责:
1、技术方案设计
•收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果
•基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等
2、技术实现
•基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现
•负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等
•对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署
•对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等
3、稳定性和性能优化
•制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠
•运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能
4、技术预研
•跟踪和了解最新的产品技术和趋势,根据业务需要提供最新的技术支持和建议。
5、技术规划
•理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。
任职要求:
•5年以上IT、互联网、云计算开发相关工作经验
•2年及以上IaaS,PaaS,运维监控,灾备,智算等相关产品/技术的开发经验
•精通工作中使用的技术栈,在设计、架构、并发、分布式、数据等一个或多个技术领域达到专家水平,能够识别并准确解决问题
•具备从业务需求、研发、管理、测试、部署、运维全链路的流程和水位有清晰的认证和持续改进能力
•能主导核心业务或技术系统架构设计和实际编码,通过对代码的codereview、设计评审、单测覆盖,确保功能的交付质量和鲁棒性,有较强的问题分析和问题解决能力,是关键问题和疑难工单的终结者
•在稳定性、资损、安全等方面能够进行系统性保障,并持续跟进进展,有效预判并防范风险
•对所负责的领域能够作为owner,充分理解自己团队在生产关系大图中的定位,与业务和协作团队关系,形成良好协作,及时解决职责/认知冲突类问题并驱动合理方案落地;
•具备较高复杂度项目的管理能力
•熟悉技术领域相关的前沿信息渠道,定期形成相关的前沿研究文档沉淀并能在团队中进行技术分享
•熟悉竞对和对标产品的核心技术指标、优劣势对比,对我们如何追赶和保持优势有一定的理解
•通过POC、产品经理、PDSA等内外部渠道理解客户诉求,并能结合自己的技术理解形成有价值的洞见
•能够独立的进行模块、子系统或子领域的复杂度治理工作和跨1-2个技术栈的方案设计工作
•具备较好的架构设计能力,对涉及多个系统,有能力产出合理的上下游全链路技术方案/架构,并结合业务预判规划好模块架构1年内的演进
•在架构设计中能够梳理明确模块的增删改,并据此分解开发工作项和相互依赖,考虑技术投入产出比(ROI)、性能优化
•单产品研发安全生产执行者
•能够在单产品/中型复杂系统层面推动建立完善的研发安全生产体系,并推动落地,保障相关产品/技术/系统的可容灾、可观测、可处置、可运维、可快恢
•熟练掌握业内主流的研发安全生产技术体系
•具有产品级、中型复杂系统的研发安全生产经验,能够应对比较复杂的项目环境和各类突发状况,保障研发项目的平稳落地
•具备参与研发安全演练的技术能力,是容灾演练、红蓝对抗、突袭演练等场景下的一线主力
•对自己负责的研发模块具备快速上线、响应、应急处理能力
•熟悉系统使用场景,不同行业、客户、应用对系统的需求差异性,理解使用场景的痛点、难点。
•能与业务一起拆解流程场景、需求优先级,对标市场领先实践等
备注:持有阿里云ACA/ACP/ACE认证证书者优先
岗位方向:大数据工程方向(管控平台、引擎都可以)、大模型训推加速平台、存储、AI智算工程(GPU异构集群管理)、网络研发、云原生开发(中间件、微服务、API网关、运维可观测等)、运维自动化开发、数据库研发(管控和引擎)、云管平台、安全服务后端研发等
岗位职责:
1、技术方案设计
•收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果
•基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等
2、技术实现
•基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现
•负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等
•对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署
•对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等
3、稳定性和性能优化
•制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠
•运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能
4、技术预研
•跟踪和了解最新的产品技术和趋势,根据业务需要提供最新的技术支持和建议。
5、技术规划
•理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。
任职要求:
•5年以上IT、互联网、云计算开发相关工作经验
•2年及以上IaaS,PaaS,运维监控,灾备,智算等相关产品/技术的开发经验
•精通工作中使用的技术栈,在设计、架构、并发、分布式、数据等一个或多个技术领域达到专家水平,能够识别并准确解决问题
•具备从业务需求、研发、管理、测试、部署、运维全链路的流程和水位有清晰的认证和持续改进能力
•能主导核心业务或技术系统架构设计和实际编码,通过对代码的codereview、设计评审、单测覆盖,确保功能的交付质量和鲁棒性,有较强的问题分析和问题解决能力,是关键问题和疑难工单的终结者
•在稳定性、资损、安全等方面能够进行系统性保障,并持续跟进进展,有效预判并防范风险
•对所负责的领域能够作为owner,充分理解自己团队在生产关系大图中的定位,与业务和协作团队关系,形成良好协作,及时解决职责/认知冲突类问题并驱动合理方案落地;
•具备较高复杂度项目的管理能力
•熟悉技术领域相关的前沿信息渠道,定期形成相关的前沿研究文档沉淀并能在团队中进行技术分享
•熟悉竞对和对标产品的核心技术指标、优劣势对比,对我们如何追赶和保持优势有一定的理解
•通过POC、产品经理、PDSA等内外部渠道理解客户诉求,并能结合自己的技术理解形成有价值的洞见
•能够独立的进行模块、子系统或子领域的复杂度治理工作和跨1-2个技术栈的方案设计工作
•具备较好的架构设计能力,对涉及多个系统,有能力产出合理的上下游全链路技术方案/架构,并结合业务预判规划好模块架构1年内的演进
•在架构设计中能够梳理明确模块的增删改,并据此分解开发工作项和相互依赖,考虑技术投入产出比(ROI)、性能优化
•单产品研发安全生产执行者
•能够在单产品/中型复杂系统层面推动建立完善的研发安全生产体系,并推动落地,保障相关产品/技术/系统的可容灾、可观测、可处置、可运维、可快恢
•熟练掌握业内主流的研发安全生产技术体系
•具有产品级、中型复杂系统的研发安全生产经验,能够应对比较复杂的项目环境和各类突发状况,保障研发项目的平稳落地
•具备参与研发安全演练的技术能力,是容灾演练、红蓝对抗、突袭演练等场景下的一线主力
•对自己负责的研发模块具备快速上线、响应、应急处理能力
•熟悉系统使用场景,不同行业、客户、应用对系统的需求差异性,理解使用场景的痛点、难点。
•能与业务一起拆解流程场景、需求优先级,对标市场领先实践等
备注:持有阿里云ACA/ACP/ACE认证证书者优先
相似职位
很抱歉,暂无相似职位!