返回 职位详情 登录/注册
sre运维工程师
1.1-2万元/月
定位 成都天府5街天府五街E8-6楼
更新 2025-12-18 14:45:19 浏览 969
职位详情
运维开发工程师 5-10年
产品范围:阿里公共云的云原生可观测性产品线及中间件相关服务,包括日志、监控、告警、消息队列等,具备完善的可观测体系构建实践经验,同时拥有一定的SRE背景,在高可用架构设计、容灾演练、变更管控、故障处理等方面有深入理解;SRE-稳定性工程师(中级1人):负责阿里公共云稳定性解决方案的架构实施与日常运维工作。

工作范围:
架构设计:结合具体业务需求,运用阿里云ARMS、OpenTelemetry、Prometheus、Grafana等可观测技术,规划具备高可用性与可量化特性的稳定性架构,覆盖系统健壮性、监控完整性与自动化响应机制,达成系统可靠性与交付效率的平衡。
稳定性体系建设:掌握高可用架构设计、容灾测试、变更管理与故障应急流程,主导全链路容灾、灰度上线、资金安全保障等关键治理项目,推进红蓝对抗演练、突发事件响应、风险排查等能力的实际落地。依托自动化平台建设,实现变更受控、故障可防、系统可快速恢复的稳定性工程闭环。
故障管理:承担应急处置任务,协调多方团队联动,开展根因分析,快速恢复服务,并通过事后复盘推动系统性优化。
开发能力:熟练掌握至少1-2种编程语言,如Python、Java等,能够通过脚本开发提升可观测平台的运维效率。
具备扎实的架构设计、性能调优与系统稳定性保障能力,深刻理解阿里云ARMS、OpenTelemetry、Prometheus、Grafana等可观测工具的技术架构与适用场景,具备丰富的实际落地经验。
在识别业务潜在风险时,能综合技术可行性、运营成本、投入产出比等因素,推动切实可行的优化方案实施。具备系统的安全生产培训经历,具有较强的数据安全意识,对生产与非生产环境保持高度敬畏。
公司信息
浩鲸云计算科技股份有限公司
明细
南京市雨花台区安德门大街50号B座6楼
南沙人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!