返回 职位详情 登录/注册
高级SRE工程师
1.5-1.8万元/月
定位 广州海珠区TCL大厦2702
更新 2025-12-15 07:19:14 浏览 349
职位详情
运维开发工程师 5-10年 Elasticsearch · 运维开发经验 · Python/Shell · Kubernetes
岗位职责
*主导构建kuaiziSaas平台的SLI/SLO/SLA框架,量化评估链路延迟、调用成功率、可用性及基础设施健康状态等关键指标
*识别系统薄弱环节,优化服务稳定性,平衡资源使用效率,设计高可用与服务降级策略
*搭建覆盖全业务链路的压测机制,提前识别性能瓶颈,管控系统稳定性风险
*基于OpenTelemetry打造可观测性体系,集成Prometheus/Elasticsearch/Grafana实现毫秒级异常发现
*设计并落地自动化故障响应流程,确保重大故障平均恢复时间(MTTR)控制在5分钟以内
*推进多云环境下的成本治理工作,具备腾讯云、火山引擎成本优化经验者优先
*牵头重大故障复盘,输出可度量的Postmortem报告,保障同类问题复发率低于5%
*构建变更防护机制,通过自动化测试卡点拦截80%以上高风险发布操作
*快速响应平台运维突发事件,精准定位并及时处置问题,防止影响扩大

任职要求
*具备5年以上SRE或DevOps实战经验,有Saas平台运维背景者优先
*精通Kubernetes平台治理,拥有千节点规模集群运维与性能调优实践经验
*熟练掌握运维工具链开发(Python/Go/React),参与过开源项目核心模块贡献者优先
公司信息
广州筷子信息科技有限公司
明细
广州市海珠区海洲路18号2701室(部位:自编02)(仅限办公)
南沙人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!