返回 职位详情 登录/注册
研发专家-云内可观测系统-杭州/北京
2-4万元/月
定位 杭州西湖区阿里巴巴云谷园区1号楼
更新 2025-12-30 14:21:54 浏览 282
职位详情
Java 5-10年 Golang · C++ · ClickHouse · ELK · MySQL · Prometheus · OpenTelemetry · Spring · Python
职位描述:
1、参与阿里云核心可观测平台(Metrics/Logs/Traces)的架构规划与技术突破,推进AIOPS在故障预测、根因定位、容量管理等场景的实际应用。
2、参与阿里云核心可观测平台运维自动化体系及工具链的构建与研发,提升SRE平台运作效率与智能程度,确保生产环境7x24小时稳定运行。
3、牵头全链路稳定性防护机制建设,通过主动式监控、容量管控与性能调优,识别并消除潜在隐患,增强业务承载能力;主导重大线上事件的应急处置与根本原因分析。
4、以用户需求为导向,快速响应并协助解决用户问题;高效处理系统稳定性与性能瓶颈,推动优化措施落地实施,保障关键业务场景的可用性与使用体验。

职位要求:
1、本科及以上学历,计算机相关专业,5年以上SRE/运维开发/系统架构经验,具备大型分布式系统稳定性保障背景,有devops、效能平台实践经历者优先。
2、掌握主流可观测性技术栈(Prometheus、OpenTelemetry、ClickHouse、ELK等),具备大规模监控系统设计与开发经验。
3、熟练掌握至少一门编程语言如C++/Python/Go等,了解软件开发与运维流程,具备全栈开发能力者更佳。
4、具备扎实的计算机基础知识,熟悉操作系统机制、网络通信、高并发处理及性能调优方法,具有架构设计经验,有大流量、高性能、分布式系统开发背景者优先。
5、具备较强的系统问题定位能力,善于主动沟通与归纳总结,对技术有持续热情,并关注行业前沿技术发展动态。
6、具备良好的协作沟通意识和团队合作精神,具备自主驱动工作与学习能力者优先。
公司信息
阿里云计算有限公司
明细
浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
南沙人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!