运维开发工程师
1-1.5万元/月
更新 2025-12-21 14:37:14
浏览 813
职位详情
运维开发工程师
1-3年
职位名称:大数据平台运维开发专家
岗位职责
平台运维与优化:承担腾讯大数据平台(Hadoop/Flink/OLAP等)的日常维护、性能调优及系统稳定性保障工作,确保平台高可用与高效运转。
自动化与工具开发:规划并实现运维自动化解决方案,涵盖监控告警、智能分析、资源管理、CI/CD流程等,持续提升运维效能。
问题排查与优化:深入定位集群性能瓶颈与故障根源,结合源码级调试能力制定优化策略,推动系统持续改进。
流程标准化:梳理现有运维体系,建立标准化操作规范,推进DevOps、SRE等先进实践落地实施。
技术创新:研究大数据生态前沿技术(如云原生、Serverless等),优化架构设计,提升资源使用效率与运维智能化程度。
任职要求
技术能力:
掌握Hadoop、Spark、Flink、Kafka等核心大数据组件,具备集群部署、性能调优及复杂问题处理经验。
熟练运用Java/Python/Go中至少一门编程语言,可独立完成运维工具或系统的开发任务。
熟悉Linux操作系统、网络与存储机制,能熟练使用性能诊断工具(如Arthas、Prometheus等)进行系统分析。
经验要求:
3年以上大数据运维或相关开发经历,有PB级数据集群运维背景者优先考虑。
了解分布式系统架构原理,能够通过日志、指标、链路追踪等方式快速诊断复杂问题。
软技能:
具备高度责任感与风险防控意识,能从容应对线上紧急事件。
拥有良好沟通协调能力,能够推动跨团队协作并保障技术方案有效落地。
加分项
了解Kubernetes、Docker及云原生环境下的大数据架构(如SparkonK8s)。
参与过开源项目贡献或有大数据组件源码阅读基础。
具备SRE方法论认知,曾主导或深度参与系统稳定性提升项目。
备注:本岗位为腾讯集团子公司职位,需具备扎实的技术功底与较强的业务理解能力。
岗位职责
平台运维与优化:承担腾讯大数据平台(Hadoop/Flink/OLAP等)的日常维护、性能调优及系统稳定性保障工作,确保平台高可用与高效运转。
自动化与工具开发:规划并实现运维自动化解决方案,涵盖监控告警、智能分析、资源管理、CI/CD流程等,持续提升运维效能。
问题排查与优化:深入定位集群性能瓶颈与故障根源,结合源码级调试能力制定优化策略,推动系统持续改进。
流程标准化:梳理现有运维体系,建立标准化操作规范,推进DevOps、SRE等先进实践落地实施。
技术创新:研究大数据生态前沿技术(如云原生、Serverless等),优化架构设计,提升资源使用效率与运维智能化程度。
任职要求
技术能力:
掌握Hadoop、Spark、Flink、Kafka等核心大数据组件,具备集群部署、性能调优及复杂问题处理经验。
熟练运用Java/Python/Go中至少一门编程语言,可独立完成运维工具或系统的开发任务。
熟悉Linux操作系统、网络与存储机制,能熟练使用性能诊断工具(如Arthas、Prometheus等)进行系统分析。
经验要求:
3年以上大数据运维或相关开发经历,有PB级数据集群运维背景者优先考虑。
了解分布式系统架构原理,能够通过日志、指标、链路追踪等方式快速诊断复杂问题。
软技能:
具备高度责任感与风险防控意识,能从容应对线上紧急事件。
拥有良好沟通协调能力,能够推动跨团队协作并保障技术方案有效落地。
加分项
了解Kubernetes、Docker及云原生环境下的大数据架构(如SparkonK8s)。
参与过开源项目贡献或有大数据组件源码阅读基础。
具备SRE方法论认知,曾主导或深度参与系统稳定性提升项目。
备注:本岗位为腾讯集团子公司职位,需具备扎实的技术功底与较强的业务理解能力。
相似职位
很抱歉,暂无相似职位!