返回 职位详情 登录/注册
数据开发工程师
1-1.5万元/月
定位 广州黄埔区合景·科汇金谷科学大道103号科汇金谷二街四号B3-01栋二楼201
更新 2025-12-14 14:46:03 浏览 735
职位详情
数据开发 3-5年 Shell · 要求数据开发经验 · ETL开发经验 · MySQL/SQL Server · Kafka · 非外包类 · 数据平台开发经验 · 数据治理经验 · Flink · Python · SQL
岗位职责
1.负责项目中数据采集模块的数据源分析、采集策略制定及处理需求梳理;
重构省级Kafka至地市局Flink的实时回流链路,解决消息积压与资源分配不均问题;
设计T+1离线数据同步方案(基于DataX与大数据集群),确保地市局数据完整入仓

2.负责数据处理任务调度、数据质量稽核等作业流程的设计与落地;
搭建覆盖表级与字段级的数据质量监控体系(如Griffin),贯穿数据采集、加工到API输出全链路;
建立缺数自动预警机制,明确数据异常处理标准流程(SOP)

3.推动数据治理规范在项目中的实际落地执行;
主导编制《数据采集规范》《ETL开发标准》,统一元数据管理口径;
协同推进政府侧数据元管理工作,严格管控外网厂商数据接入合规性

4.承担各类数据系统与平台的ETL开发及性能调优工作;
优化Flink与Kafka集群运行效率,保障实时数据处理稳定可靠;
设计数据血缘追踪机制,提升链路故障定位速度与运维效率

经验要求
1、具备3年以上Flink/Kafka实时计算场景下的性能调优经验,掌握Exactly-Once语义实现原理;
2、熟练运用DataX完成大规模数据高效迁移与同步;
3、熟悉主流数据质量监控工具的应用与集成;
4、了解数据治理体系架构及相关实践方法

技术栈:
Flink|Kafka|DataX|Spark|MySQL|Shell/Python

加分项
1、曾主导企业级数据治理制度规划与落地实施;
2、具备Nifi进行流式数据采集及实时入仓(Lambda架构)的实际项目经验;
3、拥有云环境下ETL任务开发与运维经历;
4、能够设计面向大模型应用的宽表结构,支撑多业务系统共用数据
公司信息
深圳君南信息系统有限公司
明细
深圳市南山区粤海街道高新区社区科技南八路2号豪威科技大厦1413
南沙人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!