雇员点评标签
职位描述
数仓开发Spark sqlFlink sqlFlinkSparkETL开发
需求描述:
1、独立承担数仓各层(ODS/DWD/DWS/DM)的建模设计与 SQL 开发,输出高质量的模型文档与开发规范。
2、负责离线(Hive/Spark)及实时(Flink)数据任务的全流程开发与运维,主导性能调优,解决数据倾斜、任务延迟等复杂技术问题。
3、深入理解业务需求,独立完成需求拆解、方案设计与开发交付,保障数据准确、稳定、及时。
4、将 AI 工具深度融入开发全流程,包括 SQL 生成与优化、ETL 脚本编写、字段血缘梳理、数据文档自动生成等。
要求:
1、计算机、数学、统计学等相关专业本科及以上学历;5 年以上数据仓库开发经验,有完整数仓项目从 0 到 1 落地经验。
2、深度掌握数仓分层建模理论(维度建模),能独立主导 DWD/DWS/DM 层模型设计与评审,具备数据标准化与指标体系建设经验。
3、掌握 HiveSQL/SparkSQL,有复杂多表关联、窗口函数、数据倾斜等场景的深度调优经验;
4、熟悉 ClickHouse 或 Doris 等 OLAP 引擎,有实际生产优化经验。
5、熟悉 Flink 实时开发,有实时数仓或实时指标计算落地经验者优先。
6、深度使用 AI 编程工具(Cursor / GitHub Copilot / 通义灵码),能清晰描述 AI 工具在实际项目中的提效案例(如开发效率提升、文档自动化等),
7、具备数据 Agent 落地实践经验,能将 LLM 与数据深度结合,有完整 Data Agent 项目交付经验者优先。
8、沟通表达清晰,能独立与业务方对接需求,按时保质完成交付,无需过多管理介入。
优先条件:
1. 有零售行业数仓建设经验
2. 有通过 AI 工具将个人开发效率提升 30% 以上的可量化案例
3. 了解 RAG、数据知识库搭建等 AI 工程化实践者优先
1、独立承担数仓各层(ODS/DWD/DWS/DM)的建模设计与 SQL 开发,输出高质量的模型文档与开发规范。
2、负责离线(Hive/Spark)及实时(Flink)数据任务的全流程开发与运维,主导性能调优,解决数据倾斜、任务延迟等复杂技术问题。
3、深入理解业务需求,独立完成需求拆解、方案设计与开发交付,保障数据准确、稳定、及时。
4、将 AI 工具深度融入开发全流程,包括 SQL 生成与优化、ETL 脚本编写、字段血缘梳理、数据文档自动生成等。
要求:
1、计算机、数学、统计学等相关专业本科及以上学历;5 年以上数据仓库开发经验,有完整数仓项目从 0 到 1 落地经验。
2、深度掌握数仓分层建模理论(维度建模),能独立主导 DWD/DWS/DM 层模型设计与评审,具备数据标准化与指标体系建设经验。
3、掌握 HiveSQL/SparkSQL,有复杂多表关联、窗口函数、数据倾斜等场景的深度调优经验;
4、熟悉 ClickHouse 或 Doris 等 OLAP 引擎,有实际生产优化经验。
5、熟悉 Flink 实时开发,有实时数仓或实时指标计算落地经验者优先。
6、深度使用 AI 编程工具(Cursor / GitHub Copilot / 通义灵码),能清晰描述 AI 工具在实际项目中的提效案例(如开发效率提升、文档自动化等),
7、具备数据 Agent 落地实践经验,能将 LLM 与数据深度结合,有完整 Data Agent 项目交付经验者优先。
8、沟通表达清晰,能独立与业务方对接需求,按时保质完成交付,无需过多管理介入。
优先条件:
1. 有零售行业数仓建设经验
2. 有通过 AI 工具将个人开发效率提升 30% 以上的可量化案例
3. 了解 RAG、数据知识库搭建等 AI 工程化实践者优先
展开该职位详情




