岗位职责:
1. 参与需求评审,与业务/数据产品团队沟通,完成数仓方案与数据模型设计(星型/雪花/专题模型等);
2. 使用 MaxCompute、AnalyticDB/Hologres、EMR、DataWorks 等阿里云组件实现 ETL/ELT 作业与数据流水线,搭建批次/实时数据处理流程;
3. 在 DataWorks 中开发和调度 DAG,编写 SQL/脚本,负责作业自动化、监控与报警配置;
4. 负责数据建模、分区/分桶策略、索引与物化视图设计,进行性能优化;
5. 编写和维护数据质量规则(DQ)、数据校验与血缘文档,参与数据治理和数据目录建设;
6. 负责数据采集/同步:使用 DTS、DataHub、消息队列(如 RocketMQ/Kafka)等实现异构数据源的接入与实时同步;
7. 根据安全与合规要求,设计数据权限、脱敏策略,参与数据安全与审计工作;
8. 编写开发规范与技术文档,推进代码/作业的 CI/CD 与版本管理,支持线上故障排查与性能调优。
任职要求:
1. 本科及以上学历,计算机、软件工程、信息系统、数学等相关专业优先;
2. 熟练掌握 SQL,能够编写复杂查询、窗口函数、子查询、聚合及性能优化;
3. 熟练掌握至少一种编程语言:Python/Java/Scala,能编写数据处理脚本与 UDF/UDAF;
4. 熟悉数据建模方法(维度建模/星型/雪花模型)和常见数据仓库架构(Lambda/Kappa/ELT);
5. 具有良好的沟通能力、责任心与团队协作精神,能与业务方与上游/下游系统高效对接。