工作职责:
1、 负责医疗业务的离线与实时数据仓库的构建和数据架构设计,包括数据模型的设计,ETL实施,ETL性能优化,ETL数据监控以及相关技术问题的解决,指标体系建设与维护等;
2、能独立负责从0到1搭建离线数仓可,以规划和搭建基础设施;
3、负责ETL流程过程中的各种异常和技术问题的处理;
4、开展全生命周期的数据治理,采用开源组件设计和实现工具化体系,并推进落地,确保可持续的数据质量;
5、数据平台产品化建设,不断优化数据架构、数据分层和取数效率,支撑大数据相关的业务系统需求;
6、基于大数据平台的业务数据开发支持,包括360患者健康档案,转诊平台,数据大屏,疾病管理等;
7、带领其他数据开发人员,完成数据仓库ETL,业务系统数据开发,项目交付与验收;
8、负责领导交代的其他任务;
任职要求:
1、本科及以上,计算机或数据领域相关专业,大数据开发工作经验3年以上;
2、能熟练使用Mapreduce、Hive、Spark等进行数据加工。熟悉hive和spark的编写和性能调优;
3、熟练使用大数据相关组件Hadoop、Hive、Spark、Kafka、Hbase、Flink、Elasticsearch、Doris等;
4、有过独立建设数据仓库经验,搭建数仓经验;
5、具备Java开发经验优先;
6、医疗项目经验优先;