职位描述
PythonJavaFlumeKafka多源异构数据采集数据采集管道搭建维护数据质量校验
工作职责:
1. 负责多源异构数据(结构化/非结构化)的采集方案设计与落地,覆盖API接口、数据库、日志文件等多种数据源。
2. 搭建并维护数据采集管道,优化采集效率与稳定性,解决数据延迟、丢失等问题。
3. 制定数据采集质量校验规则,通过监控与异常告警机制保障数据完整性与准确性。
4. 与业务团队协作,理解数据需求并输出标准化的数据采集方案,支撑业务分析与决策。
任职要求:
1. 本科及以上学历,计算机、数据科学等相关专业,基础扎实。
2. 熟悉至少一种数据采集工具(如Flume、Logstash、Kafka Connect),掌握Python/Java等编程语言进行自定义采集脚本开发。
3. 具备数据库(MySQL/Oracle)与API接口数据采集经验,了解常见数据格式(JSON/XML/CSV)的解析处理。
4. 有数据质量监控或ETL流程优化经验者优先,具备问题排查与性能调优能力。
1. 负责多源异构数据(结构化/非结构化)的采集方案设计与落地,覆盖API接口、数据库、日志文件等多种数据源。
2. 搭建并维护数据采集管道,优化采集效率与稳定性,解决数据延迟、丢失等问题。
3. 制定数据采集质量校验规则,通过监控与异常告警机制保障数据完整性与准确性。
4. 与业务团队协作,理解数据需求并输出标准化的数据采集方案,支撑业务分析与决策。
任职要求:
1. 本科及以上学历,计算机、数据科学等相关专业,基础扎实。
2. 熟悉至少一种数据采集工具(如Flume、Logstash、Kafka Connect),掌握Python/Java等编程语言进行自定义采集脚本开发。
3. 具备数据库(MySQL/Oracle)与API接口数据采集经验,了解常见数据格式(JSON/XML/CSV)的解析处理。
4. 有数据质量监控或ETL流程优化经验者优先,具备问题排查与性能调优能力。
工作地点
黄陂区武汉埃坶玖商贸有限公司

认证资质
营业执照信息

更新于 今天



