职位描述
数据爬虫反爬虫PythonJavaScrapy多渠道数据采集数据质量保障数据采集方案设计
工作职责
1. 负责多渠道数据源的调研与对接,设计并落地高效的数据采集方案,覆盖结构化与非结构化数据。
2. 搭建并维护数据采集工具链,优化采集流程,提升数据获取的时效性与准确性。
3. 监控采集任务运行状态,及时处理数据缺失、格式异常等问题,保障数据质量。
4. 配合业务团队需求,输出标准化的采集数据报告,支撑业务分析与决策。
任职要求
1. 大专及以上学历,计算机、统计学或相关专业优先。
2. 熟悉Python/Java等至少一种编程语言,掌握Scrapy、Selenium等主流数据采集工具的使用。
3. 具备多数据源(API接口、网页、数据库等)采集经验,能独立解决反爬、数据格式转换等问题。
4. 有良好的逻辑思维能力与问题解决能力,对数据质量有严格的把控意识。
1. 负责多渠道数据源的调研与对接,设计并落地高效的数据采集方案,覆盖结构化与非结构化数据。
2. 搭建并维护数据采集工具链,优化采集流程,提升数据获取的时效性与准确性。
3. 监控采集任务运行状态,及时处理数据缺失、格式异常等问题,保障数据质量。
4. 配合业务团队需求,输出标准化的采集数据报告,支撑业务分析与决策。
任职要求
1. 大专及以上学历,计算机、统计学或相关专业优先。
2. 熟悉Python/Java等至少一种编程语言,掌握Scrapy、Selenium等主流数据采集工具的使用。
3. 具备多数据源(API接口、网页、数据库等)采集经验,能独立解决反爬、数据格式转换等问题。
4. 有良好的逻辑思维能力与问题解决能力,对数据质量有严格的把控意识。
工作地点
南京秦淮区三才软件大厦2层202

认证资质
营业执照信息

更新于 今天





