该职位已失效,看看其他机会吧

python爬虫工程师

1.5-1.6万
  • 杭州滨江区
  • 5-10年
  • 本科
  • 全职
  • 招1人

职位描述

PythonSQL数据挖掘数据清洗数据采集爬虫开发电商平台电子商务互联网
岗位职责:
1、使用 Python 及相关生态库(如Scrapy, Requests, Selennium, Playwright等)设计、开发和维护稳定可靠的分布式爬虫系统, targeting 主流电商平台(如淘宝/天猫、京东、拼多多、抖音电商、小红书等)。
2、自动化辅助:在遇到复杂反爬策略(如验证码、行为检测、高强度加密)时,能够运用 影刀 或 AirTest 等RPA工具作为有效补充方案,构建混合型自动化采集流程,确保数据获取的成功率与稳定性。
3、数据处理:对原始数据进行清洗、去重、解析、转换和校验,利用 Pandas, NumPy 等工具进行数据治理,确保数据质量和可用性。
4、数据存储:将处理后的数据高效存储到数据库(如 MySQL, PostgreSQL, MongoDB, Redis 等)中,并进行合理的表结构设计和索引优化。
5、运维监控:维护数据采集流程的日常稳定运行,编写监控脚本,及时排查和解决因平台策略变更、系统环境等问题导致的故障。
6、技术文档:撰写清晰的技术设计、流程说明及API文档,保证代码和项目的可维护性。
岗位要求:
1、本科及以上学历,计算机相关专业,3-5年以上Python开发经验。
2、精通Python编程,有扎实的编程基础,熟悉常用数据结构、算法和设计模式。
3、具备丰富的网络爬虫开发经验,熟练掌握至少一种主流爬虫框架(如Scrapy),能独立处理常见反爬机制。
4、有RPA工具(如 影刀、AirTest、UiPath等)的实际项目应用经验,理解其与代码开发的互补关系。
5、熟练掌握数据清洗和分析的常用库,如 Pandas。
6、熟悉数据库技术,能熟练编写和优化SQL语句,有MySQL等关系型数据库的使用和设计经验。
7、熟悉Web前端基础(HTML, CSS, JavaScript, Ajax)和网络协议(HTTP/HTTPS),精通浏览器开发者工具的使用。
查看全部

工作地点

杭州滨江区华业发展中心2801

职位发布者

曾强/人事经理

立即沟通
公司Logo杭州乐书数字科技有限公司
乐书是一家面向电商和社群领域商家的供应链金融科技服务平台。公司成立于2021年12月,总部位于杭州。乐书由电商和金融行业的顶级人才与资本市场专家共同创立。公司致力于利用人工智能、区块链、云计算和大数据等科技,结合电商和社群供应链场景,为中小商家提供一站式的解决方案和服务。公司目标是成为全球领先的面向电商和社群行业的供应链金融科技解决方案提供商。公司的创始团队来自电商和金融行业的翘楚,具有丰富的产品开发和业务运营经验。公司通过投资和深度合作的方式与行业翘楚企业共同发展,不断借鉴最佳实践,拓展自身业务。这使得我们对电商和社群生态、供应链金融场景有极为深刻的理解,特别是在国内产地供应链和云仓合作等方面有重要优势。在电商和社群供应链场景的深度挖掘与理解基础上,公司运用ABCD科技手段开发定制化的解决方案,满足中小商家的个性化需求。目前,公司已连接全国100+合作云仓仓库,为电商和社群商家提供全链条一站式的供应链金融科技服务,业务范围包括电商极速收款、订单融资、采购金融等,服务各大流量平台的产地供应链业务。未来将持续加大在科技和产品创新方面的投入,不断优化和丰富解决方案与服务,实现供应链金融和产地供应链场景的全覆盖。公司愿景是成为全球电商和社群企业最信赖的供应链金融和产地供应链合作伙伴,为更多中小商家带来价值和机会。
公司主页