更新于 3月25日

python爬虫开发工程师

8000-13000元·13薪
  • 济南历下区
  • 3-5年
  • 本科
  • 全职
  • 招3人

职位描述

Python爬虫开发反爬虫数据清洗ScrapyDjango计算机软件
岗位职责:
1、根据业务数据需求,分析目标网站结构,设计合理的抓取策略,使用 Scrapy、Selenium 等框架开发爬虫程序,实现高效、稳定的数据抓取;
2、针对目标网站的反爬措施(如 IP 封禁、验证码、User-Agent 验证、动态参数加密等),设计并实现应对方案,保障爬虫长期可用;
3、对接收到的原始数据进行清洗、解析(使用 XPath、正则、BeautifulSoup 等),提取结构化信息;
4、搭建爬虫运行监控机制(如失败重试、日志告警、状态统计),定期排查爬虫异常,优化爬虫性能,提升数据抓取效率;
5、具备良好的创新能力和解决问题的能力,能够持续推动技术进步。
任职要求:
1、熟练掌握 Python 编程语言及语法特性,深入理解多线程、协程、异步 IO(asyncio/httpx)等并发模型;
2、深入理解 HTTP/HTTPS 协议原理,至少熟练掌握一种网络请求库(requests、httpx、urllib等),能灵活处理爬虫场景下的复杂请求;
3、具备较强的反爬策略设计能力,熟悉常见反爬机制,能破解简单的参数加密;
4、熟练使用至少1种数据解析技术(XPath、BeautifulSoup 优先),能高效提取 HTML/XML 中的结构化数据;
5、熟悉关系型数据库(MySQL)和 NoSQL 数据库(MongoDB 优先),能根据数据结构设计表结构 / 集合,编写高效的查询语句;
6、了解网络爬虫相关法律法规及伦理规范,能评估抓取行为的合规性;
7、可以接受短期出差。

工作地点

济南历下区龙翔商务大厦-A座701室

认证资质

营业执照信息

职位发布者

陶女士/HR

当前在线
立即沟通
公司Logo山东易构软件技术股份有限公司
山东易构软件技术股份有限公司(以下简称“易构软件”)成立于2011年4月6日,注册资本6000万元。公司于2015年11月11日成功挂牌新三板,股票代码:834002。易构软件是一家立足于智能交通行业,为公路交通、城市交通、轨道交通、民用航空、智慧城市等用户提供智能解决方案、软件产品、应用平台、咨询及运营服务的高新技术企业。公司成立至今,通过了高新技术企业、双软企业、ISO9000、计算机系统集成三级资质等资质认证,被评为山东省、济南市创新型企业,并于2015年获批山东省唯一一家智能交通软件示范工程技术研究中心及山东省软件工程技术中心,且连续两年承担山东省自主创新及成果转化专项。公司还获得了中国智能交通协会科学技术奖、全国交通运输信息化、智能化建设优秀单位等荣誉,多次获得山东省、济南市、高新区科技计划项目专项资金。公司现已取得软件著作权48项,发明专利8项,实用新型专利6项。在国家倡导构建绿色交通体系,不断提高智能交通行业发展的软实力及交通运输科技含量和信息化水平的大背景下,易构软件立足智能交通领域,秉承“诚信服务客户、品质精益求精”的理念,运用互联网思维整合优势资源,开拓新的业务模式,积极进行大数据、云计算、移动互联等技术在智能交通领域的探索和实践,致力于让交通管理者管理精细、服务周到、运转高效、效益显著;让交通参与者出行便捷、安全、经济、环保,构建交通美好环境,努力打造智能交通领域的信息服务专家形象。
公司主页