职位描述
PythonJavaHeritrixrequestsDjango计算机软件产业互联网平台云计算
要求:
一、专业和技能要求:
.编程语言:精通 Python(核心),熟悉 JavaScript/TypeScript(前端逆向 / 浏览器脚本)、Java(中大型项目)。
.网络与解析:精通 HTTP/HTTPS 协议、XPath/CSS 选择器、正则表达式、BeautifulSoup/lxml、Playwright/Selenium(动态页面)
.数据库与存储:熟悉MySQL/MongoDB(主存)、Redis(缓存 / 任务队列)。
.基础反爬对抗:IP 池(住宅 / 数据中心)、Cookie 池、请求头伪装、随机休眠 / 限速、失败重试(指数退避)
.爬虫逆向:JS 逆向 / 反混淆、App 逆向(Frida/Unidbg)、Charles/Fiddler 抓包、验证码 OCR / 打码平台。
二、岗位职责:
1、快速熟悉现有的基本业务与数据要求;
2、搭建爬虫架构设计、高并发系统优化、代理池 / 任务队列搭建、跨团队数据协作;
3、数据采集/清洗/入库、反爬应对、爬虫脚本优化、维护数据资源库;
4、JS 逆向 / 协议分析、App 脱壳逆向、验证码破解、5 秒盾 / 瑞数等高级反爬绕过。
5、保证采集数据的准确性和完整性;
三、职位要求:
1、每年出差2次左右,时间最多不超过二个月。
2、较快的学习能力和应变能力,能尽快适应新的工作环境。
3、了解爬虫相关技术,计算机相关专业,熟悉Scrapy, Appium, Anyproxy, Requests, DBUtils,Urllib, Xpath, BS4及相关库的使用;
4、了解使用 PyCharm,Git, 以及Linux相关命令;有一定服务器操作能力;
5、有团队合作精神,善于表达,能快速准确的表述出技术问题;
一、专业和技能要求:
.编程语言:精通 Python(核心),熟悉 JavaScript/TypeScript(前端逆向 / 浏览器脚本)、Java(中大型项目)。
.网络与解析:精通 HTTP/HTTPS 协议、XPath/CSS 选择器、正则表达式、BeautifulSoup/lxml、Playwright/Selenium(动态页面)
.数据库与存储:熟悉MySQL/MongoDB(主存)、Redis(缓存 / 任务队列)。
.基础反爬对抗:IP 池(住宅 / 数据中心)、Cookie 池、请求头伪装、随机休眠 / 限速、失败重试(指数退避)
.爬虫逆向:JS 逆向 / 反混淆、App 逆向(Frida/Unidbg)、Charles/Fiddler 抓包、验证码 OCR / 打码平台。
二、岗位职责:
1、快速熟悉现有的基本业务与数据要求;
2、搭建爬虫架构设计、高并发系统优化、代理池 / 任务队列搭建、跨团队数据协作;
3、数据采集/清洗/入库、反爬应对、爬虫脚本优化、维护数据资源库;
4、JS 逆向 / 协议分析、App 脱壳逆向、验证码破解、5 秒盾 / 瑞数等高级反爬绕过。
5、保证采集数据的准确性和完整性;
三、职位要求:
1、每年出差2次左右,时间最多不超过二个月。
2、较快的学习能力和应变能力,能尽快适应新的工作环境。
3、了解爬虫相关技术,计算机相关专业,熟悉Scrapy, Appium, Anyproxy, Requests, DBUtils,Urllib, Xpath, BS4及相关库的使用;
4、了解使用 PyCharm,Git, 以及Linux相关命令;有一定服务器操作能力;
5、有团队合作精神,善于表达,能快速准确的表述出技术问题;
职位福利:五险一金、绩效奖金、带薪年假、员工旅游、节日福利、每年多次调薪、周末双休、项目奖金
工作地点
郑州管城回族区新发展楷林智慧广场-11栋17层

认证资质
营业执照信息

更新于 今天



