【职位描述】
1. 负责开发和维护爬虫系统,实现对特定网站数据的抓取和解析。
2. 参与爬虫系统的设计和优化,带领数据团队攻克数据采集与应用难题。
3. 负责处理爬虫系统中出现的异常情况,保证数据的准确性和完整性。
4. 配合团队成员进行数据分析和挖掘,为业务决策提供支持。
5. 参与数据采集、统计分析、监控等相关系统架构设计和研发
【任职要求】
1. 本科以上学历,计算机相关专业,熟悉操作系统(多线程、多进程)、计算机网络编程、数据结构与算法等基础知识。
2. 熟悉Python编程语言,具有良好的编程能力和代码规范,3年以上Linux环境下开发经验,熟练使用常用Linux命令。
3. 了解常见的网络爬虫框架,如Scrapy、BeautifulSoup等,并具有相关开发经验。
4. 3年以上大规模网页爬虫开发经验,深入了解浏览器原理、前端JS反爬、AJAX、非逆向、分布式系统设计开发落地等工作,能解决前端动态JS混淆问题。并且有优秀结果\数据者优先!
5. 具有团队合作精神,沟通能力强,能够有效与团队成员协作完成项目任务。
6. 对数据挖掘和机器学习有一定了解者优先考虑。
【公司介绍】
探迹成立于2016年,总部设立在广州,全国布局2大研发中心(广州和杭州,研发人员300多人)+4个分公司(北京/上海/深圳/杭州)+30多个办事处(珠三角/长三角/京津冀等)。整体员工规模超1500人(计划扩张至两三千人)。2018年-2021年 连续4年完成不同阶段融资,目前已完成C轮融资;2021-2024年 连续4年获得 胡润百富“全球独角兽”称号;目前市场估值超10亿美金。
结合多模态大模型、检索增强生成(RAG)、NLP(自然语言处理技术)、机器学习算法等人工智能技术,探迹构建了1.8亿家企业的全量知识图谱,融合基于垂类行业知识延展的自研大模型,打造了全球领先的AI+大数据 的智能销售SaaS软件(拓客系统)。为企业提供从线索挖掘、商机触达、客户管理到成单分析的全流程智能销售服务,帮助企业高效获取精准销售线索,降低获客成本,从而全面提升销售效率和业绩。累计为超过40000家合作企业实现销售数字化转型,其中包括阿里巴巴、字节跳动、美孚石油汉高乐泰、中电光谷等行业巨头。