该职位已失效,看看其他机会吧

大数据爬虫工程师

8000-16000元
  • 合肥蜀山区
  • 1-3年
  • 本科
  • 全职
  • 招3人

职位描述

Python数据挖掘数据采集爬虫开发分布式爬虫Spark云计算/大数据人工智能
【岗位职责】
1、负责网络资源的搜集、抽取、清洗、去重、分类及过滤,构建高质量的数据资源库;
2、根据业务需求,设计并实现高效的数据采集方案,确保数据的实时性和准确性;
3、协助业务部门进行数据的更新与维护,提供数据支持及解决方案;
4、优化采集脚本,提升数据采集效率,解决采集过程中的反爬虫策略问题;
5、参与数据采集工具的开发以及成品数据集的制作。
【任职要求】
1、统招本科及以上学历,计算机、电子信息、软件工程等相关专业;
2、熟练掌握Python编程语言,具备扎实的编程基础,熟悉正则表达式、XPATH、requests等技术;
3、熟悉Web前端技术,包括HTML、HTTP、JavaScript、JSON等,能够处理动态网页数据;
4、掌握常用数据库操作,mongodb,mysql等
5、了解Linux开发环境,掌握基本shell命令,具备linux部署的能力;
6、有爬虫类项目经验优先,熟悉常用的爬虫框架(如Scrapy、自动化等);
7、具备网络资源搜集、信息抽取、文本分类等相关经验者优先;
8、具备良好的沟通能力和团队协作精神,能够独立解决问题并承担工作压力。
查看全部

工作地点

合肥蜀山区天源迪科科技园

职位发布者

杨先生/招聘经理

立即沟通
公司Logo安徽九联正远教育科技有限公司
安徽九联正远教育科技有限公司自2016年3月成立以来,经过精心布局,现已拥有校企合作办学、金融培训、无人机应用技术职业教育、人工智能等多个战略布局模块。数年来,公司深耕于金融、人工智能以及无人机应用技术职业教育十余年,与亳州学院、信阳职业技术学院、南阳农业职业学院、鹤壁职业技术学院、六安职业技术学院、滁州技师学院等院校合作开设金融科技应用、财富管理、无人机、人工智能等校企合作专业,在校学生3000余人,是“市场需求和劳动就业紧密结合,校企合作、工学结合,结构合理、形式多样,灵活开放、自助发展,有中国特色的现代职业教育体系”的开创者和中坚力量。当前,主要发展人工智能板块,业务范围广泛,主要包括数据采集、数据清洗、数据标注、数据质检、数据交付等环节,目前我们拥有专业的标注团队以及先进的标注工具,能够高效、准确地完成各种类型的数据标注任务。目前主要有合肥、成都、西安等职场未来我们将广泛和各种职业技术院校拓展合作空间,不断创新合作模式。与此同时,我们也会不断提高自身的技术实力与服务水平,满足客户日益增长的要求。
公司主页