该职位已失效,看看其他机会吧

数据采集工程师

1-1.5万
  • 上海闵行区
  • 浦江镇
  • 经验不限
  • 本科
  • 全职
  • 招5人

职位描述

数据爬虫反爬虫PythonJavaHTMLCSSJavaScriptrequests计算机软件
岗位职责:
1、负责设计和开发高效、稳定的网络爬虫系统,从各种数据源中抓取数据;
2、对抓取到的数据进行清洗、去重、转换等处理,确保数据的质量和准确性;
3、解决爬虫过程中遇到的各种技术问题,如反爬机制、IP封锁、验证码识别等;
4、持续优化爬虫策略和算法,提高数据抓取的效率和覆盖率;
5、与数据分析师、开发团队等合作,将抓取到的数据集成到公司的数据平台或应用中。
任职要求:
1、计算机、软件工程等统招本科及以上学历,应届生或有相关开发经验;
2、熟练掌握至少一门编程语言 Python、Java 等,熟悉常用的爬虫框架和工具,如 Requests、BeautifulSoup、Selenium(Python)/Jsoup、OkHttp、Selenium(Java) 等;
3、熟悉 HTTP 协议、HTML、CSS、JavaScript 等,能够分析网页结构和数据提取逻辑;
4、熟悉数据库操作,如 MySQL、MongoDB等;
5、了解分布式爬虫架构和技术,能够应对各种复杂的反爬机制;有大规模数据抓取经验者优先;
6、对数据敏感,有数据分析和挖掘经验者优先;
7、具有良好的专业素养,有较好的学习能力,有分析问题、解决问题的能力,有较好的领悟力和执行力;
8、工作积极互动,责任心强,服从安排,身心健康,有一定的抗压能力;
9、善于沟通,具备较好的团队合作精神。
查看全部

工作地点

闵行区上海通用识别技术研究所(西门)恒南路1000号(国家电网对面)2号楼

职位发布者

姬女士/人事招聘

刚刚活跃
立即沟通
上海现代通用识别技术有限公司
上海现代通用识别技术有限公司是专门从事高端证件的防伪设计和制作、个性化数码印刷服务的国有企业,承担过许多重要身份识别项目的设计研发工作,国家和地方重要证件的设计制作,并积极努力参与市场竟争,为社会开发了一系列相关技术产品。公司拥有先进的管理系统,通过了具有"国际贸易通行证"之称的ISO9001国际质量体系认证,保证了每个产品成本合理、质量稳定、性能可靠。公司拥有一批一流的研发人才保证了技术不断创新,新品层出不穷。近些年来公司在技术创新方面取得了不斐的成绩:证件塑卡防伪印刷方面:我们拥有一支高水平的设计、制版、印刷专业技术人才队伍,在印刷防伪工艺上具有独步的多方位的技术手段、配合先进的设计软件和一流的工艺设备,能够为用户提供具有高防伪性、质量上乘、数字准确的高端防伪产品,如各种塑卡和纸质证件和有价证(券)以及证书等。在防伪印刷工艺、技术和材料和的开发方面我们注重特种材料和特殊工艺的研究和开发,主要产品有:特种纸张、特种油墨、激光全息、装帧材料、微型标识等。在数码印刷方面:我们拥有目前先进的富士施乐数码印刷机,可以为我们的客户提供从各种数码图文设计、彩色黑白数码快印、可变数据快印等个性化,同时提供全套的印后加工服务。在技术研发方面:拥有高技术研发人员,针对特定项目开展定制化研发服务。公司位于闵行区浦江镇863软件孵化基地内,环境优美、设施完备、配套齐全。除了通过ISO9001质量管理体系的认证、高新企业认证外,我公司还具备上海市保密局下发的保密印刷的资质,还拥有一支年轻,富有开拓创新精神的团队。今后我们还将不断的健全经营机制,完善管理模式,优化服务体系,竭诚为您担供优质便捷的服务。
公司主页