职位描述
数据爬虫云计算计算机软件产业互联网平台软件/IT服务
岗位职责
数据采集
数据采集
1. 设计并实现网络爬虫程序,采集互联网公开数据
2. 解析HTML/XML/JSON数据结构,提取结构化数据
3. 使用代理IP池和反反爬策略应对目标网站限制
数据处理
数据处理
1. 清洗和预处理采集数据,去除冗余和噪声
2. 构建数据校验规则,确保数据准确性和完整性
GIS应用
GIS应用
1. 使用ArcGIS/QGIS进行空间数据可视化分析
2. 整合地理信息数据与业务数据生成空间报告
系统维护
系统维护
1. 监控爬虫运行状态,优化采集效率和稳定性
2. 定期维护采集工具和存储系统
任职要求
1.在读本科/研究生(计算机/地理信息/数学类专业优先)
2.. 熟练使用Python及Scrapy/BeautifulSoup/PyQuery等爬虫框架
2.. 熟练使用Python及Scrapy/BeautifulSoup/PyQuery等爬虫框架
3. 熟悉正则表达式、HTTP协议及常见反爬机制
5. 掌握MySQL/PostgreSQL数据库操作
5. 有数据清洗与处理项目经验
加分项
1. 熟悉ArcGIS/QGIS等GIS工具者优先
2. 了解PostGIS空间数据库者优先
3. 有分布式爬虫开发经验者优先
能力素质
1. 逻辑思维清晰,具备问题排查能力
2. 每周可稳定实习4-5天
转正机会:表现优异者可获得2026届校招直通终面资格
展开该职位详情
工作地点
北京昌平区石头科技大厦

工作地点

公司信息
淘数科技(北京)有限公司
未融资 · 20-99人 · 云计算、产业互联网平台
已审核
公司介绍
淘数科技(北京)有限公司成立于2010年,位于北京昌平区,是一家数字智能领域的国家高新技术企业,主要为政企客户提供基于大数据和人工智能的数字智能产品和解决方案。 核心优势 : 数据能力 ——收录中国全量6686万企业数据,1.63亿个体工商户数据,覆盖更全面、时效性更高、信息更精准。 分析能力 ——专业的数据分析师、行业分析师团队,擅长针对客户业务需求,提供完整的深度解决方案,与华夏幸福产业研究院、北京大学、社科院等多家科研机构开展深度合作。 行业经验 ——覆盖经济监测、商业决策等众多应用场景,为全国各地省市、产业园区提供产品服务,与中国电信、中国联通、海航集团等多家头部机构深度合作,落地数百个标杆项目案例,得到各界客户高度评价。 团队实力 —— 淘数拥有来自中国人民银行、百度、腾讯、微软中国等知名机构,清华大学、北京大学、哈尔滨工业大学、天津大学、北京邮电大学、北京理工大学等知名院校的成熟技术团队。 我们的使命 研发数字智能产品和解决方案 辅助政府科学执政、帮助企业科学决策 为国家经济发展、民族伟大复兴贡献智慧 我们将以市场角度的场景化应用为研发目标,汇聚能解决实际问题的高端技术人才,充分调动创造力,切实解决政府、企业在数字经济时代发展中的诸多问题,助力产业结构优化升级,产业效率效益提升。
工商信息
企业名称 淘数科技(北京)有限公司
企业类型 有限责任公司(自然人投资或控股)
法人代表 王诚渌
经营状态 存续
成立时间 2010-07-29
注册资本 1000万元
认证资质
营业执照信息
相似职位
查看更多字节 AI数据采集(双休包三餐)

本科
1-3年
可视化
Python
传感器
视觉模型
AI
人工智能
包三餐
带薪培训
五险一金
周末双休
无限量下午茶
最新招聘
热门城市
热门职位
热门公司
景县老孟渔具门市部
老河口市陈正有粮行
山东鑫君顺食品有限公司
重庆聚友机械设备销售有限公司
扬州伟仔网络科技有限公司
天津市静海区仟讯数码电子产品店
海南富冠医疗科技有限公司
九台市上河湾镇龙宏种植业农民专业合作社
四川碧智诚环保科技合伙企业(有限合伙)
长沙银行股份有限公司城步支行
大同招聘
克拉玛依招聘
山南招聘
临沧招聘
朝阳招聘
忻州招聘
郴州招聘
克孜勒苏柯尔克孜招聘
天水招聘
澳门招聘
黔南招聘
南充招聘
兰州招聘
抚州招聘
乌审旗招聘
乌海招聘
双河市招聘
宁波招聘
漳州招聘
和田招聘





