更新于 1月28日

行业数据采集实习生

120-150元/天
  • 北京昌平区
  • 本科
  • 实习
  • 招1人
  • 3个月
  • 5天/周

职位描述

可转正实习证明数据爬虫PythonSQLScrapy云计算/大数据
岗位职责
1、负责制定行业数据采集策略与方案,针对目标行业的政策法规、市场动态、竞争对手、产业链上下游等关键信息,规划数据采集范围、来源与频率。
2、搭建并优化数据采集体系,运用爬虫技术高效采集公开数据,确保采集渠道的稳定性与合法性。
3、负责数据的清洗、校验、整合与标准化处理,识别并处理数据缺失、重复、异常等问题,提升数据质量,构建结构化数据资产,保障数据的准确性、完整性与时效性。
4、负责数据采集工具与分析模型的日常维护与迭代优化,跟踪行业数据采集技术的前沿动态,引入新工具、新方法提升数据采集与分析效率。
5、配合业务部门完成专项数据需求调研与分析工作,协助解决业务开展过程中的数据相关问题,推动数据价值在各业务环节的落地应用。
5、建立数据安全与合规管理机制,确保数据采集、存储、使用全流程符合国家相关法律法规及公司数据安全规范。
任职要求
1、 本科及以上学历,统计学、数学、计算机科学、信息管理、经济学等相关专业优先;
2、 有行业数据采集、数据分析相关工作经验,有固定行业数据分析经验者优先;
3、具备良好的职业道德,严格遵守数据合规要求,有强烈的责任心与严谨的工作态度。
4、精通至少一种爬虫技术框架(如Scrapy、PySpider),熟练使用Python/Java等编程语言进行数据采集脚本开发,能够应对反爬机制(如IP代理、验证码识别、动态页面解析等);
5、熟练掌握SQL语言,能够熟练使用MySQL、Oracle等至少一种数据库进行数据查询、提取与加工;
6、掌握数据清洗、转换、整合的常用方法,熟悉Excel高级功能(如数据透视表、函数公式),能够使用Pandas、Numpy等工具进行数据处理;
7、具备基础的数据分析与可视化能力,能够使用Matplotlib、Seaborn、Tableau、Power BI等工具制作数据图表,清晰呈现分析结果;
8、了解行业数据来源渠道,具备独立规划并执行数据采集项目的能力,能够快速响应业务数据需求;
9、具备良好的逻辑思维能力、数据分析能力与问题解决能力,能够从海量数据中挖掘核心信息与商业洞察。
10、 具备优秀的文字撰写能力,能够独立完成高质量的数据分析报告;
11、具备良好的沟通协调能力与团队协作精神,能够高效配合业务部门开展工作;
12、具备较强的学习能力与抗压能力,能够快速适应行业变化与工作挑战;
13、有良好的细节把控能力,对数据的准确性、完整性有较高的敏感度。

工作地点

北京昌平区石头科技大厦

职位发布者

赵女士/人事经理

今日活跃
立即沟通
公司Logo淘数科技(北京)有限公司
淘数科技(北京)有限公司成立于2010年,位于北京昌平区,是一家数字智能领域的国家高新技术企业,主要为政企客户提供基于大数据和人工智能的数字智能产品和解决方案。核心优势:数据能力——收录中国全量6686万企业数据,1.63亿个体工商户数据,覆盖更全面、时效性更高、信息更精准。分析能力——专业的数据分析师、行业分析师团队,擅长针对客户业务需求,提供完整的深度解决方案,与华夏幸福产业研究院、北京大学、社科院等多家科研机构开展深度合作。行业经验——覆盖经济监测、商业决策等众多应用场景,为全国各地省市、产业园区提供产品服务,与中国电信、中国联通、海航集团等多家头部机构深度合作,落地数百个标杆项目案例,得到各界客户高度评价。团队实力——淘数拥有来自中国人民银行、百度、腾讯、微软中国等知名机构,清华大学、北京大学、哈尔滨工业大学、天津大学、北京邮电大学、北京理工大学等知名院校的成熟技术团队。我们的使命研发数字智能产品和解决方案辅助政府科学执政、帮助企业科学决策为国家经济发展、民族伟大复兴贡献智慧我们将以市场角度的场景化应用为研发目标,汇聚能解决实际问题的高端技术人才,充分调动创造力,切实解决政府、企业在数字经济时代发展中的诸多问题,助力产业结构优化升级,产业效率效益提升。
公司主页