该职位已失效,看看其他机会吧

数据治理工程师

1.3-1.5万
  • 杭州余杭区
  • 1-3年
  • 本科
  • 全职
  • 招1人

雇员点评标签

  • 同事很nice
  • 工作环境好
  • 人际关系好
  • 氛围活跃
  • 团队执行强
  • 管理人性化
  • 准时发工资
  • 实力大公司

职位描述

数据挖掘Python互联网云计算/大数据
岗位职责
1. 数据全链路治理
● 负责搭建从数据采集、清洗到存储的全流程自动化系统,确保数据时效性、完整性及合规性。
● 设计反爬虫对抗策略(如IP池管理、请求频率控制、验证码破解等),突破目标网站限制。
2. 非标数据结构化
● 针对文本、图片、视频等非结构化数据,开发定制化解析算法(如正则表达式、OCR识别、深度学习模型)。
● 构建数据标注体系,为AI模型训练提供高质量标注样本(如实体识别、情感分析、语义分类等)。
3. 数据资产运营
● 基于业务需求(如舆情监测、用户画像、竞品分析),挖掘数据价值并生成可视化报告。
● 通过A/B测试验证数据策略效果,驱动爬虫系统与算法模型的迭代优化。
4. 技术工具研发
● 优化分布式爬虫框架(如Scrapy+Kafka+Spark),提升系统吞吐量及稳定性。
● 开发自动化监控与报警系统,实时追踪数据质量及爬虫运行状态。
任职要求
1. 学历与专业
● 本科及以上学历,计算机科学、软件工程、统计学、信息管理与信息系统等专业优先。
2. 技术能力
● 精通Python/Java/Go,熟悉Scrapy框架及多线程/异步编程。
● 熟练使用数据库(MySQL/Redis/MongoDB)及数据清洗工具(Pandas/Numpy)。
● 了解HTTP协议、前端技术(HTML/CSS/JavaScript),具备反爬虫经验。
3. 核心能力
● 具备数据敏感度,能快速定位数据质量问题并提出解决方案。
● 熟悉数据隐私合规要求,确保数据采集符合法律法规。
4. 软素质
● 逻辑思维清晰,能拆解复杂业务需求为可执行的技术方案。
● 抗压能力强,能在数据时效性要求下高效完成工作。
加分项
● 有大规模分布式爬虫系统开发经验(如日爬取量超千万级)。
● 熟悉深度学习在数据增强/去噪中的应用(如BERT、GPT等模型)。
● 具备数据安全风控经验(如数据脱敏、溯源追踪)。
● 有区块链/大数据平台(如Hadoop/Flink)开发经验。
查看全部

工作地点

杭州市-余杭区-文一西路969号c区

认证资质

营业执照信息

职位发布者

孙金栋/HRBP

昨日活跃
立即沟通
公司Logo中电金信软件有限公司公司标签
中电金信,是中国电子旗下成员企业,通过持续研发创新,参与国家重大工程,依托行业场景,构建金融级数字底座,打造全栈全域解决方案,提供领先的咨询、软件产品及开发、质量安全保障及运营服务,为金融及重点行业数智化转型及安全发展提供强大动能,并以中国数智化转型最佳实践服务全球。我们推崇开放包容的文化。在中电金信,你将和同样拥有热情和梦想的优秀队友一起合作、交流和学习,稳扎稳打不断提升,和团队一起助力国家重大工程项目。我们为你提供清晰的职业路径和不设限的发展机会,你将通过不同类型的项目不断成长,获得前所未有的荣耀感和使命感,和我们一起去创造数字时代的美好未来。
公司主页