更新于 今天

数据负责人

2.5-5万
  • 上海黄浦区
  • 5-10年
  • 本科
  • 全职
  • 招1人

职位描述

数据
职位概要
我们正在寻找⼀位兼具技术深度与管理能⼒的“数据负责⼈”,能够统筹公司整体数据体系建设,负责数据采集、集成、清洗、存储、特征加⼯及数据质量管理等全流程⼯作。
该职位要求候选⼈既能亲⾃下场解决复杂数据问题,也能带领⼩团队打造稳定、⾼质量的数据基础设施,为公司后续的算法、分析与产品提供坚实⽀撑。
主要职责
1. 数据架构规划与实施
负责数据平台架构设计,建⽴从原始数据到特征数据的全流程标准;
优化数据流转、同步与更新机制,确保系统的稳定性、可扩展性与成本效率。
2. 数据采集与整合
设计与维护多源数据接⼊(API、爬取、⽂件批量导⼊等);
负责供应商或外部数据源的技术对接、格式转换与数据验证。
3. 数据清洗与质量管理
建⽴⾃动化的数据清洗、校验和异常监控机制;
设计数据标准化流程(⽇期、时区、单位、ID匹配等),保证数据⼀致性与可追
溯性。
4. 特征⼯程与数据加⼯
建⽴特征⽣成与管理体系(版本控制、时间窗⼝、延迟期、可复现性);
与建模团队协作,优化特征设计及数据交付效率。
5. 数据平台与基础设施
规划并管理数据存储、备份、权限、安全与合规;
参与数据集群、管道调度、数据湖或数仓的设计与维护。
6. 团队建设与管理
招聘、培养并带领数据⼯程师团队;
制定研发规范与流程,推动代码质量与团队协作效率提升。
任职要求
技术能⼒
精通 Python 与 SQL,熟悉主流数据库与分布式计算框架(如 Spark、
ClickHouse、Presto、Flink 等);
熟悉 数据编排⼯具(Airflow、Prefect、Argo等)与任务调度机制;
了解 云端与容器化环境(AWS、GCP、K8s、Docker);
具备数据质量管理与⾃动化测试经验(如 Great Expectations、Soda、⾃研框架
等);
理解时间序列数据与特征滞后处理,熟悉版本化数据管理与数据契约概念;
具备基础的Linux、Git、CI/CD 流程知识。
经验背景
5年以上数据⼯程或数据平台搭建经验;
⾄少2年技术团队管理或项⽬负责⼈经验;
有复杂系统中构建⾼可⽤数据架构的成功案例;
熟悉多源异构数据治理与数据合规(隐私、版权、使⽤协议等)。
个⼈特质
强执⾏⼒与问题导向,能独⽴解决模糊环境下的复杂问题;
既有战略思维,⼜愿意亲⾃编程和调试;
注重质量、稳定性与⼯程可复现性;
善于跨部门沟通,能与算法、运维、业务等多⽅⾼效协作。
加分项(可选但强烈欢迎)
有AI / NLP / ⼤模型 / 推荐系统 / ⻛控 / 科研数据等项⽬经验;
熟悉 特征商店(Feature Store)、数据湖(Data Lake)、数据契约(Data
Contract) 实践;
对数据可观测性(data observability)、特征漂移(drift)、数据版本化等有实战经
验;
有创业⼼态,愿意在⾼标准与⾼⾃由度的环境中搭建从0到1的体系。

工作地点

上海黄浦区瑞安广场

职位发布者

纵培培/高级顾问

刚刚活跃
立即沟通
公司Logo南京芷铭企业管理咨询有限公司
南京芷铭企业管理咨询有限公司,成立于2012年6月,专注于为石油化工及相关领域提供全方位的人力资源解决方案。历经十余年的稳健发展,芷铭咨询汇聚了一支由资深人力资源、合规法务专家组成的精英团队,建立了庞大的人才数据库,在石油化工、半导体、新能源、医药医疗、汽车等诸多领域积累了丰富的服务经验,并持续向各类国企、外企、民企、合资企业提供管理咨询、中高级专业的人才猎聘、人力资源外包、可覆盖全专业的项目管理外包服务。芷铭咨询以成为企业值得信赖的人力资源合作伙伴为目标,通过高效、专业的服务支持企业的长远发展,期待与您携手共同共创美好的明天。
公司主页