岗位职责:
1.负责数据抽取、清洗、对⻬、转换(ETL)构建数据 pipeline(批处理 / 流处理);
2.维护时序数据库(如 InfluxDB、TimescaleDB);
3.负责数据质量监控、异常检测、数据校验;
4.与⾏业专家协作,理解数据含义、标签逻辑;
5.与算法⼯程师协作,提供训练数据集、特征数据;
6.与后端协作,提供数据接⼝、数据服务;
7.编写数据⽂档、数据字典、数据规范。
任职要求:
1.熟悉 Python / SQL;
2.熟悉 ETL、数据清洗、数据建模;
3.熟悉时序数据处理、窗⼝函数、对⻬⽅法;
4.熟悉常⻅数据存储(MySQL、ClickHouse、TSDB);
5.有⼯业数据经验者优先;
6.有 Airflow / Prefect / Dagster 经验、 Kafka / MQTT / ⼯控数据经验、有特征⼯程经验者优先。