职位描述
PythonSql
岗位职责
1.负责结合公司业务场景,跟踪数据领域前沿技术并提升团队数据能力;
2.承担数据管道建设与数据预处理,完成多源数据采集、清洗、标准化及特征提取,提供高质量训练数据;
3.负责数据处理流程的工程化部署与优化,包括ETL任务调度、性能调优、数据质量监控及存储架构设计;
4.参与智能化项目中的数据系统设计,负责数据资产管理、数据仓库搭建及与业务系统的数据对接。
2.承担数据管道建设与数据预处理,完成多源数据采集、清洗、标准化及特征提取,提供高质量训练数据;
3.负责数据处理流程的工程化部署与优化,包括ETL任务调度、性能调优、数据质量监控及存储架构设计;
4.参与智能化项目中的数据系统设计,负责数据资产管理、数据仓库搭建及与业务系统的数据对接。
岗位要求:
1.计算机、数据科学、软件工程、信息与通信工程等相关专业本科及以上学历,3年以上数据开发或数据处理相关工作经验,能独立搭建数据管道并进行数据清洗、特征工程等开发工作;
2.熟悉数据仓库建模理论及ETL设计开发,能够与AI算法团队(NLP/CV方向)紧密配合,将业务数据转化为适用于模型训练的结构化、高质量数据集,熟悉数据质量管理和数据血缘追踪方法;
3.熟练掌握Python和SQL,精通Pandas、NumPy等数据处理库,具备Shell脚本编写能力;有Java/Scala开发经验者优先;
4.熟悉至少一种主流关系型数据库(如MySQL、PostgreSQL),有Kafka、Redis等消息中间件及缓存数据库使用经验优先;
5.具备大数据处理框架经验者优先,如ApacheSpark、Flink或Hive等;
6.熟练掌握ETL任务调度工具,有实际生产环境调度经验;
7.熟悉数据湖或数据仓库技术者优先;
8.熟悉Linux操作系统,有Docker、Kubernetes等容器化技术使用经验优先,了解CI/CD流程;
9.具有良好的沟通能力和团队合作精神,能够主动与算法工程师、后端开发人员进行需求对齐和问题排查;
2.熟悉数据仓库建模理论及ETL设计开发,能够与AI算法团队(NLP/CV方向)紧密配合,将业务数据转化为适用于模型训练的结构化、高质量数据集,熟悉数据质量管理和数据血缘追踪方法;
3.熟练掌握Python和SQL,精通Pandas、NumPy等数据处理库,具备Shell脚本编写能力;有Java/Scala开发经验者优先;
4.熟悉至少一种主流关系型数据库(如MySQL、PostgreSQL),有Kafka、Redis等消息中间件及缓存数据库使用经验优先;
5.具备大数据处理框架经验者优先,如ApacheSpark、Flink或Hive等;
6.熟练掌握ETL任务调度工具,有实际生产环境调度经验;
7.熟悉数据湖或数据仓库技术者优先;
8.熟悉Linux操作系统,有Docker、Kubernetes等容器化技术使用经验优先,了解CI/CD流程;
9.具有良好的沟通能力和团队合作精神,能够主动与算法工程师、后端开发人员进行需求对齐和问题排查;
薪资待遇及福利:
1、薪资待遇面议(包含基本工资、绩效工资、个人应承担的五险一金部分等),当月15日前入职即可缴纳五险一金。
2、试用期1个月,试用期薪资为80%,一经录取与第三方人力资源公司签订合同。(特别优秀者可以适当缩短试用期时间)。
3、采用标准工时制(国家法定节假日根据工作实际情况确定安排值班)
2、试用期1个月,试用期薪资为80%,一经录取与第三方人力资源公司签订合同。(特别优秀者可以适当缩短试用期时间)。
3、采用标准工时制(国家法定节假日根据工作实际情况确定安排值班)
4、工作地点:北京
5、上班时间:8:15--17:30
5、上班时间:8:15--17:30
工作地点
水务大厦北京市丰台区西四环南路188号16区20号楼

认证资质
营业执照信息

更新于 今天





