岗位职责:
1.参与研究院数据库的整体设计、模型构建、技术选型与持续优化;
2.负责ETL(抽取、转换、加载)流程的开发、测试、上线与性能优化。熟练掌握大数据处理框架(如Hadoop、Spark、Flink),进行数据计算、清洗、整合与挖掘工作;
3.负责数据质量管理、元数据管理及数据全生命周期管理,分析并解决数据相关问题,确保数据的准确性、一致性与安全性;
4.深入理解业务需求,将业务问题转化为数据解决方案。协助设计数据产品、可视化工具或分析报告,为业务决策提供数据支持;
5.针对特定任务进行需求分析,实现基础原型系统的设计开发;
6.完成领导交办的其他工作。
任职要求:
1.硕士及以上学历,应届生需博士学历;计算机、通信等相关专业;熟练掌握SQL语言,深入理解数据库事务、索引、锁等核心机制。具有至少一种主流关系型数据库(如MySQL、PostgreSQL)和一种大数据存储组件(如HBase、ClickHouse、Doris)的实际操作经验;
2.至少精通C/C++、Python或JAVA中的一门编程语言,具备良好的编码习惯和工程能力。熟悉Hadoop、Spark、Flink等大数据生态组件,有实际开发或调优经验者优先;
3.具备数据挖掘、机器学习算法基础,能够使用Python及相关库(如Pandas, NumPy, scikit-learn)进行数据分析、建模者优先;
4.拥有3年及以上大数据开发、数据仓库建设或数据库工程相关工作经验的优先考虑;有能源、电力、工业物联网或智慧城市相关行业大数据项目经验者将获得重点考虑;
5.具备出色的逻辑分析能力、问题解决能力和技术攻关能力;
6.善于沟通,能够清晰理解业务需求并与跨职能团队协作;
7.拥有强烈的责任心、主动学习能力和抗压能力,能适应快速发展的技术环境。