【工作内容】
1.处理多类型数据集,包括图像、视频、文本、JSONL、HDF5 等格式。
2.执行数据清洗、格式转换、标注整理、结构化存储、数据质量检查等任务。
3.使用 OpenCV、NumPy、PIL、Torch.Tensor 等工具进行图像/视频处理与数据预处理。
4.开发基础的数据可视化能力(如数据质量展示、分布分析、采样预览等),并可借助 AI 工具辅助开发效率。
5.编写稳定可复用的数据处理脚本、工具组件或流程自动化 pipeline。
6.输出清晰规范的数据文档,包括数据结构、处理方法、问题记录与变更说明。
【岗位要求】
1.本科及以上学历,计算机、电子信息、软件工程、人工智能、数学、统计学或相关专业优先。
2.熟练使用 Python 进行数据处理开发,掌握常用工具库,如: NumPy、Pandas、PIL、OpenCV、pytorch等
3.熟悉 Linux 环境、Shell 脚本、Git 基本使用能力。
4.熟悉常见数据格式解析,包含 JSON、JSONL、CSV、TXT、图像格式、视频编码格式、HDF5 等。
5.熟悉基础数据结构、处理流程设计与性能优化。
6.AI 工具使用能力:具备使用 AI 工具提升开发效率的习惯,能够将其应用于代码生成、文档撰写、调试与自动化流程辅助,例如:
ChatGPT / Claude / Gemini / Qwen
Cursor / Windsurf / Aider / Devin-like coding assistants
Copilot / Codeium / JetBrains AI Assistant
可根据需求使用 AI 辅助数据处理脚本生成、格式转换、自动标注辅助、可视化脚本优化等场景
【工作时间】早十晚七,周末双休
【薪资待遇】11-13k