职位描述
Python多模态数据处理
职位介绍
1、负责多模态数据(包括但不限于文本、图像、视频、音频、3D点云等)的全生命周期管理,包括数据采集、清洗、去重、脱敏、标注规范制定及质量评估;
2、搭建和维护高效的多模态数据处理Pipeline,编写自动化脚本提升数据预处理效率,为多模态大模型(VLM/VLA)的训练、微调及评测提供高质量的数据支撑;
3、深入理解业务场景,配合算法团队进行跨模态数据的特征提取、对齐与增强,协助解决模型训练中的Badcase,通过数据迭代推动模型效果提升;
4、持续跟踪多模态大模型领域的前沿技术动态(如跨模态融合、多模态生成、多模态检索等),推动技术创新与业务价值转化。
岗位要求
1、硕士及以上学历,计算机、人工智能、自动化、数学等相关专业:
2、熟悉大数据建模和分析、计算机视觉、多模态大模型应用(VLA架构、Multi-Agent等)中的一至两项;
3、精通Python编程语言,熟练使用PyTorch、TensorFlow等深度学习框架,熟悉Hugging FaceTransformers/Datasets、 MMEngine 等多模态工具链,具备扎实的数据结构、算法基础和编程功底;
4、具备多模态数据处理实战经验,熟悉图像、语音、文本等多类型数据的预处理流程,掌握至少1种多模态数据标注工具的使用或定制开发能力;
5、具备良好的英语技术论文阅读能力,能高效检索国际前沿研究成果。
工作地点
南岸区重庆通用人工智能研究院

公司信息
公司介绍
重庆通用人工智能研究院(Chongqing Institute for General Artificial Intelligence,简称“重通院”或“CIGAI”)是由重庆市科学技术局举办,北京大学、北京通用人工智能研究院等优势单位合作支持建设的新型研发机构,于2025年9月正式挂牌成立。重通院聚焦技术创新、成果转化与产业赋能,围绕社会智能、具身智能、行业智能体方向开展产业应用研究,旨在打造国内领先的通用人工智能技术研发高地、高层次人才汇聚中心、关键核心技术攻关平台、产业赋能与社会治理创新基地。
工商信息
企业名称 重庆通用人工智能研究院
企业类型 事业单位
法人代表 叶晗
经营状态 --
成立时间 --
注册资本 --
认证资质
营业执照信息

更新于 5月18日




