主要职责:1. 负责图像分割、目标检测、图像识别等视觉算法的研发、训练与调优;
2. 探索多模态大模型在跨模态理解、生成与推理任务中的应用;
3. 基于智能体开发框架(如LangChain、Dify、MetaGPT、LangGraph等),构建具备感知、决策与交互能力的视觉智能体;
4. 实现多模态输入(图像、文本、语音)的融合处理与任务驱动式响应;
5. 理解智能体生态的关键协议与标准(如MCP、A2A等),进行MCP工具的相关开发,并实现多智能体通信;
6. 参与CV和人工智能相关的业务系统设计、开发、集成等工作;
7. 参与模型压缩、量化及推理加速,优化系统资源消耗与响应效率;
跟踪计算机视觉、多模态学习、智能体等领域的前沿进展,推动技术迭代与团队能力建设。
任职资格:1. 硕士及以上学历,计算机、人工智能、电子工程等相关专业,具有图像算法研发经验;
2. 掌握深度学习框架(PyTorch/TensorFlow),掌握计算机视觉和图像处理的常用方法(目标检测、图像分割、图像识别),具备YOLO、U-Net等模型实战经验;
3. 具备多模态大模型(如Qwen-VL、LLaVA、GPT-4V)的微调与部署经验,熟悉视觉-语言联合训练方法;
4. 掌握常用的编程语言(如Pyhton、Java等),有扎实的编程能力;
5. 至少熟悉一种智能体开发框架(如LangChain、Dify、MetaGPT、LangGraph等),并有实际项目应用经历;
6. 对智能运维产业发展有浓厚兴趣,具有强烈的进取心,产品需求和新技术敏锐度高;