更新于 2月6日

人工智能应用开发工程师(多模态方向)

1-2万
  • 成都武侯区
  • 经验不限
  • 本科
  • 全职
  • 招1人

职位描述

人工智能
岗位职责:
1.负责设计、开发与部署多模态人工智能应用,整合图像、视频、语音、文本等多种数据模态,构建下一代智能交互产品与解决方案。
2.实现多模态AI模型(如图文理解、跨模态检索、视觉问答、多模态生成等)的应用架构,完成从多源数据处理、模型联调到系统集成的全流程开发。
3.根据业务场景,进行多模态技术选型与算法工程化实现,优化多模型协同推理的效能,确保系统在高负载下的稳定与高效运行。
4.主导多模态AI应用的工程化落地,构建统一的服务框架以协调不同模态模型的调用与决策,并实现持续的迭代与性能优化。
5.监控多模态应用的综合表现,分析与解决跨模态任务中的性能瓶颈与一致性问题,持续提升系统精度与用户体验。
任职要求:
1.本科及以上学历,精通Python,熟悉PyTorch/TensorFlow;对多模态学习、视觉-语言模型(如CLIP、BLIP)、语音识别与合成及多模态大模型(如GPT-4V、DALL-E系列)有深入理解与实践经验。
2.工程化落地:具备复杂多模态系统架构设计能力,熟悉微服务与容器化技术(Docker/K8s),能够设计并实现支持多模型流水线协同的高可用服务。
3.性能优化:熟悉多模态模型的部署优化技术,包括但不限于模型剪枝、量化、蒸馏及使用TensorRT/ONNX Runtime进行加速;具备处理多路并发流媒体或大文件输入等实际场景的优化经验。
4.精通多模态数据处理流程(如图像/视频特征提取、语音预处理、文本嵌入等),熟悉向量数据库在跨模态检索中的应用;了解多模态场景下的MLOps工具链与监控方案,能够利用日志与指标定位跨模型协作问题。
5.具备出色的沟通与跨团队协作能力,能够与算法、前端、产品团队紧密合作;积极关注多模态生成、多模态Agent、具身智能等前沿领域进展,并具备快速实验和业务落地的能力。

工作地点

四川省成都市武侯区世纪城路66号

职位发布者

陈雪菲/人事经理

昨日活跃
立即沟通
四川观察合创新媒体发展有限公司
四川观察合创新媒体发展有限公司成立于2021年12月29日,注册资本3000万,公司成立以来发展迅速,业务不断壮大,现有业务模式有商业化IP合作、品牌宣传、品牌营销、产品推广、直播带货运营服务、内容孵化、创意策划、拍摄制作等。办公地点在四川广播电视台(世纪城路66号)。
公司主页