该职位已失效,看看其他机会吧

AI开发工程师(成都MG)

1-1.8万
  • 成都双流区
  • 3-5年
  • 大专
  • 全职
  • 招2人

职位描述

Ant DesignAngularLeafletPython
位职责(成都AIGC方向top组,该岗位签移动咪咕三方外协,介意外包勿扰
岗位职责:
1、负责模型部署体系的建设,与算法团队深度合作,管理云上约300卡算力,设计并实现标准化的模型部署流程、容器化方案、服务化封装及灰度发布策略,保障模型从研发到线上服务的稳定、高效流转。
2、主导模型加速技术栈的研发与落地,包括但不限于量化/蒸馏、音视频合成、分布式推理加速等,最大化模型性能与推理效率。负责训推AI infra工作,支撑多机多卡大模型训练、推理全流程的高效落地。
3、聚焦智能体架构与AIGC 工作流链路,设计并实现Agent工程化底座(包括Skills、记忆/知识库、MCP/A2A协作等),搭建标准化、可复用的 ComfyUI 工作流框架。
4、开展服务端工程开发,构建高可用、高并发、低延迟的 AI 服务架构,设计合理的服务治理、监控告警、日志追踪体系,支撑大规模业务流量下的服务稳定性。
5、对接AI产品和算法团队,打通算法研发与工程落地的壁垒,推动 AI infra在音乐大模型、智能体、AIGC 等方向的规模化应用。跟踪 AI 工程领域前沿技术(如新型加速框架、分布式训练、AIGC 工作流、Agent标准化方案等),形成可复用的技术方案与工具链。
岗位要求:
1、3年及以上 AI 工程相关工作经验,具备大模型训推、模型加速、模型部署、AI微服务落地相关项目经验,有智能体工程、AIGC工作流开发经验者优先。
2、熟悉Python、Java、PyTorch等,熟悉分布式训练如 DeepSpeed、Megatron-LM等。深入掌握Trt、Vllm模型加速技术栈,熟悉量化/蒸馏、多卡并推、算子融合等,有实际业务落地案例者优先。
3、熟练掌握模型部署全流程,具备容器化(Docker、K8s)、服务化开发经验。掌握 gRPC、HTTP/gRPC 等通信协议,熟悉Kafka、MQ、Nginx、MySQL等中间件,有服务治理、监控告警(Grafana)、日志追踪等实践经验。
4、熟悉智能体工程与AIGC 工作流工程,了解智能体的核心模块,能搭建 AIGC 工作流的工程化体系,有 LangChain 等框架使用经验或相关工作流开发经验者优先。
5、具备良好的系统设计和架构能力,有责任心、自驱力、业务sense、乐与沟通,能高效对接算法、业务、运维等团队,推动技术方案落地与迭代。
查看全部

工作地点

双流区中国移动(成都)产业研究院

认证资质

营业执照信息

职位发布者

陈燃/HR

昨日活跃
立即沟通
公司Logo新讯数字科技(杭州)有限公司北京分公司
新讯数字科技(杭州)有限公司(简称“新讯”、“EB”),曾用名“杭州东信北邮信息技术有限公司”,由北京邮电大学廖建新教授以其主持研发的移动智能网核心技术为基础,于2000年2月创建。公司现有员工约1800人,在全国二十多个省、自治区、直辖市设立了分公司/办事处,拥有投资近4000万元的大型系统实验室。经过二十余年拼搏,已形成了立体化产品矩阵,覆盖核心网络通信、高性能媒体处理、大数据与AI、通信安全、物联网等DICT领域,为现网近10亿用户提供电信级服务。目前,公司已经成为国内运营商的重要战略合作伙伴和移动通信领域的主要支撑厂商。
公司主页