岗位职责:
1、模型服务化与部署:主导大模型(LLM)的服务化开发,设计高性能、可扩展的模型API服务,支持高并发、低延迟的在线推理需求。
优化模型部署方案(如容器化/Docker、Kubernetes、模型量化剪枝),解决显存管理、动态负载均衡等工程问题。
构建模型监控体系,跟踪服务性能(如吞吐量、错误率)及业务指标(如AI输出准确率)。
2、跨系统集成指导:主导AI能力与现有软件系统(如ERP、CRM、OA)、数据平台(数据湖/数仓)及业务流程的集成,设计标准化接口规范。
针对复杂业务场景(如智能客服、自动化报告生成),设计端到端AI解决方案,协调前后端、数据团队完成联调。
制定数据流转方案,确保输入输出数据与业务系统兼容(如结构化数据转换、非结构化文本处理)。
基本要求:
1、3年以上AI工程化经验,至少主导过1个以上AI系统集成项目(如将大模型嵌入企业工作流)。
2、精通Python。
3、本科及以上学历。
加分项:
1、具备跨团队协作经验,能撰写技术方案书并面向非技术角色宣讲。
2、有LLM应用中间件开发经验(如流量控制、缓存机制、审计日志)。