岗位职责:
1. 大模型训练与调优
• 负责大模型(NLP / CV / 多模态)相关的微调(SFT)、精调、蒸馏、剪枝与量化压缩等工作,输出可在业务侧稳定落地的模型能力;
• 依据业务需求主导训练数据的选取、清洗、标注规范制定与预处理流程搭建,设计训练方案与超参配置,并对训练效果进行系统性评估与分析;
• 持续跟踪、验证与对比主流开源模型性能(如 LLaMA、Baichuan、DeepSeek 等),结合业务场景进行基线选型与优化策略制定;
• 研究并落地 Prompt 工程、LoRA / QLoRA、RAG 等调优技术,形成可复用的能力组件与最佳实践。
2. AI 平台与应用研发(前后端 / 全栈)
• 负责智能体平台、AI 应用平台、数据治理平台等产品的前后端 / 全栈研发,实现大模型能力对内对外的产品化与服务化;
• 设计并实现模型服务接口、推理服务、特征服务与任务编排等模块,为算法能力提供高可用、高性能的在线服务支撑;
• 与产品经理、设计师、算法团队紧密合作,完成需求分析、技术方案设计与高质量交付,持续打磨用户体验与平台可用性;
• 参与平台架构设计与演进,引入合理的缓存、消息队列、服务拆分等手段,提升系统的稳定性、可扩展性与可维护性。
3. 工程化与 DevOps
• 搭建并持续优化大模型训练与推理的工程化流程,包括数据流水线、训练流水线、评测流水线与上线流程;
• 搭建 DevOps / MLOps 流程,实现代码、模型与配置的自动化构建、测试、部署与监控(CI/CD);
• 负责关键服务的性能优化与监控报警体系建设,保障系统在高并发与复杂场景下的稳定运行;
• 参与制定与优化模型评测指标体系,输出规范化的评测报告与技术决策建议。
4. 技术前瞻与生态建设
• 持续关注大模型、智能体、多模态、RAG 等前沿技术及社区动向,评估其在公司场景中的落地价值;
• 熟悉并参与国产大模型生态与开源社区,结合内部需求选择合适的基座模型与工具链;
• 沉淀技术文档、最佳实践与内部培训内容,提升团队在大模型与 AI 平台方向的整体技术能力。
任职要求:
• 本科及以上学历,计算机、软件工程、人工智能、电子信息等相关专业;
• 3 年及以上相关工作经验,具备自然语言处理、计算机视觉或多模态模型研发经验,同时具备扎实的后端或全栈工程经验。
• 扎实的机器学习 / 深度学习基础,熟练掌握 PyTorch或等主流深度学习框架,并有实际模型训练与调优经验;
• 熟悉大模型相关技术栈:Prompt 工程、LoRA / QLoRA、RAG、知识蒸馏、模型压缩与推理加速等,并至少在其中一到两个方向有实战经验;
• 理解通用预训练模型(如 LLaMA、Baichuan、DeepSeek 等)的基本原理与使用方式,能基于业务场景进行二次开发与优化。
• 熟练掌握至少两种主流技术栈:前端:React / Vue / TypeScript 之一;后端:Python / Java / Node.js 之一;
• 熟悉主流数据库(如 MySQL / PostgreSQL 等)、缓存(Redis)、消息队列(Kafka 等)及其在高并发、分布式场景下的应用;
• 具备良好的代码质量意识与工程实践能力,熟悉单元测试、接口测试与性能测试等基础工程能力。
• 具备较强的需求理解与抽象建模能力,能够在业务目标与技术实现之间做好平衡与取舍;
• 良好的沟通协作能力与跨团队合作经验,能推动产品、算法、平台等多方协同落地复杂项目;
• 具备成熟的工程落地能力(线上业务、平台系统等)。