岗位职责:
1. 负责大模型(LLM/多模态)的预训练、微调、对齐、推理优化等算法研发与迭代。
2. 参与模型结构设计、训练策略优化、数据构建与清洗、效果评估体系建设。
3. 结合业务场景(如对话、内容生成、检索增强、工具调用等)进行模型适配与落地。
4. 跟踪业界前沿技术,推动大模型相关算法在产品中的工程化与性能提升。
5. 与工程、产品、数据团队协作,完成从算法原型到线上服务的全流程开发。
任职要求:
1. 1年及以上大模型研发经验。
2. 扎实的机器学习/深度学习基础,熟悉 Transformer 架构、预训练与微调范式。
3. 熟练使用至少一种主流框架:PyTorch/TensorFlow/JAX,有大规模分布式训练经验。
4. 具备以下经验:LLM 预训练、SFT、DPO/RLHF 对齐经验或多模态大模型、文生图/文生视频经验或模型量化、蒸馏、加速、推理优化经验或RAG、智能体(Agent)、插件调用等落地经验。
5. 优秀的问题分析与工程实现能力,有顶会论文或开源项目贡献者。