更新于 1月21日

大模型算法工程师

1.5-2.5万·13薪
  • 南京雨花台区
  • 3-5年
  • 本科
  • 全职
  • 招1人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 氛围活跃
  • 人际关系好
  • 团队执行强

职位描述

深度学习机器学习语音识别人工智能云计算/大数据运营商/增值服务
岗位职责:
1、大模型业务化微调与训练
①面向具体业务场景,完成大模型的指令微调(SFT)、偏好对齐训练(如GRPO/RL相关方法)与持续迭代;
②负责训练数据体系建设:数据清洗、标注规范、指令构造、偏好数据构造、训练集/评测集划分与版本管理;
③设计并优化训练策略与超参(LoRA/QLoRA、全参微调、混合训练等),提升效果与训练效率;
④负责训练稳定性与成本优化:显存优化、吞吐优化、分布式训练、故障排查与恢复。
2、大模型智能体(Agent)开发与落地
①设计并实现面向业务的智能体能力:工具调用(Function Calling/Tool Use)、多步推理、任务分解、工作流编排;
②构建/优化RAG、记忆(Memory)、规划(Planning)、反思(Reflection)、多智能体协作等模块,提升可控性与可靠性;
③将智能体能力与线上系统集成,支持可观测、可回放、可评估与可迭代。
评测与工程化交付。
3、建立覆盖业务指标与通用能力的评测体系(自动评测+人工评测),输出可量化的迭代报告;
4、搭建训练/推理/评测的工程化流水线(CI/CD、实验管理、模型版本管理、灰度与回滚);
5、与产品、业务、后端/平台团队协作,推动从PoC到规模化落地。
任职要求:
1、计算机/数学/统计/相关专业本科及以上,3年以上算法或NLP/深度学习相关经验(优秀可放宽);
2、扎实的机器学习/深度学习基础,熟悉Transformer、LLM训练范式与常见对齐思路;
3、熟练使用Python,掌握PyTorch及常用训练框架(HuggingFace Transformers、DeepSpeed、FSDP、Megatron等其一或多个)。
4、有SFT/偏好对齐(如GRPO、PPO、DPO、ORPO等)落地经验,能独立完成从数据到训练到评测的闭环;
5、熟悉LoRA/QLoRA、量化(AWQ/GPTQ等)、混合精度训练、梯度累积、显存/通信优化;
6、能针对业务问题设计有效的数据策略与prompt/指令体系,具备较强问题定位能力;
7、熟悉Agent相关框架或模式(LangGraph/LangChain、OpenAI function calling范式、ReAct等),有工具调用与工作流编排实践;
8、具备良好工程素养,能将模型能力稳定上线并持续迭代(监控、日志、回放、A/B实验等)。
加分项:
有大规模分布式训练实战经验(多机多卡、RDMA/NCCL调优、训练故障处理);
在中文对话、知识问答、内容生成、客服/销售、代码生成、检索增强等场景有成功案例;
熟悉高质量数据合成、自动标注、对抗数据、蒸馏(KD)、模型压缩与推理加速(vLLM/TensorRT-LLM);
有论文/开源贡献/竞赛成绩,或主导过LLM平台化建设。

工作地点

南京雨花台区东久创新中心

职位发布者

徐娅菁/招聘配置助理专家

昨日活跃
立即沟通
公司Logo亚信科技(中国)有限公司
亚信科技是中国领先的信息科技产品及服务提供商,拥有丰富的软硬件产品开发和大型工程实施经验。公司深耕市场超过 30年,在 5G、云计算、大数据、人工智能、物联网、数智运营、业务及网络支撑系统(BSS&OSS)等领域具有先进的技术能力和众多成功案例,客户遍及通信、广电、能源、交通、政务、金融、邮政等行业。近年来,亚信科技持续聚焦云网、数智、IT三类产品的研发,并结合咨询规划、数智运营和系统集成能力,不断向“产品与服务双领先”目标迈进。2024年公司进一步提出“四个转变”发展战略,聚焦打造 5G专网、边缘智能、信创数据库、大数据与可信数据流通、xGPT等战略级软件及软硬一体产品,并加强向非通信及国际市场的开拓。亚信科技始终致力于将 5G、人工智能、大数据等数智技术赋能至百行千业,与客户共创数智价值。面向未来,公司将努力成为最可信赖的数智价值创造者,并依托数智化全栈能力,创新客户价值,助推数字中国。
公司主页