岗位职责:
1. 负责大模型调用链路与知识库平台的优化,利用RAG技术解决实际业务场景中的检索准确性与上下文理解难题,持续提升知识库问答的效果、稳定性及用户体验。
2. 维护并升级LLM任务框架与智能体应用平台,推动LLM在多任务场景下的落地应用,重点优化复杂任务的智能拆解、任务规划、工具调用以及长期记忆能力,提升Agent处理复杂问题的成功率。
3. 负责大模型与其他模型在训练推理平台上的部署与测试,结合算力调度平台进行资源的动态分配与负载均衡优化,利用Llama-Factory、vLLM、DeepSpeed、Ollama、Sglang等框架提供高效的模型能力支撑并攥写相关技术文档。
4. 负责跟踪和探索大语言模型及AI相关的前沿技术动态,结合实际业务场景提供创新的算法解决方案,参与前沿算法与应用研究,持续推动技术在实际产品中的转化与落地。
任职要求:
1. 三年以上工作经验,计算机科学与技术、软件工程、人工智能相关专业硕士及以上学历,具备扎实的算法基础与数学功底。
2. 有大语言模型算法研究或落地经验者优先,包括精调(SFT)、强化学习(DPO、PPO)等技术的实际落地经验,熟悉数据合成与模型评测全流程技术。
3. 熟悉RAG技术及智能体应用平台(如Coze、FastGPT、LangChain等),同时熟练掌握Llama-Factory、DeepSpeed、Unsloth、vLLM、Ollama等主流训练与推理框架,具备在模型训练推理平台及算力调度平台上进行实际项目开发、模型训练、调优与部署的经验者优先。
4. 具备持续跟踪领先AI技术动态的能力,能够敏锐捕捉结合业务需求进行技术转化与创新的机会,有高质量相关论文(如NeurIPS、ACL、ICML、EMNLP)发表者优先。
薪资待遇: 20k-28k(综合面试评定)