岗位职责:
1、AI服务开发与优化:基于开源知识库、Agent框架进行二次开发,优化大模型应用性能及功能扩展。构建大模型服务化(MaaS),提供模型推理、微调、Prompt工程等核心能力,支持企业级业务场景接入。设计高可用、低延迟的分布式服务架构,解决模型部署、资源调度、负载均衡等工程问题;
2、开源技术二次开发:基于主流开源知识库(如FAISS、Milvus)、Agent框架(如LangChain)、AI工具链进行深度定制化开发,满足业务需求。优化开源组件的性能瓶颈,解决高并发场景下的稳定性问题;
3、算法与工程结合:针对业务场景优化模型推理性能(如量化压缩、动态批处理),提升服务吞吐量。开发Prompt工程模板、RAG(检索增强生成)流程,提升模型输出质量;
4、系统架构设计:设计可扩展的云原生架构,集成Kubernetes/Docker实现自动化部署与运维,构建监控告警系统,保障服务SLA指标 。
任职要求:
1、本科及以上学历,计算机科学、人工智能、软件工程、数学等相关专业优先;
2、具有3年以上AI开发领域的工作经验,熟悉AI服务架构、模型开发、优化及部署等相关工作内容;
3、编程能力:熟悉Python编程,有深度学习和NLP模型开发经验;熟练掌握TensorFlow、PyTorch等深度学习框架,并有实际应用经验;
4、算法能力:熟练掌握Transformer/BERT/GPT等模型原理,熟悉模型部署与推理框架(如vllm、sglang等),有模型微调经验(LoRA微调、指令微调等),熟悉常见机器学习算法(如聚类/分类/强化学习);
5、系统能力:熟悉分布式系统设计,精通gRPC/RESTful API开发 部署;
6、项目经验:2年以上大模型相关开发经验,主导过至少2个完整AI服务落地项目;
7、软性要求:具备强烈的技术好奇心,能快速学习新兴技术,优秀的逻辑思维能力和技术问题拆解能力,适应敏捷开发流程,具备良好的跨团队协作意识。具备良好的英语读写能力,能够阅读并理解英文技术文档。