一、岗位职责
核心开发:基于 Python 技术栈负责大模型相关后端服务的设计、开发与维护,包括但不限于模型推理接口、数据处理服务、用户交互接口等;
性能优化:针对大模型推理延迟、资源占用等问题,进行接口性能调优、并发控制和资源调度优化,保障服务高可用;
工程落地:参与大模型产品的工程化落地,对接前端 / 算法团队,完成模型部署、接口联调和线上问题排查;
技术架构:参与后端服务架构设计,制定接口规范、数据流转规则,保障系统的可扩展性和稳定性;
问题排查:负责线上服务的监控、告警和故障排查,快速定位并解决接口异常、模型推理失败等问题;
技术迭代:跟踪大模型工程化领域的前沿技术(如 FastAPI、vLLM、TensorRT-LLM 等),推动技术栈升级和工程效率提升。
二、任职要求
(一)基础要求
学历:本科及以上学历,计算机、软件工程、人工智能等相关专业;
经验:
中级:2年以上 Python 后端开发经验,至少 1 年大模型相关项目落地经验;
高级:3 年以上 Python 后端开发经验,1 年以上大模型工程化落地经验,有千万级用户大模型产品后端开发经验优先;
技术基础:精通 Python 编程语言,熟悉异步编程(asyncio/gevent),掌握常见设计模式和后端开发最佳实践;
框架掌握:熟练使用 FastAPI/Flask/Django 等 Web 框架,能够独立设计和实现高并发 RESTful API;
工程能力:熟悉 Docker 容器化部署、K8s 编排,掌握 CI/CD 流程,有线上服务部署和运维经验;
数据库:熟悉 MySQL/PostgreSQL 等关系型数据库,掌握 Redis/Memcached 等缓存技术,了解 MongoDB 等 NoSQL 数据库;
大模型相关:了解 LLM(如 GPT、LLaMA、Qwen)的基本原理,熟悉模型推理框架(如 vLLM、Transformers、TGI),有模型部署 / 量化 / 微调工程化经验优先。
(二)加分项
有大模型 SaaS 平台、AI Agent、RAG(检索增强生成)项目开发经验;
熟悉云原生技术(如 K8s、Istio),有微服务架构设计经验;
了解模型量化(INT4/INT8)、模型并行 / 张量并行等优化技术;
有高并发、高可用后端服务设计和优化经验;
开源社区贡献者,或有高质量技术博客 / 项目沉淀。
工作地点:广州