更新于 3月23日

AI后端开发工程师

1.1-1.3万
  • 徐州沛县
  • 3-5年
  • 本科
  • 全职
  • 招1人

职位描述

人工智能计算机软件电子/半导体/集成电路
一、岗位职责
1.架构设计与落地:负责AI产品(如AIGC应用、智能客服、推荐系统、知识图谱平台等)的后端架构设计,构建高可用、低延迟的推理服务架构。
2.AI工程化:负责将算法模型(包括但不限于大语言模型LLM、图像生成模型)封装为高并发RESTful/gRPC API,解决模型推理过程中的性能瓶颈。
3.图数据服务化:负责图数据库的选型、建模与API封装,支撑知识图谱存储、复杂关系查询、图计算等场景,实现图数据与AI推理链路的深度融合。
4.链路优化:针对AI应用特有的流式传输(SSE/WebSocket)、异步任务队列、多模型编排(LangChain/LlamaIndex方向)进行深度优化。
5.资源管理:负责GPU/CPU资源的调度与监控,优化模型部署成本,处理模型版本迭代与A/B测试。
6.数据处理:参与AI应用的数据飞轮建设,包括向量数据库的管理、图数据治理、Prompt工程的后端支持、用户反馈数据的闭环处理。
二、 任职要求
1.基础硬性条件
学历:计算机、数学、通信等相关专业,本科及以上学历。
经验:5年以上服务端开发经验,至少1年以上AI应用或AI平台相关开发经验。
2.后端工程能力
语言:熟练掌握 Python(AI生态首选)或 Golang/Java(高并发优势)。如果使用Python,需深刻理解其GIL限制、异步IO(asyncio)及常见性能优化手段;如果使用Java/Go,需有较强的并发编程能力。
架构:精通微服务架构,熟悉Docker、Kubernetes,有实际的Service Mesh或云原生部署经验。
数据库:熟悉关系型数据库(PostgreSQL/MySQL)及非关系型数据库(Redis)。
中间件:熟练使用消息队列(Kafka/RocketMQ)处理异步任务(如文生图的长任务)。
3.AI工程化能力
推理框架:熟悉 Triton Inference Server、vLLM、TensorRT 或 ONNX Runtime 中的至少一种,有实际优化模型吞吐量的经验。
大模型应用:熟悉 LangChain、LlamaIndex 等框架,理解RAG(检索增强生成)的全链路实现(包括文档解析、分块、Embedding、向量检索、重排)。
向量数据库:熟练使用 Milvus、Pinecone、Qdrant 或 Redis Stack 中的至少一种,有大规模向量检索的调优经验。
图数据库:熟悉至少一种主流图数据库(如 NebulaGraph、Neo4j、JanusGraph、ArangoDB),掌握图建模原则、nGQL/Cypher/Gremlin等查询语言,有图数据与向量数据协同(知识图谱+RAG)实践经验者优先。
模型运维:了解 MLOps 理念,熟悉模型从训练、打包、部署到监控的全流程管理。
三、 加分项
1.全栈能力:有Vue/React等前端基础,能独立开发AI Demo或插件(Chrome Extension)者优先。
2.底层优化:熟悉CUDA编程,或有算子融合、显存优化经验者。
3.特定领域:
有RAG评估体系搭建经验、Agent开发经验,或熟悉语音/视频多模态处理者。
有知识图谱构建与推理经验,熟悉图神经网络(GNN)、图算法(PageRank、Louvain、最短路径等)在业务中的落地者优先。

工作地点

徐州沛县汉斯半导体产业园

认证资质

营业执照信息

职位发布者

李女士/人事经理

今日活跃
立即沟通
公司Logo汉斯半导体(江苏)有限公司
汉斯半导体成立于2017年7月。是一家集研发、设计、制造、服务于一体的智能系列的高科技技术企业。本公司拥有强大的自主研发能力,其半导体研究中心的自主研发能力达到国际领先水平。此外,汉斯半导体还引进了国外最先进的制造生产线,以确保产品质量和生产效率。旗下产品主要有IGBT(绝缘栅双极型晶体管)、MOSFET(场效应晶体管)、IPM(智能功率模块)、FRD(快恢复二极管)、SSR(固态继电器)、SCR(可控硅模块)等半导体分立器件,柔性传感器、车规传感器、储能传感器、工业与家电传感器,集成电路。这些产品被广泛应用于工业控制、国防军工、航天、新能源、轨道交通和智能化装备等领域。并且拥有75个专利信息。
公司主页