更新于 3月27日

AI推理引擎工程师(模型加速)

1.5-1.8万
  • 北京海淀区
  • 3-5年
  • 本科
  • 全职
  • 招1人

职位描述

深度学习大模型算法人工智能计算机软件
岗位职责:
1、负责TensorRT-LLM /
Ascend CANN / vLLM等推理引擎的集成与优化,提升大模型推理性能;
2、实现模型量化(INT4/INT8)、动态批处理、PagedAttention、算子融合等加速策略;
3、对预置模型(Qwen、Llama、DeepSeek、ChatGLM等)进行性能调优,输出最佳实践;
4、协同算法团队完成模型压缩、部署,提供推理服务的稳定性保障;
5、跟踪前沿推理加速技术,持续优化产品性能。
任职要求:
1、本科及以上学历,计算机、人工智能等相关专业,3年以上AI推理优化经验;
2、熟悉NVIDIA(CUDA/TensorRT)或昇腾(CANN)推理栈,有实际模型部署经验;
3、熟悉PyTorch、ONNX、TensorRT等工具链,了解量化感知训练(QAT)等原理;
4、精通Python/C++,具备性能分析与调优能力;
5、有大模型量化/部署经验者优先,有开源推理框架贡献者优先。

工作地点

北京市海淀区东北旺西路8号23号楼1层101

认证资质

营业执照信息

职位发布者

冯女士/人事经理

昨日活跃
立即沟通
公司Logo北京云科领创信息技术有限公司
北京云科领创信息技术有限公司是一家以“智能+产业服务”信息化产品研发、销售、运营为主业的科技公司,注册资本 2500万元,专注于搭建产业综合服务平台——创 8区,打造城市和园区“产业大脑”——创 8产业云,着力解决现在产业招商、园区管理和企业服务中的诸多痛点和难点问题,切实帮助客户在“科学化决策、精细化管理、标准化服务”上不断提升。目前,公司初步形成了以“招商云”、“人才云”、“科创云”、“园区云”为核心的产品系列,并在工业互联网管控平台、行政事业单位内控平台、智慧城市数据集成平台建设等方面进行了诸多探索。公司业务已覆盖上海、广东、浙江、江苏、山东、贵州等省市,积累了丰富的 2G、2B服务经验。公司从“科技小巨人”出发,正向着“独角兽”企业的目标奋力前行!云科领创信息技术公司是中关村高新技术企业、双软认证企业,已获得软件著作权近 50项、实用新型专利 1项,先后通过 ISO9001、ISO14001、ISO20000管理体系认证。云科领创信息技术公司人才团队能力突出、结构合理,既有来自政府、央企的中高层管理人员,也有来自甲骨文、IBM、华为、软通动力、文思海辉等国内外知名公司的核心技术人员,且注重与大学、科研院所加强产学研合作以及与其他第三方合作伙伴强化市场协同,确保公司有源源不断的人才支撑、充足的发展后劲和广阔的市场空间。云科领创信息技术公司战略视野宽广,行业资源广泛。公司团队具有丰富的产业招商、园区运营、创新创业服务以及信息化项目建设经验,能够准确地理解客户需求,依托高效的服务能力,为客户提供良好的“线上+线下”一站式服务体验,帮助客户不断提升管理和运营效益。
公司主页