该职位已失效，看看其他机会吧

GPGPU 软件高级架构师-央企

8-12万·15薪

北京丰台区
5-10年
硕士
全职
招2人

GPGPU软件架构

一：核心岗位职责：
1. 主导 GPGPU 全栈软件架构的顶层设计、技术演进规划与迭代落地，涵盖编译器、Runtime 运行时、驱动、计算库、工具链等核心模块架构设计与优化。
2. 负责 GPGPU 软硬件协同架构设计，深度对齐硬件微架构、计算核心、存储体系、指令集，制定软硬件接口规范与协同优化方案，最大化硬件算力利用率。
3. 牵头解决 GPGPU 软件栈核心技术瓶颈，包括编译优化、并行任务调度、内存管理、异构计算协同、性能调优等架构级难题，保障软件栈 PPA（性能、功耗、面积）与稳定性。
4. 构建 GPGPU 软件性能评估、测试与优化体系，主导面向 AI大模型、高性能计算（HPC）、云计算、自动驾驶等场景的软件栈定制化架构设计与性能调优。
5. 跟踪 GPGPU、异构计算、并行编程、编译器等领域前沿技术，主导核心技术预研、技术选型与专利布局，搭建团队技术规范与研发流程。
6. 带领软件研发团队完成架构落地、代码评审、技术攻坚，指导中初级工程师成长，统筹跨硬件、验证、算法团队的协作与项目交付。
7. 参与 GPGPU 硬件架构前期定义，从软件视角输出硬件设计建议，保障硬件架构对软件栈的友好性与算力可扩展性。
二：硬性专业要求：
1. 学历与经验：计算机科学与技术、软件工程、电子工程等相关专业硕士及以上学历；具备 8 年及以上 GPGPU/GPU/AI 加速芯片软件全栈研发经验，5 年及以上软件架构设计/技术负责人经验，有量产级 GPGPU/GPU 软件架构主导设计经验。
2. 全栈技术精通：深度掌握 GPGPU 软件全栈技术，包括编译器（LLVM/GCC）、Runtime 运行时、内核态/用户态驱动、并行计（CUDA/ROCm/OpenCL/SYCL）、指令集调度、异构计算框架等核心模块的架构设计与源码研发。
3. 软硬件协同能力：精通 GPGPU 硬件架构、SIMT 执行模型、存储层次、总线互联原理，具备成熟的软硬件协同设计、联合调优实战经验，能基于硬件特性做软件架构深度适配。
4. 核心技术功底：扎实的计算机体系结构、编译原理、并行算法、操作系统内核、内存管理、多线程调度理论基础；精通 C/C++/汇编/LLVMIR 等编程语言与中间表示。
5. 工具与框架：熟练使用 LLVM、GCC、GPGPU-Sim、Perf 等编译、仿真、性能分析工具；熟悉 CUDA/ROCm 生态、AI 框架（TensorFlow/PyTorch）与 GPGPU 的适配原理。
6. 项目与交付：具备大型软件架构从 0 到 1 落地、团队统筹、项目风险把控经验，能主导软件栈的版本规划、质量管控与量产交付。
三：软性能力要求：
1. 具备全局化架构设计思维与技术前瞻性，能独立完成复杂GPGPU 软件全栈的顶层规划与技术决策。
2. 优秀的跨团队沟通、协作与项目推进能力，可高效联动硬件、验证、产品、算法团队达成研发目标。
3. 极强的技术攻坚与问题定位能力，能快速拆解架构级、底层级技术难题并输出落地解决方案。
4. 良好的技术文档撰写、方案输出与团队技术赋能能力，具备严谨的工程化思维与质量意识。
5. 抗压能力突出，能适配芯片研发周期的关键节点攻坚、多项目并行的工作节奏。
四：优先加分项：
1. 有国际头部芯片企业、AI 芯片公司 GPGPU/GPU 软件架构核心设计与量产经验。
2. 主导过 LLVM、ROCm、OpenCL 等开源 GPGPU 软件生态核心模块开发与架构优化。
3. 在 PLDI、MICRO、ASPLOS、HPCA 等计算机系统/编译顶会发表相关论文，或持有 GPGPU 软件相关核心专利。
4. 精通大模型推理/训练加速、超算异构并行、Chiplet 架构下 GPGPU 软件栈设计与优化。
5. 具备 GPGPU 虚拟化、容器化、云原生适配、安全计算等场景的软件架构设计经验。
6. 熟悉 RISC-V+GPGPU 融合架构的软件栈设计、定制化编译器开发与生态适配。
7. 有大规模 GPGPU 软件研发团队搭建、技术体系建设与人才培养经验。

展开该职位详情