职位描述
GPGPU软件架构
一:核心岗位职责:
1. 主导 GPGPU 全栈软件架构的顶层设计、技术演进规划与迭代落地,涵盖编译器、Runtime 运行时、驱动、计算库、工具链等核心模块架构设计与优化。
2. 负责 GPGPU 软硬件协同架构设计,深度对齐硬件微架构、计算核心、存储体系、指令集,制定软硬件接口规范与协同优化方案,最大化硬件算力利用率。
3. 牵头解决 GPGPU 软件栈核心技术瓶颈,包括编译优化、并行任务调度、内存管理、异构计算协同、性能调优等架构级难题,保障软件栈 PPA(性能、功耗、面积)与稳定性。
4. 构建 GPGPU 软件性能评估、测试与优化体系,主导面向 AI大模型、高性能计算(HPC)、云计算、自动驾驶等场景的软件栈定制化架构设计与性能调优。
5. 跟踪 GPGPU、异构计算、并行编程、编译器等领域前沿技术,主导核心技术预研、技术选型与专利布局,搭建团队技术规范与研发流程。
6. 带领软件研发团队完成架构落地、代码评审、技术攻坚,指导中初级工程师成长,统筹跨硬件、验证、算法团队的协作与项目交付。
7. 参与 GPGPU 硬件架构前期定义,从软件视角输出硬件设计建议,保障硬件架构对软件栈的友好性与算力可扩展性。
二:硬性专业要求:
1. 学历与经验:计算机科学与技术、软件工程、电子工程等相关专业硕士及以上学历;具备 8 年及以上 GPGPU/GPU/AI 加速芯片软件全栈研发经验,5 年及以上软件架构设计/技术负责人经验,有量产级 GPGPU/GPU 软件架构主导设计经验。
2. 全栈技术精通:深度掌握 GPGPU 软件全栈技术,包括编译器(LLVM/GCC)、Runtime 运行时、内核态/用户态驱动、并行计(CUDA/ROCm/OpenCL/SYCL)、指令集调度、异构计算框架等核心模块的架构设计与源码研发。
3. 软硬件协同能力:精通 GPGPU 硬件架构、SIMT 执行模型、存储层次、总线互联原理,具备成熟的软硬件协同设计、联合调优实战经验,能基于硬件特性做软件架构深度适配。
4. 核心技术功底:扎实的计算机体系结构、编译原理、并行算法、操作系统内核、内存管理、多线程调度理论基础;精通 C/C++/汇编/LLVMIR 等编程语言与中间表示。
5. 工具与框架:熟练使用 LLVM、GCC、GPGPU-Sim、Perf 等编译、仿真、性能分析工具;熟悉 CUDA/ROCm 生态、AI 框架(TensorFlow/PyTorch)与 GPGPU 的适配原理。
6. 项目与交付:具备大型软件架构从 0 到 1 落地、团队统筹、项目风险把控经验,能主导软件栈的版本规划、质量管控与量产交付。
三:软性能力要求:
1. 具备全局化架构设计思维与技术前瞻性,能独立完成复杂GPGPU 软件全栈的顶层规划与技术决策。
2. 优秀的跨团队沟通、协作与项目推进能力,可高效联动硬件、验证、产品、算法团队达成研发目标。
3. 极强的技术攻坚与问题定位能力,能快速拆解架构级、底层级技术难题并输出落地解决方案。
4. 良好的技术文档撰写、方案输出与团队技术赋能能力,具备严谨的工程化思维与质量意识。
5. 抗压能力突出,能适配芯片研发周期的关键节点攻坚、多项目并行的工作节奏。
四:优先加分项:
1. 有国际头部芯片企业、AI 芯片公司 GPGPU/GPU 软件架构核心设计与量产经验。
2. 主导过 LLVM、ROCm、OpenCL 等开源 GPGPU 软件生态核心模块开发与架构优化。
3. 在 PLDI、MICRO、ASPLOS、HPCA 等计算机系统/编译顶会发表相关论文,或持有 GPGPU 软件相关核心专利。
4. 精通大模型推理/训练加速、超算异构并行、Chiplet 架构下 GPGPU 软件栈设计与优化。
5. 具备 GPGPU 虚拟化、容器化、云原生适配、安全计算等场景的软件架构设计经验。
6. 熟悉 RISC-V+GPGPU 融合架构的软件栈设计、定制化编译器开发与生态适配。
7. 有大规模 GPGPU 软件研发团队搭建、技术体系建设与人才培养经验。
1. 主导 GPGPU 全栈软件架构的顶层设计、技术演进规划与迭代落地,涵盖编译器、Runtime 运行时、驱动、计算库、工具链等核心模块架构设计与优化。
2. 负责 GPGPU 软硬件协同架构设计,深度对齐硬件微架构、计算核心、存储体系、指令集,制定软硬件接口规范与协同优化方案,最大化硬件算力利用率。
3. 牵头解决 GPGPU 软件栈核心技术瓶颈,包括编译优化、并行任务调度、内存管理、异构计算协同、性能调优等架构级难题,保障软件栈 PPA(性能、功耗、面积)与稳定性。
4. 构建 GPGPU 软件性能评估、测试与优化体系,主导面向 AI大模型、高性能计算(HPC)、云计算、自动驾驶等场景的软件栈定制化架构设计与性能调优。
5. 跟踪 GPGPU、异构计算、并行编程、编译器等领域前沿技术,主导核心技术预研、技术选型与专利布局,搭建团队技术规范与研发流程。
6. 带领软件研发团队完成架构落地、代码评审、技术攻坚,指导中初级工程师成长,统筹跨硬件、验证、算法团队的协作与项目交付。
7. 参与 GPGPU 硬件架构前期定义,从软件视角输出硬件设计建议,保障硬件架构对软件栈的友好性与算力可扩展性。
二:硬性专业要求:
1. 学历与经验:计算机科学与技术、软件工程、电子工程等相关专业硕士及以上学历;具备 8 年及以上 GPGPU/GPU/AI 加速芯片软件全栈研发经验,5 年及以上软件架构设计/技术负责人经验,有量产级 GPGPU/GPU 软件架构主导设计经验。
2. 全栈技术精通:深度掌握 GPGPU 软件全栈技术,包括编译器(LLVM/GCC)、Runtime 运行时、内核态/用户态驱动、并行计(CUDA/ROCm/OpenCL/SYCL)、指令集调度、异构计算框架等核心模块的架构设计与源码研发。
3. 软硬件协同能力:精通 GPGPU 硬件架构、SIMT 执行模型、存储层次、总线互联原理,具备成熟的软硬件协同设计、联合调优实战经验,能基于硬件特性做软件架构深度适配。
4. 核心技术功底:扎实的计算机体系结构、编译原理、并行算法、操作系统内核、内存管理、多线程调度理论基础;精通 C/C++/汇编/LLVMIR 等编程语言与中间表示。
5. 工具与框架:熟练使用 LLVM、GCC、GPGPU-Sim、Perf 等编译、仿真、性能分析工具;熟悉 CUDA/ROCm 生态、AI 框架(TensorFlow/PyTorch)与 GPGPU 的适配原理。
6. 项目与交付:具备大型软件架构从 0 到 1 落地、团队统筹、项目风险把控经验,能主导软件栈的版本规划、质量管控与量产交付。
三:软性能力要求:
1. 具备全局化架构设计思维与技术前瞻性,能独立完成复杂GPGPU 软件全栈的顶层规划与技术决策。
2. 优秀的跨团队沟通、协作与项目推进能力,可高效联动硬件、验证、产品、算法团队达成研发目标。
3. 极强的技术攻坚与问题定位能力,能快速拆解架构级、底层级技术难题并输出落地解决方案。
4. 良好的技术文档撰写、方案输出与团队技术赋能能力,具备严谨的工程化思维与质量意识。
5. 抗压能力突出,能适配芯片研发周期的关键节点攻坚、多项目并行的工作节奏。
四:优先加分项:
1. 有国际头部芯片企业、AI 芯片公司 GPGPU/GPU 软件架构核心设计与量产经验。
2. 主导过 LLVM、ROCm、OpenCL 等开源 GPGPU 软件生态核心模块开发与架构优化。
3. 在 PLDI、MICRO、ASPLOS、HPCA 等计算机系统/编译顶会发表相关论文,或持有 GPGPU 软件相关核心专利。
4. 精通大模型推理/训练加速、超算异构并行、Chiplet 架构下 GPGPU 软件栈设计与优化。
5. 具备 GPGPU 虚拟化、容器化、云原生适配、安全计算等场景的软件架构设计经验。
6. 熟悉 RISC-V+GPGPU 融合架构的软件栈设计、定制化编译器开发与生态适配。
7. 有大规模 GPGPU 软件研发团队搭建、技术体系建设与人才培养经验。
展开该职位详情





