岗位职责:
1.负责大模型在国产GPU上的适配工作,包括但不限于模型的移植、调试和性能优化,确保大模型在国产GPU上能够高效稳定地运行;
2.深入研究国产GPU的架构和特性,针对其特点制定相应的优化策略,提高模型的计算效率和资源利用率;
3.与硬件厂商紧密合作,及时解决在国产GPU适配过程中出现的技术问题,推动双方技术的协同发展。
任职要求:
1.本科及以上,计算机科学、电子工程、自动化等相关专业,具有扎实的计算机基础知识;
2.熟悉CUDA算子或者AscendC算子等;
3.熟练掌握至少一种主流的深度学习框架,如PyTorch、TensorFlow 等,有大模型开发经验者优先;
4.掌握C/C++、Python等编程语言,具备良好的编程能力和代码规范意识;
5.了解熟悉vllm,llama.cpp等常见的大模型框架,有大模型框架的国产GPU适配经验者优先。