【职位描述】
1. Cuda C Kernel算子编写优化
2. 测试,验证国内外的CuTile, TileLang , Triton等新语言
3. 部署算子到Jetson Orin等开发平台,确认可用性,以及反馈问题
4. 同外部伙伴一起解决编写部署过程中遇到的问题
5. 总结汇报自动驾驶领域最新的算法进展,成果。
6. 将SOTA的算法成果应用到当前算法和模型的改进及优化过程当中。
【岗位要求】
1. 掌握python,熟悉pytorch框架,具备扎实的深度学习和大语言模型算法基础。
2. 熟悉Transformer架构,模型量化方法,主动学习mamba等新架构。
3. 掌握kernel编写方法,会积极使用各种主流编译库CuTile,Triton等进行算子编写。
4. 人工智能、计算机、信息、数学、电子、自动化、机械、测控、汽车等相关专业硕士及以上学历,具有扎实的数学功底和算法基础;计算机基础扎实,掌握C++、TensoRT、Linux(Ubuntu)等人工智能基础软件。
5. 英语6级水平,业务交流无障碍,同时日语能够进行日常会话。
6. 熟悉VAD,UniAD等开源自动驾驶算法优先。具有1-2年相关工作经验者优先,新毕业生也可。