岗位职责:
1.参与深度学习框架的代码实现,开发框架支持大模型训练、微调能力,提升系统准确性、速度和稳定性;
2.持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,提升模型的性能;
3.负责大模型训练相关技术、方案及架构设计沟通、执行。
任职要求:
1.本科以上学历,两年以上工作经验,硕士博士尤佳;
2.熟悉并经历过大模型的预训练(Pre-training)、微调(Fine-tuning)、后训练(Post-training)全流程;
3.熟练掌握Python编程语言,熟练使用PyTorch或TensorFlow等深度学习框架;
4.有丰富的AI项目经验,熟悉Transformer架构及主流大模型,具备实际部署和优化经验者优先,熟悉unsloth、megatron、deepspeed等多种大模型训练框架;
4.有AI大模型性能调优经验,模型量化和稀疏化经验。