岗位职责:
1.负责公司人工智能平台各智能应用模块(包括数据预处理、数据特征工程、模型训练、模型验证)的架构设计,确保AI平台模型研发能力的可靠实施和高效运行;
2.规划、设计并实施大规模机器学习、计算机视觉、智能决策、文本语义理解等AI计算基础设施模块,确保系统的可扩展性和高性能;
3.基于具体应用场景,设计并实现落地方案,使用模型训练环境的通用工具,做模型优化、量化、压缩及推理加速工作;
4.持续跟进AI平台的迭代优化,负责AI平台的运维工作,编写和维护相关技术文档,确保系统的稳定性和可维护性。
任职要求:
1、本科及以上学历,计算机科学、人工智能或相关领域相关专业。
2、至少2年以上从事AI项目研发的工作经历,精通至少一种后端编程语言(如Python、Java、Go等),有分布式架构应用开发经验优先;
3、了解大模型的基本架构原理 Transform,SelfAttention 等,了解常见的推理优化方法,拥有大模型训练与调参的能力,能够在复杂的计算环境下优化模型性能,提升模型准确率和效率;
4、熟悉TensorFlow、PyTorch等主流深度学习框架,并能灵活运用这些工具进行模型的设计、训练及部署;
5、熟悉基本的大模型应用技术 Prompt Engineering,RAG,Agent,SFT 等工作原理,熟练使用 LangChain,LlamaIndex 等大模型应用框架;
6、积极进取,具备良好的逻辑思维能力、沟通表达能力和团队协作精神,具备良好的服务精神和意识,能够承担一定高强度的工作。