工作职责
1. 负责VLA模型整体架构设计、⽹络结构选型与优化,保障模型性能、效率与扩展性。
2. 实现VLA模型训练框架、推理引擎的搭建与优化,解决⼤模型训练显存占⽤、推理延迟等核⼼技术问
题。
3. 建设优化VLA模型训练策略与调优体系,设计⾼效预训练、微调算法,实现模型精度与效率的平衡。
4. 开发优化VLA模型多模态融合、上下⽂理解、知识增强等核⼼模块,提升模型综合能力。
5. 针对行业级应⽤场景(如智能交互、行业知识库、自动化办公等),设计适配性强的VLA模型架构与部
署⽅案。
6. 负责VLA模型⾼效集成与规模化部署,推进⼯程化应⽤与落地优化,保障⼯业场景下的稳定性、安全
性与适配性。
任职条件
1.硕硕士及以上学历,计算机、人工智能、机器学习、深度学习、电子信息等相关专业
2.熟悉大语言模型架构精通模型并⾏、数据并⾏、混合并⾏等分
布式训练技术。
3. 掌握深度学习框架(PyTorch、TensorFlow等),具备扎实的机器学习、自然语言处理理论基础,
熟悉预训练、微调等核⼼算法。
4. 熟悉VLA模型推理优化技术(量化、剪枝、蒸馏等),具备⼤模型⼯程化开发经验,精通Python/C++编程,工程化编码习惯良好。
5. 具备较强的架构设计与技术选型能⼒,能独⽴定位、解决⼤模型研发与落地中的复杂技术难题。
6. 可独⽴完成VLA模型从架构设计、研发、调试、集成到落地的全流程⼯作,⽆需过度依赖外部⽀持。
7. 有VLA/LLM模型架构设计、分布式训练或⼯业级⼤模型落地实际项⽬经验。
8. 熟悉⼤模型训练平台(如DeepSpeed、Megatron-LM)、推理部署⼯具(TensorRT、ONNX等);具
备多模态⼤模型研发经验者优先。
9. 在AI、机器学习、NLP领域发表过高水平论文,或有大模型相关开源项目经验。