一、岗位⼈物画像:
1. 硕⼠及以上学历,3-5年⼤语⾔模型(LLM/VLA)架构设计或核⼼研发经验,专业功底扎实,独⽴架
构设计与⼯程化落地能⼒突出,适配快速迭代研发节奏。
2. 硕⼠及以上学历,8年+⼤模型相关研发经验,资深技术专家,精通VLA模型多模块架构设计、性能优
化与场景适配,能独⽴应对复杂⼯业级⼤模型应⽤技术挑战。
二、核⼼⼯作职责
(⼀)核⼼架构设计与研发优化
1. 负责VLA模型整体架构设计、⽹络结构选型与优化,保障模型性能、效率与扩展性。
2. 实现VLA模型训练框架、推理引擎的搭建与优化,解决⼤模型训练显存占⽤、推理延迟等核⼼技术问
题。
3. 建⽴优化VLA模型训练策略与调优体系,设计⾼效预训练、微调算法,实现模型精度与效率的平衡。
4. 开发优化VLA模型多模态融合、上下⽂理解、知识增强等核⼼模块,提升模型综合能⼒。
(⼆)场景适配与⼯业化落地
5. 针对⼯业级应⽤场景(如智能交互、⾏业知识库、⾃动化办公等),设计适配性强的VLA模型架构与部
署⽅案。
6. 负责VLA模型⾼效集成与规模化部署,推进⼯程化应⽤与落地优化,保障⼯业场景下的稳定性、安全
性与适配性。
三、任职要求
(⼀)基础条件
1. 硕⼠及以上学历,计算机、⼈⼯智能、机器学习、深度学习、电⼦信息等相关专业。
(⼆)核⼼专业技能
2. 熟悉⼤语⾔模型架构(Transformer、GPT、LLaMA等),精通模型并⾏、数据并⾏、混合并⾏等分
布式训练技术。
3. 掌握深度学习框架(PyTorch、TensorFlow等),具备扎实的机器学习、⾃然语⾔处理理论基础,
熟悉预训练、微调等核⼼算法。
4. 熟悉VLA模型推理优化技术(量化、剪枝、蒸馏等),具备⼤模型⼯程化开发经验,精通
Python/C++编程,⼯程化编码习惯良好。
(三)独⽴技术攻坚能⼒
5. 具备较强的架构设计与技术选型能⼒,能独⽴定位、解决⼤模型研发与落地中的复杂技术难题。
6. 可独⽴完成VLA模型从架构设计、研发、调试、集成到落地的全流程⼯作,⽆需过度依赖外部⽀持。
(四)加分项
7. 有VLA/LLM模型架构设计、分布式训练或⼯业级⼤模型落地实际项⽬经验。
8. 熟悉⼤模型训练平台(如DeepSpeed、Megatron-LM)、推理部署⼯具(TensorRT、ONNX等);具
备多模态⼤模型研发经验者优先。
9. 在AI、机器学习、NLP领域发表过⾼⽔平论⽂,或有⼤模型相关开源项⽬经验(核⼼贡献者)。
(五)其他要求
10. 责任⼼强,抗压性好,具备良好的沟通协作与⾃主学习能⼒,技术前瞻性突出。