雇员点评标签
职位描述
AI INFRAPyTorchKubernetesCUDAGPU架构大模型部署AI模型机器学习
岗位职责:
1. 设计、搭建并优化 AI 训练与推理的基础设施,包括高性能计算集群、分布式训练框架及推理服务平台。负责深度学习模型的分布式训练、调度、资源管理及性能优化。
2. 构建和维护机器学习平台(ML Platform),提升模型开发、训练、部署与监控的效率。
3. 与算法工程师、数据工程师紧密合作,解决大规模数据处理与模型计算的工程挑战。推动云端/本地/混合部署方案(如 Kubernetes、Ray、Slurm 等)在 AI 生产环境中的落地。
任职要求 1. 计算机体系结构、软件工程、电子信息、微电子、集成电路设计、人工智能、数学、通信等相关专业本科或者硕士。
2. 深刻理解计算机体系结构(指令集、流水线、Cache一致性、片上互联等),熟悉GPU/NPU/TPU架构细节;扎实的计算机基础,精通 Linux 环境下的系统编程与性能调优。
3. 熟悉深度学习框架(PyTorch、TensorFlow 等)及其分布式训练机制,熟悉主流多模态大模型算法原理。
4. 熟悉常见分布式系统与调度框架(Kubernetes、Slurm、Ray、Spark 等)。有 GPU 编程经验(CUDA、NCCL、MPI 等),并具备大规模集群调优经验者优先。
5. 具备良好的工程能力,学习能力强,善于团队协作,能快速适应新技术并推动落地。
加分项:
1. 在ISCA, MICRO, HPCA, ASPLOS等体系结构顶会或AI顶会(NIPS、CVPR、ICLR、AAAI、ICML等)发表论文优先。
2. 有大模型(LLM)、多模态模型分布式训练与部署经验。
3. 参与或贡献过开源 AI Infra 项目(如 DeepSpeed、Megatron-LM、Ray、KubeFlow、OpenMPI)。
4. 在超大规模参数训练、推理加速(如模型并行、量化、蒸馏、推理编译器)方面有经验。
5. 有云计算平台(AWS/GCP/Azure)或国产云上的 AI Infra 实践经验。
工作地点
滨江区华为技术有限公司杭州研究所1

公司信息
公司介绍
中软国际是行业领先的全球化软件与信息技术服务企业,成立于2000年,为香港主板上市公司(股票代码:00354.HK),拥有中国分支40+、海外分支14个,拥有员工超过9万人,服务覆盖超过40个国家。中软国际应用开发与管理专业沉淀深厚,企业数字化转型的最佳实践和专家人才充沛。公司与华为等战略伙伴一起,构建软件产业互联网平台,领先技术变革,提升产业效率,致力于使能软件企业引领发展,服务制造企业转型升级,为政企客户提供“好、快、多、省”的信息技术服务。中软国际四大业务蓬勃发展:夯实基石业务作为第一增长曲线的地位,确定云智能业务为第二增长曲线,发展鸿蒙生态、解放号为第三增长曲线,推动解放号作为软件产业互联网平台全面升级。公司在云计算、大数据、人工智能、物联网、移动互联网等方面具有丰富的咨询、设计、实施和服务经验,是全球客户数字化转型的共创伙伴。公司长期服务于多家全球500强企业等头部客户和众多高成长潜力客户,覆盖金融、电信、互联网、高科技、政府、制造与流通、交通、能源、教育等行业。公司已连续四年创造超百亿人民币营收,并立志在未来成为全球最优秀IT服务商之一。
工商信息
企业名称 中软国际科技服务有限公司
企业类型 有限责任公司(外商投资企业法人独资)
法人代表 陈宇红
经营状态 存续
成立时间 2012-04-01
注册资本 3亿元
认证资质
营业执照信息

更新于 今天






