更新于 2月4日

大模型算法工程师

1.2-1.3万
  • 济南历下区
  • 1-3年
  • 大专
  • 全职
  • 招1人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 氛围活跃
  • 人际关系好
  • 团队执行强
  • 交通便利
  • 免费班车
  • 管理人性化

职位描述

Python
职位描述:
在这个角色中,你将负责交付、测试和优化支撑大规模人工智能模型训练与推理的核心基础设施。你将直接与模型研究团队协作,致力于将前沿的AI算法高效、稳定地部署于生产环境。
核心职责
1、分布式训练与优化:按照SOP交付测试大模型训练框架和推理服务,对GPU计算、通信和存储进行系统性性能调优。
2、推理部署与加速:部署高可用、低延迟的分布式推理系统,熟练使用vLLM、TensorRT-LLM等工具。
3、基础设施与协作:与云工程师和研发团队紧密合作,共同维护AI基础设施,确保其可靠性、可扩展性,并为客户提供稳定可靠的训练、推理解决方案。
4、响应客户问题与需求:处理模型适配、运行与监控工作
必备技能
1、熟悉 PyTorch 或 TensorFlow 深度学习框架,理解其核心机制。
2、熟悉Python开发语言
3、了解Kubernetes和Docker的基本原理,并拥有使用经验。
4、了解RDMA网络。
5、 出色的解决问题能力、团队协作精神和对技术的强烈热情。
优先考虑条件
1、有使用DeepSpeed、vLLM等框架进行大模型分布式训练或推理的实战经验。
2、熟悉NCCL、RDMA、MPI等通信库,了解分布式系统知识。
3、拥有在主流云平台上部署ML模型的实践经验。
4、 计算机或AI相关专业优秀应届生或1年以上运维交付经验 能够接受7*24值班排班

工作地点

济南历下区齐鲁软件园1

职位发布者

田思/HR

昨日活跃
立即沟通
公司Logo亿达信息
亿达信息技术有限公司(简称YIDATEC)创建于2006年,是中国领先、国际化的IT服务及数字化运营专家,致力于在数字化时代助力企业实现数据驱动的产品和服务。通过创新的技术和专业的解决方案,将企业IT系统和资产、业务流程与数据资产相结合,在企业运营、客户管理、产品提升等方面,满足企业的数字化、智能化需求,帮助客户创造、提升价值,与客户共同成长。目前,亿达信息已有近6000名员工分布在中国国内主要城市及亚太地区,形成为全球客户在亚太地区提供数字化运营服务的跨区域体系。应对IT产业向数字化运营服务转型的趋势,YIDATEC通过专业技术和数字化服务整合,实现资源优化重组和价值递增,帮助客户建立数字化运营模式,持续实现商业价值。基于不断提升IT运维服务水平,加强RPA、BPR、大数据运用,打造AI数据平台等,实现企业IT\BP\DT的整合,全方位提升企业数字化运营能力。YIDATEC面向医药、互联网、ICT、金融保险、数字农业等行业,提供全面的数字化运营解决方案,并投资建立了中国东北地区的数据中心。YIDATEC先后与富士施乐、SOFTBANK、UNISYS、日本乐天、SONY、阪急阪神、腾讯、阿里巴巴、华为、阿斯利康、先正达、赛诺菲、武田制药、美的、顺丰、唯品会、华夏人寿、天安人寿等全球知名企业建立长期稳定的合作关系,持续为全球50余家客户在9个国家的20万名企业用户提供专业的数字化运营服务。亿达信息技术有限公司,【全国精英招聘季】于4月1日正式启动,详细职位信息请查看公司官网或者关注“亿达信息技术有限公司”官方微信公众账号查询。
公司主页