更新于 1月9日

大模型推理优化工程师-豆包手机助手(上海)

3-6万
  • 上海徐汇区
  • 经验不限
  • 本科
  • 全职
  • 招2人

职位描述

岗位职责:
1、负责LLM/VLM大模型的部署和推理优化开发,包括量化、并行化等各种典型的优化工作,确保系统的高性能、高可用和低成本;
2、与业务、产品、算法等团队合作,共同致力提升模型在业务场景的效果;
3、探索一些前沿的推理加速技术,包括在新型GPU/NPU上的部署落地。
任职要求:
1、熟悉Transformers、Stable Diffusion等主流模型原理;
2、熟悉至少一种推理引擎框架(vLLM/Slang/ONNX Runtime或其他自研框架);
3、熟悉至少一种机器学习框架(TensorFlow/PyTorch/MxNet或其他自研框架);
4、了解GPU/NPU硬件特性,具备一定的性能调优经验;
5、有以下至少一项的背景知识与经验:GPU编程、模型量化、Kernel开发及优化;
6、良好的团队协作能力,有良好的动手实现能力,对技术有热情。

工作地点

徐汇区中国大陆上海市杨浦区江湾城路99号尚浦商务中心5幢,邮编:200438

职位发布者

陈女士/HRBP

三日内活跃
公司Logo字节跳动公司标签
字节跳动成立于2012年3月,公司使命为“Inspire Creativity, Enrich Life(激发创造,丰富生活)”。公司业务覆盖150个国家和地区,拥有15万名员工。字节跳动在全球推出了多款有影响力的产品,包括今日头条、抖音、西瓜视频、飞书、Lark、PICO、剪映、TikTok等。截至2021年6月,字节跳动旗下产品全球月活跃用户数超过19亿。
公司主页