更新于 2月1日代招公司:新国脉数字文化股份有限公司

AI算法工程师(GUI智能体方向)

3-4万
  • 上海普陀区
  • 3-5年
  • 硕士
  • 全职
  • 招1人

职位描述

多模态算法大模型算法人工智能
AI算法工程师(GUI智能体方向)
岗位职责:
1.主导GUI智能体核心系统的算法设计与工程化落地,聚焦视觉定位(GUI Grounding) 与导航(GUI Navigation) 两大核心技术模块攻关,构建可支持跨APP自动化操作的智能体能力体系。
(1)优化界面元素定位算法,基于目标检测(YOLO系列)、语义分割(UNet)等技术,实现移动端界面控件(按钮、输入框、弹窗)的像素级精准识别;
(2)迭代长程任务规划框架,通过分层强化学习(PPO/DPO)与记忆增强技术(MemGPT等框架),解决跨APP操作的累计误差问题,将任务完成率提升至95%以上;
(3)设计领域知识融合方案,基于RAG技术构建APP操作知识库,整合界面逻辑、交互规则等数据,结合知识图谱推理约束大模型行动空间,降低新应用适配成本。
2.负责智能体算法全生命周期管理与性能优化:
(1)搭建基于PyTorch的自动化训练pipeline,实现界面截图、操作日志的数据采集、标注、清洗全流程自动化,支撑模型快速迭代;
(2)通过模型量化、剪枝、知识蒸馏等技术实现轻量化改造;
(3)建立多维度算法评测体系,通过A/B测试持续优化算法效果。
3.前沿技术探索与跨团队协作:
(1)跟踪ICML、NeurIPS等顶会的GUI Agent技术动态,探索多模态融合(视觉-语言-行为)、端云协同推理等创新方向,落地动态弹窗自适应处理等解决方案;
(2)与移动端、后端团队协同定义算法接口规范,输出模型调用文档与性能指标,配合测试团队设计算法专项测试用例。
任职要求:
1.计算机、人工智能、自动化等相关专业硕士及以上学历,4年以上AI算法落地经验,有GUI交互智能体、多模态定位或强化学习工程化项目经验者优先。
2.算法能力:
(1)精通计算机视觉核心技术(目标检测、语义分割、OCR)与序列决策模型(DQN、PPO等强化学习算法),深入理解多模态大模型的原理与应用;
(2)熟悉大模型后训练技术栈,包括SFT、RLHF/DPO等微调方法及LoRA/QLora轻量化技术,具备模型效果调优实战经验;
(3)掌握长程任务规划方法,了解知识图谱构建与检索增强生成技术优先。
3.编程与工程能力:
(1)熟练使用PyTorch/TensorFlow搭建模型训练框架,熟悉ONNXRuntime、TensorRT等推理引擎的部署流程,具备Linux环境下的工程化实践经验;
(2)能使用Git进行版本管理,编写pytest自动化测试脚本,具备算法工程化落地的完整项目经验。
(3)具备扎实的技术文档撰写能力(需提交过往算法设计文档),能高效推进跨团队协作,对智能体技术有强烈探索欲,抗压能力强且具备数据驱动的问题解决思维。

工作地点

上海普陀区新国脉数字文化股份有限公司

入职公司信息

  • 入职公司: 新国脉数字文化股份有限公司
  • 公司地址:
  • 公司人数: 500-999人

职位发布者

曹先生/招聘经理

当前在线
立即沟通
公司Logo智联猎头
智联猎头作为智联招聘旗下品牌,以满足企业中高端岗位的人才招聘需求为出发点,整合全球优质资源,覆盖数字经济、新一代信息技术、人工智能、金融、电子信息、装备制造、生物医药与健康、房地产/建筑等数十个行业,拥有规模庞大、覆盖面广的交付团队,致力于向企业输出专业化的招聘解决方案。智联猎头目前拥有卓聘平台服务、招聘流程外包服务、高端人才猎寻服务三大类核心服务,具备高度定制化能力,能够为不同发展阶段的企业提供一站式招聘解决方案,同时为企业转型升级提供保障,全面增强企业核心竞争力!智联猎头利用自身独特的资源优势、成熟的服务模式,以及多层次的产品,致力于打造高效、专业的一站式人才服务模式,让招聘更加美好!
公司主页