该职位已失效,看看其他机会吧

AI算法工程师(大模型代理方向)(J10614)

2-3万
  • 北京丰台区
  • 3-5年
  • 本科
  • 全职
  • 招4人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 氛围活跃
  • 团队执行强
  • 准时发工资
  • 人际关系好

职位描述

大模型算法TensorFlow
岗位职责:
1、主导研发基于计算机视觉和多模态大模型的UI理解技术。让Agent能够实时“看懂”屏幕上的内容,精准识别并定位窗口、按钮、输入框、图片等各类UI元素,并理解其功能与上下文关系。
2、构建一个通用的、跨平台的设备控制层,将底层的鼠标、键盘、手机触摸等操作封装为大模型可调用的原子能力,解决在不同分辨率、操作系统和应用界面下的操作泛化性难题。
3、设计和研发专为GUI交互设计的长程规划与决策能力,研发自我纠错与反思机制,当操作失误或遇到非预期界面时,能够自主分析原因并尝试新的解决方案。
4、完成上级安排的相关工作。
任职要求:
1、计算机相关专业本科及以上学历,3年以上大模型相关技术研发经验。
2、深入理解并熟悉主流Agent框架思想(如ReAct、CoT、ToT等)。
3、对大模型的Function Calling/Tool-Using机制有深刻见解和实践。
4、熟悉各类GUI自动化框架,如Browser-use、Playwright、Selenium、Appium、PyAutoGUI等,并理解其底层原理。
5、精通在UI场景下的OCR、目标检测、图像分割等技术,有微调多模态大模型进行UI理解的经验者优先。
6、了解操作系统底层机制(Windows API、Android Accessibility Service等),熟悉如何通过系统级接口获取UI信息和模拟用户输入。
7、熟悉大模型原理,具备SFT、RL等模型训练方面的实战经验,有GUI自动化相关的强化学习经验者优化。
8、对新技术有强烈的热爱、好奇心和钻研精神,具备卓越的团队协作、沟通和问题解决能力,自驱、富有责任心和主人翁精神,极致追求算法创新和产品效果。
查看全部

工作地点

北京丰台区汉威国际广场4区3号楼

职位发布者

黄春霞/人事经理

三日内活跃
立即沟通
公司Logo南威软件股份有限公司
南威软件集团全球总部设立在北京,是福建省首家在上海主板上市的网信企业(股票代码:603636)、中国软件行业协会副理事长单位、福建省软件行业协会会长单位。公司将人工智能作为整体战略,以人工智能重构数字政府、公共安全、社会治理等主营业务,发展人工智能智慧产业,构建人工智能硬核能力,形成人工智能产业链,致力于推动全球数字政府、公共安全、社会治理和智慧产业的创新发展。南威软件成立于2002年,拥有近百家全资、控股、参股公司,其中包括深圳太极、人大金仓、四方伟业、安巽科技、北京友虹、福建万福等行业标杆企业,是国家规划布局内重点软件企业、国家数字政府建设联盟常任副理事长单位、互联网+政务服务电子证照国家标准制定的组长单位、国家电子文件管理推进联盟副理事长单位、国家智慧城市标准化专题组组长单位,服务于政府数字化转型、助力国家治理体系和治理能力现代化。公司拥有全面的行业顶级资质,包括CCRC信息安全服务资质一级(安全集成一级、安全运维一级、软件安全开发一级)、涉密信息系统集成甲级、国家建筑智能化系统设计专项甲级、国家电子与智能化工程专业承包一级、国家安防工程企业设计施工维护能力一级、ITSS运维服务能力成熟度一级、CPMM软件项目管理能力成熟度一级、软件服务商交付能力一级、IT数智化服务能力评估人工智能服务能力一级、IT数智化服务能力评估大模型服务能力一级、国家信息系统建设和服务能力评估四级(最高级)、CMMI国际软件成熟度五级(国际最高级),并取得了DCMM数据管理能力成熟度三级、武器装备科研生产单位保密资格、国军标质量管理体系等资质,是行业内资质最高最全的企业之一。
公司主页