更新于 1月7日

视觉图像算法工程师-手势识别方向(2D/3D)

2.5-3.5万
  • 上海浦东新区
  • 5-10年
  • 硕士
  • 全职
  • 招1人

职位描述

NLP手势识别状态机/冲突矩阵/校准/可回归)人工智能
基于单双目、RGB/灰度摄像头及 MR/XR 眼镜相关传感器输入,构建端侧可部署的 2D/3D手势识别系统,输出稳定可用的 Gesture Result(手势类别/置信度/hand_id/ts/可选连续参数),持续提升在真实 XR 场景中的鲁棒性、低延迟与一致性。

职责
1. 设计并实现手势识别算法体系(端到端)
面向头戴式 Egocentric(第一人称)视角,开发手势识别算法:包括静态/动态手势、连续交互手势(如 pinch/slide/rotate/tap 等)。结合摄像头、TOF 、IMU/交互行为数据与环境语义信息,完成低延迟、高稳定的手势理解与事件输出。
2. 构建 2D/3D 手势表征与时序建模,设计并优化手势识别模型与特征。
3.手势识别系统工程化:规则/状态机/冲突矩阵/置信度校准,产出可解释、可调参、可诊断的手势识别“策略层”。
4. 端侧部署与芯片适配(XR 手势芯片落地),面向 XR 芯片/端侧平台(RKNN 、Qualcomm等)进行模型网络修改与加速:蒸馏、量化、剪枝、算子替换与一致性验证;形成端侧推理性能、延迟、功耗与效果的平衡方案,并推动落地与问题闭环。
5. 与 SDK 项目组协作完善手势 SDK 提供手势识别输出协议(API/数据结构/错误码)、调试工具与数据闭环能力(录制、回放、可视化),支持应用侧快速集成与验证。

学历
计算机科学、软件工程、数据科学或相关专业,硕士及以上学历。

技能
扎实的计算机视觉/机器学习/数学基础,具备算法设计与实现能力。
具备 2D/3D 手势识别、动作理解(Action Recognition)、骨架序列建模 经验者优先;熟悉VR/AR/XR 场景优先。
熟悉深度学习模型及训练/推理流程:CNN / Transformer / RNN / TCN / 轻量化网络;具备算法迁移、模型压缩与部署经验。
熟悉多模态/多传感器融合基础(至少能理解并使用 IMU 、深度、双目几何或 TOF 信息辅助鲁棒性。


经验
3-5 年左右经验,能够独立开展工作并推动落地闭环有边缘设备上视觉模型开发/部署经验
沟通协作能力强,能够跨团队高效推进独立思考并解决复杂技术问题的能力

加分
有算法优化与硬件平台部署经验(端侧性能/功耗/延迟优化)。
在 AI 领域知名期刊或会议发表过论文/专利/开源项目贡献。
有 Egocentric / Head-mounted Vision 、移动端/边缘设备视觉算法经验者优先

工作地点

上海浦东新区张江科学之门-A塔43层

职位发布者

朱女士/人事

立即沟通
公司Logo中数元宇数字科技(上海)有限公司
中数元宇数字科技(上海)有限公司,成立于2021年10月,是一家专注于XR智能眼镜电脑研发、并提供应用场景整体解决方案的虚拟现实领域领先科技企业。公司拥有智能眼镜电脑软件+硬件的研发与设计、生产能力,自主设计和研发XR智能眼镜电脑。元宇智能眼镜电脑,突破技术壁垒,融合图像识别手势识别等技术,重新定义沉浸式虚拟办公,衍生到体育、旅游、养老、娱乐等各个领域。最简洁高效的⽅式创造出最优秀的产品,不断提升品质与科技,给用户最好的使用体验。企业优势人工智能在虚拟办公领域的多个核心专利技术团队来自全球科技领域顶尖企业产品同时面向消费端+企业端客户群体微软、HTC等行业龙头为合作伙伴责任感、包容性的创新团队以人为本、待遇高、扁平化管理、升职加薪快专业团队、氛围好、项目闭环、工作有挑战、有发展前景
公司主页