该职位已失效,看看其他机会吧

AI训练数据工程师 (数据准备)

2.5-4万·14薪
  • 广州海珠区
  • 3-5年
  • 本科
  • 全职
  • 招1人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 氛围活跃
  • 人际关系好

职位描述

AI训练数据、数据准备、训练数据大模型预训练数据建设、房地产多模态训练数据云计算/大数据人工智能房地产开发
【岗位职责】
1、负责AI训练数据的全流程管理:清洗、标注、增强、版本控制及质量评估;
2、负责多模态训练数据(文本、图像、语音、视频等)的采集、清洗与结构化处理,制定数据质量标准,确保数据集的多样性、代表性和合规性;
3、开发自动化工具或脚本(如Python/Pandas)处理大规模数据,解决噪声过滤、重复数据删除、格式统一等问题;
4、设计数据标注规则与流程,确保标注结果的一致性与准确性(如实体识别、语义分割、意图分类等任务);
5、通过应用数据增强技术(如文本扩写、图像变换、对抗生成)提升数据量级与多样性,优化模型泛化能力;
6、设计数据标注规则与SOP,搭建自动化数据处理Pipeline;
7、开发数据合成工具(如基于Diffusion模型生成图像数据);
8、保障数据安全合规,制定隐私脱敏与版权管理策略;
【任职资格】
1、计算机/统计学相关专业本科以上学历,2年以上数据工程经验;
2、精通Python/SQL,熟练使用数据处理库(如Pandas、NumPy)及分布式计算工具(Spark、Dask)。
3、熟悉主流标注工具(Label Studio/CVAT)及数据湖架构;
4、了解数据标注行业生态,熟悉GDPR/《个人信息保护法》等数据合规要求;
5、参与过大模型预训练数据建设(如RedPajama/The Pile);
6、熟悉房地产业务场景的数据特点与标注规范者优先。
查看全部

工作地点

广州海珠区阅江中路868

入职公司信息

  • 入职公司: 某房地产公司
  • 公司地址: 广州海珠区
  • 公司人数: 1000-9999人

认证资质

  • 人力资源服务许可认证

    人力资源服务许可证是由国家人力资源与社会保障相关部门颁发,代表人才经纪人所在企业可以合法开展人力资源相关业务的资质证件。展示该标签代表该企业发布此职位时已上传《人力资源服务许可证》或《人力资源服务备案证书》并经由平台审验通过。

职位发布者

李术霞/高级招聘经理

立即沟通
公司Logo南方新华公司标签
南方新华(SINO SOUTH)是一家全球领先的人力资源服务和人才竞争力咨询公司,为企业提供专业猎头服务、管理咨询服务,助力其快速建立行业前10的核心人才竞争力。设立“深圳+重庆”双总部,东西协同,形成覆盖全国200+核心城市的人才生态网络。成立12年以来,“进行业前10,选南方新华”已成为客户对南方新华服务效果的高度评价。南方新华核心创始团队拥有麦肯锡、德勤等全球知名管理咨询公司的工作经历。拥有1000+猎头和管理咨询师团队,平均从业年限7年+,75%以上都来自各行业头部企业的人力资源岗位。南方新华以互联网/电商、智能制造(含汽车制造)、人工智能、通信电子、航天军工、消费品、贸易/物流、新能源/化工、医疗器械、智能建造、服务业、金融等12大行业为核心,深入渗透48+细分领域,设置针对行业的专属服务团队,为不同行业客户提供更精准、更有效、更懂业务的优质服务。
公司主页