雇员点评标签
职位描述
音频标注视频标注数据生命周期管理多模态数据处理大模型预训练
工作职责
1. 对接大模型研发团队需求,设计并搭建音视频数据的持续收集与迭代机制,保障训练数据的稳定供给。
2. 主导数据全生命周期处理:包括清洗去重、格式转换、隐私脱敏及风险分流,输出标准化训练集并沉淀统一接入方案。
3. 拓展优质数据渠道,优化数据处理链路,提升预训练数据的规模、多样性与质量,快速响应研发团队的数据需求并解决落地问题。
4. 跟踪AI领域前沿技术(如多模态、Agent框架、Harness Engineering),探索其在复杂数据任务中的应用场景,推动技术提效。
任职要求
1. 计算机、数据科学、电子信息及相关专业本科及以上学历,具备良好的跨团队沟通与协作能力。
2. 2年以上工程研发经验,熟练掌握Python(优先)或Golang等开发语言,有音视频数据处理经验者优先。
3. 掌握Prompt设计技巧,了解语音处理技术或NLP基础算法,能理解大模型预训练的数据逻辑。
4. 熟悉数据仓库操作(HSQL)及数据分析工具(Pandas、Tableau),能独立完成数据质量分析与优化。
1. 对接大模型研发团队需求,设计并搭建音视频数据的持续收集与迭代机制,保障训练数据的稳定供给。
2. 主导数据全生命周期处理:包括清洗去重、格式转换、隐私脱敏及风险分流,输出标准化训练集并沉淀统一接入方案。
3. 拓展优质数据渠道,优化数据处理链路,提升预训练数据的规模、多样性与质量,快速响应研发团队的数据需求并解决落地问题。
4. 跟踪AI领域前沿技术(如多模态、Agent框架、Harness Engineering),探索其在复杂数据任务中的应用场景,推动技术提效。
任职要求
1. 计算机、数据科学、电子信息及相关专业本科及以上学历,具备良好的跨团队沟通与协作能力。
2. 2年以上工程研发经验,熟练掌握Python(优先)或Golang等开发语言,有音视频数据处理经验者优先。
3. 掌握Prompt设计技巧,了解语音处理技术或NLP基础算法,能理解大模型预训练的数据逻辑。
4. 熟悉数据仓库操作(HSQL)及数据分析工具(Pandas、Tableau),能独立完成数据质量分析与优化。
工作地点
北京海淀区e世界财富中心

公司信息
公司介绍
中电金信,是中国电子旗下成员企业,通过持续研发创新,参与国家重大工程,依托行业场景,构建金融级数字底座,打造全栈全域解决方案,提供领先的咨询、软件产品及开发、质量安全保障及运营服务,为金融及重点行业数智化转型及安全发展提供强大动能,并以中国数智化转型最佳实践服务全球。我们推崇开放包容的文化。在中电金信,你将和同样拥有热情和梦想的优秀队友一起合作、交流和学习,稳扎稳打不断提升,和团队一起助力国家重大工程项目。我们为你提供清晰的职业路径和不设限的发展机会,你将通过不同类型的项目不断成长,获得前所未有的荣耀感和使命感,和我们一起去创造数字时代的美好未来。
工商信息
企业名称 中电金信软件有限公司
企业类型 有限责任公司(自然人投资或控股的法人独资)
法人代表 冯明刚
经营状态 存续
成立时间 2011-01-26
注册资本 5亿元
认证资质
营业执照信息

更新于 4月15日


