职位描述
岗位职责:
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。
团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决AI前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和AI产品的一手用户。
1、技术落地实施,深入了解豆包大模型隐私合规业务场景,通过Agent/Workflow/代码等自动化手段搭建合规隐私保护相关的数据生产全链路,或在技术平台完成小规模自闭环数据实验与数据效果验证,实现数据处理链路的自动化流转;
2、合成数据管线支持,参与SFT、RL训练数据的技术落地,利用模型生成高质量的训练样本并编写脚本进行数据一致性与质量的自动化校验;
3、全流程技术支持与工具开发,提供技术指导,定位并解决业务推进中的技术卡点、完成数据提效类工具开发,熟悉TRAE/Claude Code/Copilot等AI原生集成开发环境,快速开发或交付高可用的数据提效工具,能够利用AI工具大幅缩短代码开发周期;
4、数据运营与策略评估,负责合规隐私业务方向的自动化策略的落地验证工作,深度协同产品与研发团队,执行高质量的数据标注与评测,量化合规策略表现及模型防御边界,评估模型防御能力,基于数据反馈驱动策略的持续迭代与优化;
5、数据方法探索,前沿数据训练方法的探索与落地实践,沉淀自动化数据生产方法论,持续跟踪AI领域的前沿工具与技术(如MCP、Skills等),将业务需求转化为可复用的工程化Demo,辅助提升团队整体的数据运营效率。
任职要求:
1、2027届本科及以上学历在读,计算机科学、软件工程、数学或理工科相关专业优先;
2、深入理解Prompt Engineering,能够编写结构化Prompt以引导模型输出标准化的JSON/XML数据格式;
3、精通或类似LLM应用开发平台,深刻理解RAG(检索增强生成)Function Call及Agent编排逻辑,有复杂Workflow搭建与调试的实际项目经验;
4、对AI有热情,有较强的自驱力,具备独立判断的思维,能够利用AI工具极速解决问题,可以流畅阅读英文文档,具备快速学习能力(包括论文研究)与技术落地执行力,能清晰、准确地传达信息和想法,具备优秀的沟通协调能力及团队合作精神优先。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。
团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决AI前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和AI产品的一手用户。
1、技术落地实施,深入了解豆包大模型隐私合规业务场景,通过Agent/Workflow/代码等自动化手段搭建合规隐私保护相关的数据生产全链路,或在技术平台完成小规模自闭环数据实验与数据效果验证,实现数据处理链路的自动化流转;
2、合成数据管线支持,参与SFT、RL训练数据的技术落地,利用模型生成高质量的训练样本并编写脚本进行数据一致性与质量的自动化校验;
3、全流程技术支持与工具开发,提供技术指导,定位并解决业务推进中的技术卡点、完成数据提效类工具开发,熟悉TRAE/Claude Code/Copilot等AI原生集成开发环境,快速开发或交付高可用的数据提效工具,能够利用AI工具大幅缩短代码开发周期;
4、数据运营与策略评估,负责合规隐私业务方向的自动化策略的落地验证工作,深度协同产品与研发团队,执行高质量的数据标注与评测,量化合规策略表现及模型防御边界,评估模型防御能力,基于数据反馈驱动策略的持续迭代与优化;
5、数据方法探索,前沿数据训练方法的探索与落地实践,沉淀自动化数据生产方法论,持续跟踪AI领域的前沿工具与技术(如MCP、Skills等),将业务需求转化为可复用的工程化Demo,辅助提升团队整体的数据运营效率。
任职要求:
1、2027届本科及以上学历在读,计算机科学、软件工程、数学或理工科相关专业优先;
2、深入理解Prompt Engineering,能够编写结构化Prompt以引导模型输出标准化的JSON/XML数据格式;
3、精通或类似LLM应用开发平台,深刻理解RAG(检索增强生成)Function Call及Agent编排逻辑,有复杂Workflow搭建与调试的实际项目经验;
4、对AI有热情,有较强的自驱力,具备独立判断的思维,能够利用AI工具极速解决问题,可以流畅阅读英文文档,具备快速学习能力(包括论文研究)与技术落地执行力,能清晰、准确地传达信息和想法,具备优秀的沟通协调能力及团队合作精神优先。
工作地点
中国大陆北京市海淀区北三环西路27号北京方恒中心D座,邮编:100098

认证资质
营业执照信息

更新于 4月20日


