更新于 3月20日

人工智能安全专家

2.5-5万
  • 上海闵行区
  • 5-10年
  • 博士
  • 全职
  • 招1人

职位描述

人工智能
【岗位职责】
1. 垂域大模型训练与优化: 基于开源基础大模型(如 DeepSeek, Qwen 等),结合公司特定应用场景的数据,主导面向垂直领域的 LLM 微调(SFT)、强化学习对齐(RLHF/DPO)及模型性能优化。
2. 前沿 AI 安全研究: 深入研究大语言模型及智能体(Agent)的安全机制,攻克包括但不限于提示词注入(Prompt Injection)、越狱攻击(Jailbreak)、数据投毒、模型幻觉及隐私泄露等安全难题;构建安全对齐(Alignment)、安全推理(Safe Reasoning)与防御机制。
3. 安全平台研发: 牵头设计并研发企业级“大模型安全检测与评估平台”,构建自动化的红蓝对抗(Red Teaming)评测基准和防御策略,为公司 AI 产品的合规与安全保驾护航。
4. 学术与行业跟进: 密切跟踪 AI 安全领域的最新攻防技术演进,输出相关技术专利及顶会论文,推动安全技术在实际产品中的落地,提升公司在 AI 安全领域的行业影响力。
【任职要求】
1. 教育背景: 人工智能、计算机科学、信息安全、数据科学等相关专业博士学历。
2. 模型训练经验:
o 熟悉大模型技术栈:
· Transformer 架构、预训练机制、微调方法(LoRA, SFT / RLHF / DPO 等)
o 熟悉至少一个方向:
· LLM 安全(Prompt Injection / Jailbreak / Alignment)
· 对抗机器学习(Adversarial ML)
· 数据安全与隐私保护(如差分隐私、联邦学习)
3. AI 安全攻防背景: 对对抗机器学习(Adversarial ML)、模型可解释性、可信 AI(Trustworthy AI)或大模型价值对齐有深入研究;熟悉常见的 LLM 安全漏洞及防御手段。
4. 编程与工程能力: 熟练掌握 Python,具备扎实的数据结构与算法基础;熟练使用 Python,掌握主流深度学习框架(PyTorch / TensorFlow);能够构建完整AI系统(数据 → 训练 → 推理 → 安全评估)。
5. 加分项:
o 有大模型安全攻防(Red Team / Blue Team)经验
o 有智能体(Agent)系统开发经验(如工具调用、RAG系统)
o 在 NeurIPS, ICLR, ICML, ACL, EMNLP 或安全顶会(如 IEEE S&P, CCS, USENIX Security, NDSS)发表过相关高水平论文。

工作地点

上海闵行区中航无线电电子技术有限公司

认证资质

营业执照信息

职位发布者

黄女士/人事行政主管

三日内活跃
立即沟通
公司Logo安徽中科国创高可信软件有限公司
公司由中国科学技术大学与科大国创股份有限公司于2017年联合创办,核心团队源自中国科大,公司技术团队在形式化方法领域有二十余年的理论与实践积累,是我国首批接触并研究形式化方法的团队,在程序验证和分析方面积累了关键技术,形成了国内外较为领先的技术体系。公司是国家高新技术企业、省专精特新企业和科技型中小企业,拥有省企业技术中心、省企业研发中心等研发机构。公司位于合肥市高新区文曲路355号科大国创大厦,现有员工140余名,其中技术人员130人。公司主要产品有:科创瀚海静态分析工具、科创星云形式验证工具、科创星码编程助手和科创星智模型评测平台等基础软件工具和AI产品。公司致力于高可信软件和人工智能安全的研究和软件产品的研发,将高可信软件的相关技术应用于安全攸关行业的关键基础设施的开发中,推动高可信软件系统的应用和高可信软件开发支撑工具的产业化建设,提高关键领域的软件可靠性和安全性,为国家解决基础开发工具类软件“卡脖子”问题、提升软件质量及安全性提供了有力的支撑。
公司主页