更新于 今天

数据工程师(生成式 AI 方向)

9000-11000元·13薪
  • 福州闽侯县
  • 1-3年
  • 本科
  • 全职
  • 招1人

职位描述

ETLSqlPythonFlinkSpark
【岗位职责】
1、数据采集与整理:依据业务与模型需求,设计并实现网页爬虫、开放 API 调用等数据采集流程。处理多种非结构化数据(如网页文本、Markdown、PDF 等)的解析、抽取与结构化落库;
2、根据算法团队需求,构建和整理指令数据、问答数据、对话数据等,按约定格式生成训练语料。对原始数据进行脱敏、切分、标签整理等预处理,为标注与训练环节提供合规且高质量的数据输入;
3、配合后端与算法团队,搭建支撑 AI 应用(如智能助手、知识问答、智能客服等)的数据流程,包括向量化处理、索引构建、日志采集、用户反馈数据沉淀、特征更新等;
4、与产品、算法、后端等团队保持良好沟通,理解业务背景与需求,能够对数据方案提出合理建议。

【任职要求】
1、计算机科学、软件工程、数据科学、数学等相关专业,本科及以上学历;
2、熟练使用 Python 进行数据处理与脚本开发,熟悉常见数据处理或 ETL 相关库(如 pandas 等);
3、具备扎实的 SQL 基础,能够独立完成常见的数据查询、聚合统计与基础性能优化;
4、对大语言模型训练数据的重要性有基本认识,理解指令数据、对话数据、知识库数据等在模型效果中的作用;
5、具备良好的沟通表达与跨团队协作能力;
6、工作严谨细致,具备责任意识和自驱力,能够在不完全确定的环境中推动任务落地。

工作地点

福州闽侯县星网锐捷科技园(东北门)

职位发布者

方女士/HR

昨日活跃
立即沟通
公司Logo星网锐捷
福建星网锐捷通讯股份有限公司成立于2000年,秉承“融合创新科技,构建智慧未来”的经营理念,是国内领先的ICT应用方案提供商,在智慧网络、智慧云、智慧通讯、智慧音乐、智慧社区、智慧物联、智能制造等智慧产业领域持续创新,助力行业用户数字化转型升级。2010年星网锐捷在深交所上市,股票代码002396,2020年营业收入达到103.04亿元。作为国家首批创新型企业,星网锐捷每年持续将10%左右的销售收入投入研发,2020年研发投入达到13.64亿元,公司拥有国家级企业技术中心、博士后科研工作站、国际科技合作基地和下一代网络设备技术国家地方联合工程实验室,多次承接和入选国家863计划、国家核高基重大专项;与中科院计算所、清华大学、北京大学等顶尖高校及Intel、Microsoft、Citrix、浪潮、支付宝等国内外著名厂商开展多层次、全方位的技术合作,形成大批领先的核心技术。基于强大的创新能力,星网锐捷的产品和方案广泛应用于政府、运营商、金融、互联网、教育、医疗、能源、交通、房地产、商业、制造业等行业。公司先后入选国家首批“科改示范企业”,国家高技术产业化示范工程、首批国家技术创新示范企业,并17度蝉联中国软件业务百强、获得中国成长百强企业、全国自主创新型企业优秀奖等荣誉。
公司主页