该职位已失效,看看其他机会吧

大模型数据工程师

1-1.9万

职位描述

ETLPythonScala
岗位职责:
1、设计和开发大规模预训练数据处理链路,为基座模型预训练提供稳定、可靠的高质量数据处理能力,包括数据寻源、数据抓取/采集、数据解析(OCR、图片、网页)等工作内容;
2、设计和开发服务大模型预训练的数据平台,管理数据的元信息、血缘、存储治理等数据全生命周期要素;提供预训练数据的可视化、可观测能力;探索数据实验、数据发版的工程上限;
3、针对LLM、VLM等模型构建数据合成方案和框架,支持数据Scale等工作;
4、根据大模型训练数据特点,抽象并开发高效、可靠的数据加工框架,提升所有大模型算法工程师处理数据的工程效率;
任职要求:
1、本科及以上学历,计算机相关专业优先;
2、三年以上本岗位工作经验;
3、熟悉 Python 编程语言,熟悉计算机图形学,熟悉;
4、良好的沟通协调能力和团队合作精神;
5、较强的主动性、责任心与执行能力,能独立承担任务和有系统进度把控能力。
查看全部

工作地点

秦皇岛抚宁区开发区数谷大厦

认证资质

营业执照信息

职位发布者

徐秋琦/经理

今日活跃
立即沟通
公司Logo河北数微信息技术有限公司
河北数微信息技术有限公司成立于2014年,是专注智慧城市末端服务、深耕新型智慧城市建设领域的高新技术企业与生态创新型科技企业,依托互联网、物联网、云计算、大数据等前沿技术,打造智慧城市“数智微生态”,布局数智政务、数智社区、数智超脑、数智运营四大赛道,构建“物联、数联、智联、人联”的政商融合社区数据新生态,公司拥有南北两大生产基地及秦皇岛、北京、杭州三大研发中心,研发团队高学历占比超九成,手握70余项软件著作权与专利,多项科技成果获评国内领先水平,先后入选工信部大数据产业试点示范项目、河北省服务业创新领先企业50强,获评专精特新中小企业、河北软件和信息技术服务业“明日之星”等多项荣誉,在服务上以“社区小微管家+社区数据底座+AI全栈算法+智能设备”为核心,首创78项社区窗口服务功能,实现“大厅事,小区办”,高效打通政务服务最后一百米,未来将持续以数字技术赋能智慧城市与数字治理建设,同时为员工提供极具竞争力的超优八级薪酬体系,设有项目奖、年终奖、绩效奖等多重奖励,配套股权期权、清晰晋升通道与年终调薪机制,另含五险一金、带薪年假、通讯交通用餐补贴、人才公寓、节日福利、团建年会及专业培训学习、导师带教等全方位保障与发展支持,为员工搭建广阔成长平台。
公司主页