职位描述
1. 数仓架构与建模:深入理解电商、广告、舆情等复杂业务,负责AI数据基座离线/实时一体化的数仓规划。基于Iceberg/Hudi构建湖仓一体架构,设计高可用、易扩展的主题域模型,支撑海量数据的高效存储与分析。
2. 数据处理与优化:负责DataWorks/MaxCompute与Flink/Spark混合架构下的ETL流程开发。针对千亿级数据量进行模型重构、查询优化与成本治理,保障数据处理任务的SLA(稳定性、时效性)与资源利用率。
3. 数据治理与安全:建立并维护全域数据资产目录、数据标准与质量监控体系,完善数据血缘追踪,确保数据的准确性、一致性及合规性,为AI训练与应用提供高质量数据源。
4. AI原生数据工程:主导语义增强层建设,为LLM应用设计高效数据链路。包括:文本拆解、清洗及Embedding向量化处理;基于NER、关系抽取的知识图谱构建(本体设计→融合→推理);支撑RAG、GraphRAG场景的多模态数据索引构建。
5. 数据服务化与AI赋能:负责AI数据服务层开发,将数据资产封装为API/Skills,支持Text-to-SQL/Text-to-MQL、向量检索、图谱推理等能力,通过Headless/MCP等协议为Brand Agent、GEO Agent等上层应用提供敏捷数据支撑。
6. 技术沉淀:抽象通用数据模型与解决方案,沉淀为可复用的组件或方法论,提升团队整体数据开发效率与用数体验。
【岗位要求】:
1. 统招本科及以上学历,计算机相关专业,5年以上大数据开发经验,其中至少3年专注于数据仓库建模与分层架构实施,有电商、广告、用户增长或舆情分析等复杂业务场景的成功案例。
2. 掌握Spark、Flink、Hadoop、Hive、Iceberg等核心技术原理,具备深度调优经验;熟练使用阿里云MaxCompute、DataWorks者优先。
3. 精通SQL及性能调优,熟悉AnalyticDB、ClickHouse、StarRocks等OLAP引擎;必须具备Milvus/ES等向量检索引擎、Neo4j等图数据库的实战应用与调优经验。
4. 深刻理解维度建模理论,对数据质量、数据血缘、元数据管理有落地实践;具有丰富的AI数据工程经验(如特征工程、RAG数据准备、知识图谱构建、大模型预训练/微调数据清洗)。
5. 具备优秀的数据服务化思维,有RESTful/GraphQL API设计开发经验,了解MCP (Model Context Protocol) 或大模型工具调用机制者优先;有Text-to-SQL/Text-to-MQL项目落地经验者优先。
6. 具备极强的业务抽象、逻辑思维及跨团队沟通能力,对数据敏感,工作细致负责,有强烈的技术自驱力,能适应快节奏的技术挑战。
工作地点

公司信息
公司介绍
壹沓科技(ONEAIX Technologies)成立于2017年,专注于前沿AI技术在企业数字化与智能化中的创新应用,致力于构建新一代企业级数字员工平台,推动人机协作新范式。壹沓科技是国家级专精特新企业、国家高新技术企业、上海市科技小巨人企业。深度参与《人工智能企业认定与分类分级评估指南》、《数字员工:基于大模型的数字员工》等多项国家和行业标准的制定,连续入选Gartner、IDC等多项报告,公司在人工智能与自动化领域拥有100多项专利与自主知识产权。依托大模型技术,壹沓科技打造了企业级数字员工平台 —— ONEAIX Platform,全面构建“白领 + AI Agent”创新型办公模式,已成功赋能近 2000 家企业客户实现高效智能的人机协同,推动企业服务更专业、员工工作更轻松。旗下核心产品运小沓 AI Agent平台,聚焦供应链物流业务超自动化场景,覆盖询盘、报价、接单、订舱、客服等核心流程环节,显著提升企业效率与客户体验。目前已成功应用于中远海运、中外运、青岛港等供应链物流企业,行业覆盖率达 70%,成为供应链物流数字化升级的核心引擎。公司总部位于中国上海,海外总部设于新加坡,并在北京、深圳、武汉等地设有分支机构,目前团队约 300 人。截止B+轮,公司已获得 SIG、IDG 、钟鼎、红杉中国、鼎晖等机构累计数亿元投资。

更新于 5月14日




