岗位职责:
1、负责面向工业的垂直大模型的架构设计、研发、预训练及微调(SFT)工作。
2、负责工业时序数据(DCS/PLC)、非结构化文本(操作日志/维修报告)及图像数据的清洗、对齐与增强。
3、构建行业高质量指令数据集(Instruction Dataset)及知识图谱,提升模型对专业术语和复杂工况的理解能力。
4、负责公司产品AI模块的场景研发、预训练及微调(SFT)工作。
岗位要求:
1、计算机、人工智能、自动化、应用数学或相关专业,硕士及以上学历。
2、深度学习框架:精通PyTorch、TensorFlow或PaddlePaddle,熟悉Transformer、RNN/LSTM、GNN等主流架构。
3、大模型技术栈:深入理解LLM原理,熟练掌握Pre-training、SFT、RLHF、LoRA/P-Tuning等微调技术;有Llama 3, Qwen, ChatGLM等开源模型二次开发经验。
4、精通Python,熟悉C++者优先。
5、熟悉Docker、Kubernetes,有模型服务化落地经验。
6、熟悉工业时序数据分析,有异常检测、剩余寿命预测(RUL)、软测量建模经验者优先。
7、拥有极强的跨界沟通能力,能与工艺专家(Domain Experts)顺畅对话,将业务痛点转化为算法问题。
对技术有热情,抗压能力强,适应敏捷开发节奏。