职务描述
1、负责客户AIOps的设计与开发,包括以下方向:服务健康度评估、异常识别、容量预估、流量预估、风险预估、故障根因分析
2、参与/主导以下算法在应用系统运维领域的设计和开发:时间序列异常检测、日志异常检测、多指标关联分析、时间序列预测、服务容量预估
3、参与/主导构建应用系统通用的智能运维平台,结合公司基础设施,为上述业务提供基础的样本集、标注数据,数据清洗、模型训练和运行框架"
4.协同产品经理与业务内部IT运维团队,构建适用于多业务场景的 自动化运维能力
5.研究并应用 LLM、规则引擎、图数据库、异常检测模型 等技术于智能运维场景
要求经验3年以上、学历学信网统招大专及以上
1、熟悉python、Java、go中的一种或多种编程技术;
2、熟悉机器学习的常用算法和Tensorflow/Pytorch等深度学习框架,包括但不限于回归、分类、聚类、异常检测、时序预测、关联规则等。
3、熟悉生成式AI技术,有实际生成式AI应用开发经验或者大语言模型调优工作经验者优先;
4、有异常识别类,风险预测、容量、流量预估类算法经验者,或有运维开发经验者优先;
5、有良好的沟通能力、英文阅读能力和探索精神,善于发现业界及学术界前沿技术,并懂得改良运用落地。