一、岗位职责
- 1、 精通Python 与数据处理,常用库:pandas(清洗、分组、合并)、numpy(数组)、openpyxl/python-docx(文档读写基础)文本处理:正则表达式、分词 / 分句(基础)、编码与文本清洗,小项目:把可研报告拆成 “章节 - 段落 - 表格” 结构化数据;
2、 工程化虚似环境,命令行 / Git / 工程化;
3、 机器学习基础,了解经典模型:线性回归、逻辑回归、决策树 / 随机森林(理解即可)
4、 实验:用 sklearn 做文本分类(如 “可研章节分类”)
5、 深度学习与 PyTorch,PyTorch:张量、自动求导、优化器、Dataset/Dataloader、模型保存加载,神经网络基础:MLP、激活函数、初始化、正则化、学习率调度,可以训练一个小的文本分类模型(用 torch 实现);
6、 Transformer 与大模型基础,可以用 Hugging Face transformers 跑通一个开源模型的生成与聊天格式。
7、 数据工程(可研数据构建),数据收集:内部可研、政策文件、行业标准、模板,清洗:去重、去噪、去隐私、统一格式、修复 OCR 错误,指令数据:prompt-completion/chatml 格式、指令多样性、Few-shot,质量控制:抽检、规则校验(必填项、格式、引用)、数据版本管理;
8、 训练框架:PEFT + TRL(SFTTrainer)或 LLaMA Factory(更高效),训练配置:学习率、批次大小、梯度累积、warmup、epochs/steps,监控与诊断:loss/ppl、过拟合、训练不稳定、收敛判断,产出:可研专用 SFT 模型 + 训练记录 + 对比结果。
二、任职要求
- 学历与专业要求:本科及以上学历,计算机科学与技术、软件工程、信息工程、电子信息等相关专业,研究生优先考虑;具备扎实的计算机基础知识(数据结构、算法、计算机网络、操作系统等)。
- 经验要求:1-3年及以上软件开发相关工作经验(可接受优秀应届生),有相关行业(如建筑、互联网、企业服务等)软件开发经验者优先。
三、薪资待遇
- 基础薪资:本科学历6000元-8000元/月,研究生学历8000元-12000元/月(根据技术能力、工作经验可面议),享受13薪福利;核心技术人才可额外享受技术补贴、项目奖金。
- 法定福利:缴纳五险一金,享受双休、法定节假日正常休假,带薪年假、婚假、产假等各类带薪假期。
- 额外福利:传统节日福利、年度定期体检、免费午餐、停车补助,待遇优厚,保障完善。
我们重视技术创新与人才培养,致力于为软件开发人员提供稳定的发展平台、充足的技术支持和广阔的成长空间,期待热爱技术、务实进取、勇于突破的你加入,与公司共同深耕技术、共赢未来!