主要职责:
1. 参与AI应用的原型开发与迭代:在导师指导下,使用Python/Java等语言,参与基于大语言模型(LLM)或其他前沿AI模型的应用功能模块的设计、编码和测试。
2. 探索与集成开源AI解决方案:主动追踪AI开源社区(如Model Scope, Hugging Face, Github等)的最新动态,评估、测试并尝试将优秀的开源模型和工具链集成到我们的系统中。
3. 数据处理与实验:协助进行模型训练和推理所需的数据清洗、预处理和增强工作,并参与算法模型的实验、评估及效果分析。
4. 技术文档与分享:撰写清晰的技术文档,记录实验过程和结果,并有机会在团队内部分享你的发现和技术见解。
任职要求(必备条件):
1. 技术热情与动手能力:
对AI技术有强烈的好奇心和求知欲,有个人技术项目(如Github项目、技术博客、或任何你“捣鼓”出来的东西)是加分项。
习惯于主动学习和解决技术难题,具备优秀的快速学习能力。
2. AI实践与开源生态:
深度使用过大语言模型,对主流LLM(如GPT系列、Claude、LLaMA等)有实际使用经验,熟悉其Prompt工程和常见应用模式。
将AI辅助编程作为日常习惯,熟练使用GitHub Copilot、Cursor、或类似AI编程工具来提升开发效率。
关注并尝试过AI开源社区的项目,对Hugging Face等平台有了解和使用经验。
3. 扎实的算法基础:
熟练掌握常见的数据结构(如数组、链表、树、图、哈希表)和算法(如排序、搜索、动态规划),具备良好的编程实现能力。
理解计算机系统的基础知识,对时间复杂度、空间复杂度有清晰的概念。
4. 机器学习/深度学习基础:
熟悉机器学习的基本概念(如训练/测试集、过拟合、正则化、交叉验证)和常见模型(如线性模型、决策树、SVM等)。
对深度学习有初步了解,理解神经网络的基本原理,熟悉CNN/RNN/Transformer中至少一种架构的核心思想。
5. 编程语言:
至少精通Python或Java中的一门,并能够编写清晰、高效的代码。
(Python方向)了解NumPy、Pandas等科学计算库,以及PyTorch或TensorFlow之一。
(Java方向)了解常用的开发框架(如Spring Boot),并愿意学习Python及相关AI生态工具。
优先考虑(具备以下任一方向经验者):
1、视觉方向:
了解OpenCV、Pillow等图像处理库。
有使用主流CV框架(如MMDetection, Detectron2, PaddleCV)或图像生成模型(如Stable Diffusion)。
2、筹划与决策方向:
了解经典路径规划算法(如A*、Dijkstra)或任务规划技术。
对强化学习(RL)有基础概念,或有相关框架(如OpenAI Gym, Ray RLlib)的使用经验。
3、大模型应用方向:
对RAG、Agent、模型微调(Fine-tuning)等技术领域有初步了解或实践。
接触过向量数据库、LangChain/LlamaIndex等LLM应用开发框架。
4、通用能力:
有实际项目部署到线上环境(如使用云服务)的经历。
在Kaggle、天池等算法竞赛中取得过良好成绩,或阅读并复现过AI顶会论文的代码。