职位描述
大模型算法PyTorchPythonAGENTSFT人工智能家具制造家具/家居/家电
一.岗位职责
1. 参与智能家居相关的大模型Agent设计与应用,构建包含意图识别、复杂任务拆解、多步推理、ReAct工具调用、长短期记忆及智能推荐在内的完整链路。
2. 运用SFT、RL等后训练方法训练强化垂域模型,提升大模型的多步推理、上下文遵循、ReAct工具调用、领域问答等能力。
3. 基于数据反馈构建高质量训练数据,设计奖励函数与优化机制,提升模型在垂直领域的泛化能力,利用PPO/GRPO等算法建设基于强化学习的迭代路径。
4. 跟踪LLM与Agent领域的国际前沿技术(如多智能体协作、LongContext、CoT),推动前沿技术在业务中的应用落地。
5. 深度理解智能家居业务,沉淀通用、模块化的算法能力,与产品、工程紧密沟通协作,推动业务迭代。
二.任职资格
1. 本科及以上学历,计算机、人工智能等相关专业,具备扎实的数据结构与算法基础,3年以上相关工作经验。
2. 具备扎实的Python编程能力,熟练掌握PyTorch等深度学习框架,有优秀的代码规范与工程素养。
3. 熟悉LLM训练全流程(Pre-train/CPT/SFT/RLHF),熟练使用主流训练/推理框架(如Megatron-LM、DeepSpeed、vLLM、 Sglang等)。
4. 深入理解强化学习原理,熟悉PPO、DPO、GRPO等算法基本原理,熟悉基于RLVR的强化学习训练者优先。
5. 具备敏锐的技术视野,能够将前沿算法与复杂的业务相结合,产出实际价值。
6. 具备良好的沟通协作能力,工作积极主动,具备较强的学习能力,可快速验证新想法,推动技术进步。
三.加分项
1. 主导过基于ReAct/FunctionCall的Agent生产级应用开发。
2. 在大规模模型训练中有数据合成或强化学习训练的实战经验。
在开源社区发布过有一定影响力的项目。
1. 参与智能家居相关的大模型Agent设计与应用,构建包含意图识别、复杂任务拆解、多步推理、ReAct工具调用、长短期记忆及智能推荐在内的完整链路。
2. 运用SFT、RL等后训练方法训练强化垂域模型,提升大模型的多步推理、上下文遵循、ReAct工具调用、领域问答等能力。
3. 基于数据反馈构建高质量训练数据,设计奖励函数与优化机制,提升模型在垂直领域的泛化能力,利用PPO/GRPO等算法建设基于强化学习的迭代路径。
4. 跟踪LLM与Agent领域的国际前沿技术(如多智能体协作、LongContext、CoT),推动前沿技术在业务中的应用落地。
5. 深度理解智能家居业务,沉淀通用、模块化的算法能力,与产品、工程紧密沟通协作,推动业务迭代。
二.任职资格
1. 本科及以上学历,计算机、人工智能等相关专业,具备扎实的数据结构与算法基础,3年以上相关工作经验。
2. 具备扎实的Python编程能力,熟练掌握PyTorch等深度学习框架,有优秀的代码规范与工程素养。
3. 熟悉LLM训练全流程(Pre-train/CPT/SFT/RLHF),熟练使用主流训练/推理框架(如Megatron-LM、DeepSpeed、vLLM、 Sglang等)。
4. 深入理解强化学习原理,熟悉PPO、DPO、GRPO等算法基本原理,熟悉基于RLVR的强化学习训练者优先。
5. 具备敏锐的技术视野,能够将前沿算法与复杂的业务相结合,产出实际价值。
6. 具备良好的沟通协作能力,工作积极主动,具备较强的学习能力,可快速验证新想法,推动技术进步。
三.加分项
1. 主导过基于ReAct/FunctionCall的Agent生产级应用开发。
2. 在大规模模型训练中有数据合成或强化学习训练的实战经验。
在开源社区发布过有一定影响力的项目。
展开该职位详情
工作地点
南昌青山湖区In Park星光天地B座17楼

工作地点

公司信息
唐人通信技术服务股份有限公司
未融资 · 1000-9999人 · 运营商/增值服务、通信/网络设备
已审核
公司介绍
唐人通信技术服务股份有限公司,成立于2008年3月,是江西首批在新三板上市的高新技术服务企业,管理中心设在江西省南昌市高新技术产业开发区创新三路1069号唐人科技园,产业中心设在南昌市经开区瑞香路900号唐人产业园,公司业务范围为通信网络运维与保障、通信工程施工、建筑智能化、城市轨道通信网络建设等,资质等级及业绩行业内名列前茅,业务范围覆盖全国26个省份,公司围绕“两新一重”全面布局,在夯实网络综合代维、通信建设工程两大传统业务规模的同时,着力打造政企业务、数智化业务及产品研发等板块,立志成为未来中国新基建领域的龙头企业。
工商信息
企业名称 唐人数智科技股份有限公司
企业类型 股份有限公司(非上市、自然人投资或控股)
法人代表 肖枚
经营状态 存续
成立时间 2008-03-10
注册资本 9693.33万元
认证资质
营业执照信息
相似职位
查看更多Agent 开发应用工程师(AI Agent Engineer)
1.2-1.7万 江西太平洋宇洪建设有限公司
3-5年
本科
深度学习
多模态算法
大模型算法
Python
AI AGENT
LANGCHAIN
LANGGRAPH
OPENCLAW
计算机软件
人工智能
企业服务
数据算法工程师
1-1.5万 江西云偌信息科技有限公司
3-5年
本科
软件工程
数学
Python
PyTorch
TensorFlow
GAN
大模型算法
扩散模型
大模型生成
人工智能
云计算/大数据
计算机软件
AI应用工程师
2-4万·13薪 科锐尔人力资源服务(苏州)有限公司
3-5年
本科
深度学习
大模型算法
GPT
Python
PyTorch
TensorFlow
机器学习
人工智能
互联网
物联网
AI应用工程师
8000-12000元 南昌拓点科技有限公司
1-3年
本科
五险
有餐补
交通补助
通讯补助
绩效奖金
图像算法
强化学习
大模型算法
机器视觉
自然语言处理
知识图谱
人工智能
工业自动化
AI智能体开发工程师(Agent方向)
9000-18000元·13薪 南昌博方教育科技有限公司
1-3年
本科
年终奖
五险一金
定期团建
深度学习
多模态算法
大模型算法
GPT
XLNet
RoBERTa
ALIGN
BLIP
VLMo
Transformer
DNN
LSTM
机器视觉
知识图谱
通信算法
PyTorch
TensorFlow
OpenCV
Python
C++
C语言
人工智能
计算机软件
科学技术推广
最新招聘
热门城市
热门职位
热门公司
太原爱瞳眼镜有限公司小店分公司
大方县郭莱客生活美容服务馆(个体工商户)
兴城市德锦商贸有限公司
珠山区宏博咖啡店(个体工商户)
盐山县广兴铝合金门窗厂
天津市金民蔬菜专业合作社
任丘市双宇饭店
隆达万成国际贸易(大连)有限公司
福建省迈发建筑工程有限公司
温州市沃泰狼电子商务有限公司
东营招聘
儋州招聘
太原招聘
台湾招聘
鄂州招聘
梧州招聘
保山招聘
宁波招聘
西安招聘
昌吉招聘
天门市招聘
南宁招聘
广州招聘
杭州招聘
泰安招聘
哈密招聘
汉中招聘
阿克苏招聘
酒泉招聘
北屯市招聘


