Opportunity Description
大模型Code/Agent后训练算法研究员-(深圳)or(北京)or 上海 分享 渴望为世界带来新意的人,早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索,积极布局,并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新,最终能带来美好的、撼动人心的改变。 岗位职责 1.负责Code和Agent相关数据构建与治理,构建高质量、多样化的Code/Agent训练数据集,搭建数据迭代闭环,通过数据飞轮持续优化数据质量;
2.负责Agent运行环境与训练环境的构建与优化,构建高可用、可扩展的Agent仿真环境,保障Agent训练、测试及落地的稳定性与高效性;
3.负责Agentic RL在Code/Agent场景的训练,参与Agentic RL Infra建设及优化、Agentic RL 算法优化,持续提升Agentic RL训练的效率和稳定性。 岗位要求 1.计算机、人工智能等相关专业硕士以上学历;
2.有大规模强化学习、大模型Code/Agent研发相关经验者优先;
3.具有扎实的深度学习算法基础,熟悉深度学习框架和分布式训练推理加速,有实操经验者优先;
4.在多模态/CV/NLP等领域顶级会议(期刊)发表过论文、主导/参与业界知名的开源项目者优先;
5.具备极强的学习能力和技术追求,良好的团队合作和沟通能力。
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 CSIG 点击了解更多BG信息 技术 两年以上工作经验 更新于年06月10日2.负责Agent运行环境与训练环境的构建与优化,构建高可用、可扩展的Agent仿真环境,保障Agent训练、测试及落地的稳定性与高效性;
3.负责Agentic RL在Code/Agent场景的训练,参与Agentic RL Infra建设及优化、Agentic RL 算法优化,持续提升Agentic RL训练的效率和稳定性。
2.有大规模强化学习、大模型Code/Agent研发相关经验者优先;
3.具有扎实的深度学习算法基础,熟悉深度学习框架和分布式训练推理加速,有实操经验者优先;
4.在多模态/CV/NLP等领域顶级会议(期刊)发表过论文、主导/参与业界知名的开源项目者优先;
5.具备极强的学习能力和技术追求,良好的团队合作和沟通能力。
Ready to Apply?
Submit your application for 大模型Code/Agent后训练算法研究员-(深圳)or(北京)or at Tencent
Apply for this Position