微信-基座大模型后训练算法专家

Tencent

Beijing, Beijing, China Full-time June 21, 2026

Apply Now

Opportunity Description

微信-基座大模型后训练算法专家北京分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 WXG 点击了解更多BG信息技术三年以上工作经验更新于年06月16日岗位职责

1.基座大模型（LLM）推理能力和通用能力的核心技术研发，包括数学推理、代码、逻辑推理、知识推理、创作、多轮对话、问答、翻译等任务的算法研发、优化，突破模型智力上限；
2.提升基座大模型在复杂场景的高阶处理能力，如多轮交互（复杂指令遵循、多轮对话、角色扮演等）、Agent 能力（融合“思考模式”与“非思考模式”，实现自主、精准的函数与工具调用）；
3.跟踪前沿技术，参与前沿算法研究，如研发更高效的强化学习（RL）训练算法、探索自适应思考深度的模型优化算法、探索提升思维链的 “智能密度” 的方法等，推动研究成果在业务场景的落地应用；
4.对于探索前沿技术有很好的热情，具备独立探索前沿技术的能力，有良好的团队协作和沟通能力。

岗位要求

1.计算机科学、数学、人工智能等相关专业硕士及以上学历；
2.具备良好的数理基础和 NLP 技术基础，能够熟练使用 Megatron，HuggingFace，DeepSpeed，PyTorch 等框架至少一种，深入理解 Transformer、GPT 等模型架构；
3.在 Post-training 方向有一定研究基础，熟悉 SFT/DPO/PPO/GRPO/Reward Model 等；
4.具备良好的分析和解决问题的能力，针对具体的应用场景能合理设计和优化算法并应用；
5.对于探索前沿技术有很好的热情，具备独立探索前沿技术的能力，有良好的团队协作和沟通能力。

加分项

1.主导过推理任务优化项目（如数学、编程、逻辑问答），在权威推理评测中取得过显著效果提升；
2.以第一作者身份发表过 NeurIPS、ICML、ICLR、ACL、EMNLP、NAACL 等论文；
3.了解 GPU 硬件架构，有 CUDA 编程经验，熟悉各种网络底层算子实现细节。

Full-time Other-General

Ready to Apply?

Submit your application for 微信-基座大模型后训练算法专家 at Tencent

Apply for this Position

Location Beijing, Beijing

Country China

Type Full-time

Category Other-General

Posted June 21, 2026

Deadline July 31, 2026

微信-基座大模型后训练算法专家

Opportunity Description

Ready to Apply?

Opportunity Details

About Tencent

Tencent

Share This Opportunity