⏰ Full-time

微信搜索-AI Infra工程师-大模型后训练与RL方向（北京）（深圳）

🏢

Tencent

                    Location
                    📍 Guangzhou, China
                

                    Posted
                    📅 June 20, 2026
                

                    Work Type
                    ⏰ Full-time
                

Position Overview

                    微信搜索-AI Infra工程师-大模型后训练与RL方向（北京）（深圳） 广州 分享 
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
 收藏 WXG 点击了解更多BG信息 技术 一年以上工作经验 更新于年06月11日 在腾讯，后台开发工程师不仅是“又快又稳”的问题解决专家，更是生态共创者。你将与技术团队一同沉淀优质代码，让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段，你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神，同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
 岗位职责 1.负责大模型后训练框架和RL训练的设计，开发和优化。支撑LLM的高效、稳定训练；
2.持续追踪并引入业界最新开源生态技术（如 Verl, Slime, ROLL, AReal 等）；
3.与搜索算法团队紧密合作，设计实现高性能的AI搜索大模型，加速最新的大模型技术在搜索场景的落地。
 岗位要求 1.具备较强的动手能力；熟悉 Python ，具备扎实的系统编程功底和优秀的复杂系统 Debug 能力；
2.深入理解大模型分布式训练原理，具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的开发和优化经验；
3.熟悉大模型后训练与对齐技术（PPO、GRPO、DPO等），熟悉 Verl、ROLL，AReal 等强化学习/分布式计算框架，有实际开发部署并解决相关问题的经验；
4.熟悉最新的大模型结构，熟悉各种软硬件架构，能够结合具体的模型结构和软硬件架构做训练过程的深度优化。

Apply Now

Submit Application →

Quick and easy application process

Job Details

⏰

Employment Type

Full-time

📊