🌍 Global Opportunities
Updated Hourly
🎓 Student Friendly

parttimejobs.work

Flexible Work, Better Balance

⏰ Full-time

微信搜索-AI Infra工程师-大模型后训练与RL方向(北京)(深圳)

Tencent
Location 📍 Guangzhou, China
Posted 📅 June 20, 2026
Work Type ⏰ Full-time

Position Overview

微信搜索-AI Infra工程师-大模型后训练与RL方向(北京)(深圳) 广州 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 WXG 点击了解更多BG信息 技术 一年以上工作经验 更新于年06月11日
  • 在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
  • 岗位职责
  • 1.负责大模型后训练框架和RL训练的设计,开发和优化。支撑LLM的高效、稳定训练;
    2.持续追踪并引入业界最新开源生态技术(如 Verl, Slime, ROLL, AReal 等);
    3.与搜索算法团队紧密合作,设计实现高性能的AI搜索大模型,加速最新的大模型技术在搜索场景的落地。
  • 岗位要求
  • 1.具备较强的动手能力;熟悉 Python ,具备扎实的系统编程功底和优秀的复杂系统 Debug 能力;
    2.深入理解大模型分布式训练原理,具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的开发和优化经验;
    3.熟悉大模型后训练与对齐技术(PPO、GRPO、DPO等),熟悉 Verl、ROLL,AReal 等强化学习/分布式计算框架,有实际开发部署并解决相关问题的经验;
    4.熟悉最新的大模型结构,熟悉各种软硬件架构,能够结合具体的模型结构和软硬件架构做训练过程的深度优化。
  • Apply Now

    Submit Application →

    Quick and easy application process

    Job Details

    Employment Type
    Full-time
    📊
    Category
    Other-General
    🏠
    Work Arrangement
    On-site
    📍
    Location
    Guangzhou, China