🌍 Global Opportunities
Updated Hourly
🎓 Student Friendly

parttimejobs.work

Flexible Work, Better Balance

⏰ Full-time

大模型训练框架研发工程师-强化学习/精调/蒸馏方向

Tencent
Location 📍 Shenzhen, China
Posted 📅 June 21, 2026
Work Type ⏰ Full-time

Position Overview

大模型训练框架研发工程师-强化学习/精调/蒸馏方向 深圳 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 CSIG 点击了解更多BG信息 技术 三年以上工作经验 更新于年04月08日
  • 在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
  • 岗位职责
  • 1.框架开发与优化:负责强化学习、模型精调、知识蒸馏等核心模块的设计与开发,提升框架的训练效率与易用性;
    2.分布式训练支持:基于Megatron-LM、DeepSpeed等工具,优化大模型分布式训练策略(数据并行/张量并行/流水并行/专家并行等),解决显存、通信与计算瓶颈;
    3.工具链构建:参与开发轻量化训练框架(如LLama-Factory、swift),支持快速模型微调、部署及多硬件平台适配;
    4.前沿技术探索:跟踪学术动态(如RLHF、MoE架构、FlashMLA、EPLB、DualPipe等),将最新研究成果转化为框架功能,提升产品竞争力;
    5.协作与文档:与产品团队紧密配合,提供框架级解决方案;编写技术文档与案例,赋能公有云客户。
  • 岗位要求
  • 1.计算机科学、数学、电子工程等相关专业硕士及以上学历,3年以上深度学习框架或工具链开发经验,精通Python,熟练使用C++;
    2.有Megatron-LM、DeepSpeed等开源框架使用或二次开发经验,理解分布式训练、显存优化技术;
    3.熟悉 GRPO/PPO 等 RL 算法、veRL/Slime/AReaL等强化学习框架者优先;
    4.熟悉CUDA编程、高性能计算优化(如算子融合、通信优化)者优先;
    5.熟悉NCCL、MPI等集合通信算法者优先;
    6.工程经验上具备大型项目架构设计能力,能独立解决性能调优、多节点调试等复杂问题;
    7.综合素养;强烈的技术热情,良好...
  • Apply Now

    Submit Application →

    Quick and easy application process

    Job Details

    Employment Type
    Full-time
    📊
    Category
    Other-General
    🏠
    Work Arrangement
    On-site
    📍
    Location
    Shenzhen, China