Position Overview
微信搜索-AI Infra工程师-大模型后训练与RL方向(北京)(深圳) 广州 分享
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 WXG 点击了解更多BG信息 技术 一年以上工作经验 更新于年06月11日
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。 岗位职责
1.负责大模型后训练框架和RL训练的设计,开发和优化。支撑LLM的高效、稳定训练;
2.持续追踪并引入业界最新开源生态技术(如 Verl, Slime, ROLL, AReal 等);
3.与搜索算法团队紧密合作,设计实现高性能的AI搜索大模型,加速最新的大模型技术在搜索场景的落地。 岗位要求
1.具备较强的动手能力;熟悉 Python ,具备扎实的系统编程功底和优秀的复杂系统 Debug 能力;
2.深入理解大模型分布式训练原理,具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的开发和优化经验;
3.熟悉大模型后训练与对齐技术(PPO、GRPO、DPO等),熟悉 Verl、ROLL,AReal 等强化学习/分布式计算框架,有实际开发部署并解决相关问题的经验;
4.熟悉最新的大模型结构,熟悉各种软硬件架构,能够结合具体的模型结构和软硬件架构做训练过程的深度优化。