🌍 Global Opportunities
Updated Hourly
🎓 Student Friendly

parttimejobs.work

Flexible Work, Better Balance

⏰ Full-time

混元大模型后训练算法工程师/专家-agent

Tencent
Location 📍 Beijing, China
Posted 📅 June 10, 2026
Work Type ⏰ Full-time

Position Overview

混元大模型后训练算法工程师/专家-agent 北京 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 TEG 点击了解更多BG信息 技术 五年以上工作经验 更新于年04月10日 岗位职责
  • 1.负责大模型后训练(SFT+RL)阶段 Agent 类数据的全链路研发,针对 Agent 场景特有的多轮交互、长链路规划及工具调用特性,设计并落地基于多智能体博弈、复杂轨迹生成等技术的数据生产、自动化质检与定向修复方案,确保 Agent 数据的稳定、高标准交付;
    2.深度参与 Agent 能力的专项评测与分析,制定科学的评价指标体系,通过剖析模型在实际任务中的弱项(如探索效率、工具使用等),设计并落地高效的数据飞轮机制,定向进行数据补充与配方调整,实现“评测发现问题-数据定向强化-效果闭环提升”,持续驱动模型核心能力的演进;
    3.深度追踪与研究用于支撑大模型后训练与 Agent 能力提升的前沿数据技术,关注数据自动生成、复杂轨迹数据构建、多模态与多智能体互动等方向,能够将最新数据相关成果快速转化为业务价值。
  • 岗位要求
  • 1.计算机科学、人工智能或相关专业硕士及以上学历,具备大模型数据工程或模型训练实际项目经验;
    2.深入理解 Transformer 架构及大语言模型训练原理,具备丰富的数据经验,能针对 LLM Alignment、RLHF等后训练场景,设计高标准数据方案,有项目实战经验;
    3.深入实践过 ReAct、Reflexion 等前沿 Agent 推理框架,能够深度剖析 Agent 运行轨迹,系统性优化其思维链质量、工具调用的鲁棒性及环境反馈准确性;
    4.熟练掌握 Python,熟悉 PyTorch/TensorFlow 等深度学习框架,能高效利用模型能力解决数据链路难点;
    5.在CCF-A顶会(NeurIPS, ICLR, ICML, ACL 等)有高质量论文发表,或在开源社区(如 HuggingFace、GitHub大模型相关项目)有高影响力贡献者优先;
    6.具备强烈的数据敏感度、技术热情和自驱力,能够从繁杂的数据中洞察模型能力的...
  • Apply Now

    Submit Application →

    Quick and easy application process

    Job Details

    Employment Type
    Full-time
    📊
    Category
    Other-General
    🏠
    Work Arrangement
    On-site
    📍
    Location
    Beijing, China