🌍 Global Opportunities
Updated Hourly
🎓 Student Friendly

parttimejobs.work

Flexible Work, Better Balance

⏰ Full-time

混元Agent评测Infra工程专家(北京/上海/深圳)

Tencent
Location 📍 Beijing, China
Posted 📅 June 23, 2026
Work Type ⏰ Full-time

Position Overview

混元Agent评测Infra工程专家(北京/上海/深圳) 北京 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 TEG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月05日 岗位职责
  • 1.主导 Agent Benchmark 的平台化落地:负责 SWE、Terminal、Claw、MCP 等多类 Agent Benchmark 在评测平台上的整体接入与工程化,沉淀标准化、可复用的接入能力;
    2.构建评测运行底座:统筹沙盒环境、依赖管理、网络访问、并发调度等关键能力建设,保障大规模评测在生产环境下的稳定、可复现与高效运行;
    3.保障评测质量与可观测性:从 Harness 与打分逻辑出发,确保平台化改造后评测结果的准确可信,并建立完善的诊断与问题归因能力;
    4.衔接算法与工程:深入理解各 Benchmark 所考察的模型能力维度,作为算法与平台之间的技术桥梁,推动评测需求高质量落地。
  • 岗位要求
  • 1.计算机相关专业本科及以上学历,3年及以上后端 / 平台 / Infra 研发经验;
    2.精通至少一门主流后端语言(Python / Go / Java 等),主导过中大型平台或系统的设计与落地,具备优秀的系统设计与工程实现能力;
    3.熟悉容器化与沙盒隔离、分布式系统、任务调度与并发控制,有大规模任务编排或性能优化经验;熟悉网络通信与代理机制,能处理外部接口访问与稳定性问题;
    4.了解大模型与 Agent 的基本原理,熟悉主流 Agent Benchmark(如 SWE-bench、Terminal-Bench、MCP 相关评测等)的 Harness 与打分逻辑,并据此进行工程化抽象,能与算法团队就模型能力与评测指标深度对话;
    5.具备丰富的跨团队协作经验,能在算法、平台、底层基础设施等多方之间有效拉通与推进;具备较强的技术主导力与 Owner 意识,面对复杂不确定问题有冲劲、能扛事、能落地。
  • Apply Now

    Submit Application →

    Quick and easy application process

    Job Details

    Employment Type
    Full-time
    📊
    Category
    Other-General
    🏠
    Work Arrangement
    On-site
    📍
    Location
    Beijing, China