🌍 Global Opportunities
Updated Hourly
🎓 Student Friendly

parttimejobs.work

Flexible Work, Better Balance

⏰ Full-time

混元大模型推理加速工程师(北京/深圳)

Tencent
Location 📍 Shenzhen, China
Posted 📅 June 23, 2026
Work Type ⏰ Full-time

Position Overview

混元大模型推理加速工程师(北京/深圳) 深圳 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 TEG 点击了解更多BG信息 技术 五年以上工作经验 更新于年06月15日
  • 在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
  • 岗位职责
  • 1.配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统;
    2.优化大模型推理性能,提升吞吐并控制成本;
    3.优化大模型推理框架,提升框架易用性和可调试性。
  • 岗位要求
  • 1.熟练掌握 C/C++、Python语言,有计算机体系结构背景或软件开发背景,熟悉系统性能调优的方式;
    2.具备基础的GPU编程能力,包括但不限于Cuda、OpenCL;熟悉至少一种GPU加速库,如cublas、cudnn、cutlass等;
    3.有Tensorrt/FasterTransformer/Tensorrt-llm/vllm等深度学习推理框架的实际使用经验;
    4.熟悉各类深度学习网络和算子底层实现细节,训练和推理模型调试、调优有实操经验优先;
    5.熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端 AI 芯片、GPU加速经验优先;
    6.熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先。
  • Apply Now

    Submit Application →

    Quick and easy application process

    Job Details

    Employment Type
    Full-time
    📊
    Category
    Other-General
    🏠
    Work Arrangement
    On-site
    📍
    Location
    Shenzhen, China