⏰ Full-time

混元大模型推理加速工程师（北京/深圳）

🏢

Tencent

                    Location
                    📍 Shenzhen, China
                

                    Posted
                    📅 June 23, 2026
                

                    Work Type
                    ⏰ Full-time
                

Position Overview

                    混元大模型推理加速工程师（北京/深圳） 深圳 分享 
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
 收藏 TEG 点击了解更多BG信息 技术 五年以上工作经验 更新于年06月15日 在腾讯，后台开发工程师不仅是“又快又稳”的问题解决专家，更是生态共创者。你将与技术团队一同沉淀优质代码，让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段，你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神，同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
 岗位职责 1.配合算法工程师，推动深度学习相关算法的落地，打造高吞吐、低延时的推理系统；
2.优化大模型推理性能，提升吞吐并控制成本；
3.优化大模型推理框架，提升框架易用性和可调试性。
 岗位要求 1.熟练掌握 C/C++、Python语言，有计算机体系结构背景或软件开发背景，熟悉系统性能调优的方式；
2.具备基础的GPU编程能力，包括但不限于Cuda、OpenCL；熟悉至少一种GPU加速库，如cublas、cudnn、cutlass等；
3.有Tensorrt/FasterTransformer/Tensorrt-llm/vllm等深度学习推理框架的实际使用经验；
4.熟悉各类深度学习网络和算子底层实现细节，训练和推理模型调试、调优有实操经验优先；
5.熟悉CPU/GPU异构加速瓶颈分析方法，有服务器端 AI 芯片、GPU加速经验优先；
6.熟悉分布式推理常用加速方法，有超大模型分布式部署经验优先。

Apply Now

Submit Application →

Quick and easy application process

Job Details

⏰

Employment Type

Full-time

📊