🌍 Global Opportunities
Updated Hourly
🎓 Student Friendly

parttimejobs.work

Flexible Work, Better Balance

⏰ Full-time

大模型异构芯片推理适配调优工程师(深圳/北京/上海/杭州)

Tencent
Location 📍 Beijing, China
Posted 📅 June 23, 2026
Work Type ⏰ Full-time

Position Overview

大模型异构芯片推理适配调优工程师(深圳/北京/上海/杭州) 北京 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 TEG 点击了解更多BG信息 技术 一年以上工作经验 更新于年06月15日
  • 在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。
  • 岗位职责
  • 基于多种异构芯片,GPGPU/NPU/XPU等,协同算法和业务团队,主导分布式异构推理系统的开发设计与落地实现,聚焦低延时、高吞吐目标,使能多种异构芯片算力和攻克大规模推理系统工程化落地关键技术,主要包括;
    1.模型适配:针对业界主流(如DeepSeek,Qwenxilie)和自研大模型进行多芯片适配;
    2.精度调优:解决适配过程中模块和端到端精度异常现象;
    3.系统性能调优:针对推理全链路进行性能Profiling剖析,确保关键算子、系统调度等状态,并通过系统工程优化等手段实现最优性能目标;
    4.推理框架/引擎架构优化:针对多芯片架构关键特性,在推理框架层面进行专项优化,确保最优效果;
    5.核心算子开发/调优:针对推理关键算子和场景,结合多种芯片微架构、硬件特点,进行针对性优化,提升底层计算/通信效率。
  • 岗位要求
  • 1.熟练掌握C/C++、Python编程语言,具备良好的coding和调试能力,具备计算机体系架构功底和大型分布式系统开发调优经验优先;
    2.熟悉和调优NVIDIA GPU和各种AI芯片至少一种,包括AMD、海光/摩尔/沐曦/ GPGPU架构、Ascend、寒武纪、昆仑芯等,两种以上优先;
    3.熟悉和调优GPU和各种AI芯片底层算子编程方式至少一种,包括CUDA、Triton、TileLang、AscendC、BangC等,两种以上优先;
    4.精通和具备vllm/sglang 等推理引擎深度实践经验,参与过基于上...
  • Apply Now

    Submit Application →

    Quick and easy application process

    Job Details

    Employment Type
    Full-time
    📊
    Category
    Other-General
    🏠
    Work Arrangement
    On-site
    📍
    Location
    Beijing, China