Position Overview
大模型异构芯片推理适配调优工程师(深圳/北京/上海/杭州) 北京 分享
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 TEG 点击了解更多BG信息 技术 一年以上工作经验 更新于年06月15日
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。 岗位职责
基于多种异构芯片,GPGPU/NPU/XPU等,协同算法和业务团队,主导分布式异构推理系统的开发设计与落地实现,聚焦低延时、高吞吐目标,使能多种异构芯片算力和攻克大规模推理系统工程化落地关键技术,主要包括;
1.模型适配:针对业界主流(如DeepSeek,Qwenxilie)和自研大模型进行多芯片适配;
2.精度调优:解决适配过程中模块和端到端精度异常现象;
3.系统性能调优:针对推理全链路进行性能Profiling剖析,确保关键算子、系统调度等状态,并通过系统工程优化等手段实现最优性能目标;
4.推理框架/引擎架构优化:针对多芯片架构关键特性,在推理框架层面进行专项优化,确保最优效果;
5.核心算子开发/调优:针对推理关键算子和场景,结合多种芯片微架构、硬件特点,进行针对性优化,提升底层计算/通信效率。 岗位要求
1.熟练掌握C/C++、Python编程语言,具备良好的coding和调试能力,具备计算机体系架构功底和大型分布式系统开发调优经验优先;
2.熟悉和调优NVIDIA GPU和各种AI芯片至少一种,包括AMD、海光/摩尔/沐曦/ GPGPU架构、Ascend、寒武纪、昆仑芯等,两种以上优先;
3.熟悉和调优GPU和各种AI芯片底层算子编程方式至少一种,包括CUDA、Triton、TileLang、AscendC、BangC等,两种以上优先;
4.精通和具备vllm/sglang 等推理引擎深度实践经验,参与过基于上...