🌍 Global Opportunities
Updated Hourly
🎓 Student Friendly

parttimejobs.work

Flexible Work, Better Balance

⏰ Full-time

边缘AI推理研发工程师(深圳)

Tencent
Location 📍 Beijing, China
Posted 📅 June 14, 2026
Work Type ⏰ Full-time

Position Overview

边缘AI推理研发工程师(深圳) 北京 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 TEG 点击了解更多BG信息 技术 两年以上工作经验 更新于年06月08日 岗位职责
  • 推理方向:
    1.面向低延迟交互场景打造极致低延迟推理系统,通过调度、传输、计算优化,深度优化端到端推理延迟;
    2.设计开发一站式 Serverless AI 推理平台,结合边缘云 Serverless 生态支持一站式边缘 AI 应用,提升实时语音交互等低延迟 AI 应用场景的用户体验;
    缓存方向:
    1.面向低延迟交互场景打造 KVCache 缓存系统,通过 KVCache 卸载、传输、压缩优化,深度优化端到端推理延迟,提升实时语音交互等低延迟 AI 应用场景的用户体验;
    2.设计开发边缘推理 KVCache 平台,结合边缘云 Serverless 生态支持一站式边缘 AI 应用,通过 KVCache 复用、分层存储、跨请求共享等技术提升推理性能。
  • 岗位要求
  • 推理方向:
    1.有 AI 推理在工业上大规模落地的经验,熟悉 LLM 的模型架构和常用的推理加速方法;
    2.熟悉 GPU/TPU 架构,并且能根据硬件架构合理设计上层算力调度、推理加速等相关软件栈,充分发挥硬件算力;
    3.熟悉 sglang、vLLM、TensorRT-LLM 等常用推理框架,理解框架的设计和推理加速方法,了解异构芯片的适配过程; 缓存方向:
    1.有 KVCache 优化或 AI 推理在工业上大规模落地的经验,熟悉 LLM 的模型架构和常用的推理加速方法,理解 KVCache 机制对推理性能的影响;
    2.熟悉 SGLang、vLLM、TensorRT-LLM 等常用推理框架,理解框架的 KVCache 设计和推理加速方法;
    3.熟悉低延迟硬盘IO优化和网络传输优化,包括但不限于Linux异步IO框架、RDMA高性能网络传输协议等。
  • Apply Now

    Submit Application →

    Quick and easy application process

    Job Details

    Employment Type
    Full-time
    📊
    Category
    Other-General
    🏠
    Work Arrangement
    On-site
    📍
    Location
    Beijing, China