Position Overview
边缘AI推理研发工程师(深圳) 北京 分享
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 TEG 点击了解更多BG信息 技术 两年以上工作经验 更新于年06月08日 岗位职责
推理方向:
1.面向低延迟交互场景打造极致低延迟推理系统,通过调度、传输、计算优化,深度优化端到端推理延迟;
2.设计开发一站式 Serverless AI 推理平台,结合边缘云 Serverless 生态支持一站式边缘 AI 应用,提升实时语音交互等低延迟 AI 应用场景的用户体验;
缓存方向:
1.面向低延迟交互场景打造 KVCache 缓存系统,通过 KVCache 卸载、传输、压缩优化,深度优化端到端推理延迟,提升实时语音交互等低延迟 AI 应用场景的用户体验;
2.设计开发边缘推理 KVCache 平台,结合边缘云 Serverless 生态支持一站式边缘 AI 应用,通过 KVCache 复用、分层存储、跨请求共享等技术提升推理性能。 岗位要求
推理方向:
1.有 AI 推理在工业上大规模落地的经验,熟悉 LLM 的模型架构和常用的推理加速方法;
2.熟悉 GPU/TPU 架构,并且能根据硬件架构合理设计上层算力调度、推理加速等相关软件栈,充分发挥硬件算力;
3.熟悉 sglang、vLLM、TensorRT-LLM 等常用推理框架,理解框架的设计和推理加速方法,了解异构芯片的适配过程; 缓存方向:
1.有 KVCache 优化或 AI 推理在工业上大规模落地的经验,熟悉 LLM 的模型架构和常用的推理加速方法,理解 KVCache 机制对推理性能的影响;
2.熟悉 SGLang、vLLM、TensorRT-LLM 等常用推理框架,理解框架的 KVCache 设计和推理加速方法;
3.熟悉低延迟硬盘IO优化和网络传输优化,包括但不限于Linux异步IO框架、RDMA高性能网络传输协议等。