Position Overview
微信搜索-AI Infra 工程师-大模型推理方向 (深圳)(广州) 北京 分享
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 WXG 点击了解更多BG信息 技术 一年以上工作经验 更新于年06月11日
在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。 岗位职责
1.工作职责:;
2.负责开发和优化LLM,VLM等大模型的推理引擎,构建适合AI Search,智能 Agent相关领域大规落地应用中的推理基础架构;
3.紧跟 LLM Infra 领域的前沿技术演进突破,将合适成果落地于实际应用;
4.与搜索算法同学深度合作,联合优化,设计实现能够给大型搜索系统带来代际更迭的大模型。 岗位要求
1.岗位要求:;
2.熟悉AI基础硬件设置,有真实的大规模推理系统的设计开发部署经验;
3.熟悉各种主流LLM/VLM的模型结构,具有 vllm/sglang/TRT-llm等推理引擎优化实践经验;
4.熟悉LLM 推理常用加速方法(算子融合、量化策略、动态批处理、分布式KV 缓存优化等);
5.有针对真实场景问题的LLM 模型结构和的设计优化经验。