Position Overview
微信-多模态大模型算法工程师-OCR与文档理解方向(北京) 深圳 分享
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 WXG 点击了解更多BG信息 技术 一年以上工作经验 更新于年06月18日 岗位职责
负责微信在OCR、文档理解等垂类方向的多模态大模型技术研发和业务落地,支持相关模型在微信C端应用,以及视频号、公众号、微信小店等业务的搜索、推荐、审核等领域的应用。 岗位要求
1.深度参与过业界主流或知名多模态大模型的研发工作,系统理解整体技术架构与设计方案。具备大规模数据构建、清洗、治理及分布式模型训练的实战经验。
2.精通大模型预训练、监督微调(SFT)、对齐与后训练(如 RLHF / DPO 等)等训练范式,深入理解相关算法原理、工程实现细节及训练稳定性与效率优化方法。
3.精通通用 OCR、表格识别、版面分析、关键信息抽取(KIE)等文档智能核心技术,具备完整的业务落地或产品化经验者优先。
4.在计算机视觉、图形学等领域的国际顶级会议或期刊(如 CVPR / ICCV / ECCV / NeurIPS / SIGGRAPH 等)发表过高质量论文者优先。在视觉、算法相关竞赛或业界权威榜单中取得优异成绩,或在 GitHub 具备较高影响力的开源项目中有核心贡献者优先。
5.具备扎实的工程实现能力,熟练使用 Python,具备良好的代码规范与系统设计能力,熟悉或精通 C/C++ 者优先。
技术架构团队缔造了微信后台的第一行代码,目前已成为集应用开发和基础研究于一身的重要部门。该团队创立了 WXG 内部开发者每日使用的 ABC(AI、BigData、Cloud)平台,其中包括 AI 应用平台、BigData 平台和 Cloud 平台。AI 应用平台承担了各项 AI 技术在具体业务中的落地功能,支持每分钟数千万次的调用。BigData 平台负责大数据分析和挖掘功能,每天支持上百万次的任务运行。Cloud 平台则负责计算和存储资源的调度功能,为庞大的在线服务系统以及 AI 和 BigData 的训练和推理任务提供支持。此外,...