General Information

Req #
100016824
Career area:
Engineering
Country/Region:
China
State:
Beijing
City:
北京(Beijing)
Date:
Thursday, March 19, 2026
Additional Locations
* China

Why Work at Lenovo

We are Lenovo. We do what we say. We own what we do. We WOW our customers.

Lenovo is a US$69 billion revenue global technology powerhouse, ranked #196 in the Fortune Global 500, and serving millions of customers every day in 180 markets. Focused on a bold vision to deliver Smarter Technology for All, Lenovo has built on its success as the world’s largest PC company with a full-stack portfolio of AI-enabled, AI-ready, and AI-optimized devices (PCs, workstations, smartphones, tablets), infrastructure (server, storage, edge, high performance computing and software defined infrastructure), software, solutions, and services. Lenovo’s continued investment in world-changing innovation is building a more equitable, trustworthy, and smarter future for everyone, everywhere. Lenovo is listed on the Hong Kong stock exchange under Lenovo Group Limited (HKSE: 992) (ADR: LNVGY). 

To find out more visit www.lenovo.com and read about the latest news via our StoryHub.

Description and Requirements

岗位职责:

1. 负责AI Computing Hub平台设计与交付,基于MCP扩展Hub API/SDK,支持设备能力抽象、上下文访问及策略管理;构建能力注册中心,实现多设备编排与Agent-to-Agent协作;设计插件化连接器,兼容BLE、Wi-Fi、Matter等多种协议,保障安全握手与消息路由。

2. 承担端侧LLM/多模态模型优化与部署工作,集成OpenVINO、ONNX Runtime等推理框架,支持CPU/GPU/NPU异构加速;实施模型量化、KV-Cache管理、算子融合与图优化等方案,达成内存占用降低、长上下文支持及性能提升目标;支持结构化输出,搭建本地RAG管线并结合隐私保护与离线优先策略。

3. 负责上下文融合与场景编排,构建Context Graph和事件总线,整合多设备信号以驱动自动化工作流,确保场景迁移成功率≥98%;设计RBAC/ABAC策略引擎,保障权限控制与数据驻留合规。

4. 开展性能、安全与合规治理工作,优化端侧推理性能、功耗及稳定性,实现能效提升≥20%、Crash-free比例≥99.5%;落地TEE、密钥管理等安全机制,满足隐私保护与合规要求。

5. 负责云-端协同(不上传用户数据)相关工作,管理模型分发、版本控制与灰度发布,确保端侧模型持续优化迭代。

6. 梳理并更新AI技术全景图(Tech Stack)与AI技术规划(Roadmap),确保与公司战略及业务需求对齐,推动技术演进与创新落地。

岗位要求:

1. 具备轻量端侧LLM/VLM(≤7B)技术能力,深入理解Transformer架构、提示工程与上下文管理;熟悉结构化输出、RAG管线,掌握LoRA、QLoRA、PEFT等模型微调和适配技术。

2. 精通模型优化与推理性能相关技术,熟练掌握INT8/INT4量化、KV-Cache管理与压缩等小型化优化方案;了解算子融合与图优化技术,能实现端侧性能目标(首token延迟≤200ms、吞吐≥50 tokens/s(7B模型)、内存占用降低≥30%)。

3. 熟悉推理框架与硬件适配,熟练使用OpenVINO、ONNX Runtime、ROCm/MIGraphX、DirectML等推理框架;了解TensorRT-LLM,具备CPU/GPU/NPU异构加速经验。

4. 具备协议与连接技术能力,熟悉BLE、Wi-Fi、Zigbee、Matter等协议及NAT、QoS、ICE/STUN/TURN等网络机制。

5. 掌握隐私与安全相关技术,熟悉RBAC/ABAC、零信任架构、Sandbox/TEE;了解联邦学习、差分隐私,具备审计与可观测性设计经验。

6. 精通事件驱动架构与流式处理技术(Pub/Sub、Kafka、Redis Streams、NATS等),能使用图模型/图数据库进行设备与上下文建模。

7. 熟练掌握C++、Rust、Go、Python编程语言,具备Windows端侧交付能力,有Linux兼容设计经验者优先。

8. 拥有8年以上系统或平台架构经验,具备端侧模型优化和跨设备协同项目经验;有性能优化成果或开源贡献者优先。

9. 具备良好的英文听说读写能力,能熟练与国际AI开发者和技术合作伙伴沟通协作。

10. 具备较强的技术领导力和跨团队协作能力,能有效推动复杂系统落地实施。

Additional Locations
* China
* China