基本信息

职位编号:
WD00082619
工作领域:
Information Technology
国家/地区:
中国
省:
湖北
市:
武汉(Wuhan)
日期:
星期二, 5 月 13, 2025
工作性质:
Full-time
其他工作城市
* China - Hubei - 武汉(Wuhan)

为什么选择联想

联想文化,我们称之为 “We Are Lenovo”(我们,就是联想),其核心是:“说到做到,尽心尽力,成就客户”。

联想集团是一家年收入569亿美元的全球化科技巨头,位列《财富》世界500强第248名,服务遍布全球180个市场数以百万计的客户。为实现“智能,为每一个可能” 的公司愿景,联想在不断夯实全球个人电脑市场冠军地位的基础上,积极构建全栈式的计算能力,现已拥有包括人工智能赋能、人工智能导向和人工智能优化的终端、基础设施、软件、解决方案和服务在内的完整产品路线图,包括个人电脑、工作站、智能手机、平板电脑等终端产品,服务器、存储、边缘计算、高性能计算以及软件定义等基础设施产品。这一变革与联想改变世界的创新一起,共同为世界各地的人们成就一个更加包容、值得信赖的智慧未来。联想集团有限公司在香港交易所上市(港交所:992)(美国预托证券代号:LNVGY)。

欢迎访问联想官方网站 https://www.lenovo.com,并关注“联想集团”微博及微信公众号等社交媒体官方账号,或关注“联想招聘”公众号,获取联想最新动态。

职位描述和要求:

岗位职责

-平台运维与稳定性保障:负责AI智算平台(含GPU集群、分布式存储、高速网络)的日常运维、监控及故障响应,确保系统高可用性(SLA≥99.9%)。

-优化算力资源调度策略,提升GPU集群利用率,支持大模型训练/推理任务。

-自动化运维体系建设:开发运维脚本(Shell/Python),部署自动化工具(Ansible/Kubernetes),实现配置管理、日志分析及CI/CD流程。

-参与智能运维(AIOps)系统开发,集成异常检测与根因分析能力。

-跨团队协作与新技术落地:与算法团队协作,解决AI框架(如TensorFlow/PyTorch)与底层硬件的兼容性问题。

-探索RDMA网络、液冷技术等创新方案,降低智算中心PUE值。


岗位要求

  • -教育背景:专科及以上学历,计算机、网络工程、电子工程等相关专业。
  • -经验要求:3年以上智算中心或云计算平台运维经验,熟悉AI硬件(NVIDIA GPU/华为昇腾)及高速网络协议(InfiniBand/RoCE)。
  • -技术能力: 精通Linux系统管理、容器化技术(Docker/Kubernetes)及监控工具(Prometheus/Zabbix)。
  • -熟悉AI计算框架的底层依赖(如CUDA、NCCL),具备性能调优经验。
  • -掌握Python/Go开发能力,可独立编写自动化运维脚本。

其他工作城市
* China - Hubei - 武汉(Wuhan)
* China - Hubei - 武汉(Wuhan)
* China - Hubei
* China