基本信息

职位编号:
WD00066364
工作领域:
Research/Development
国家/地区:
中国
省:
北京
市:
北京(Beijing)
日期:
星期三, 6 月 5, 2024
工作性质:
Full-time
其他工作城市
* China - Beijing - 北京(Beijing)

为什么选择联想

我们是联想。我们说到做到。我们尽心尽力,成就客户。联想是一家全球收入高达4410亿人民币的科技公司,财富世界500强排行217,全球员工多达77000人,每天为数百万名客户在全球180个市场地区提供服务。我们专注提供崭新科技给所有人,联想已成为全球最大的电脑供应商,在未来我们会专注发展新科技,把我们的成功发展到新领域(客户端科技、边缘计算、云端科技、网络服务和智慧科技等)包括服务器,储存装置,智慧设备、解决方案和服务。联想的创新科技理念和转型将为世界带来更独特,更可靠和更智能的未来、了解更多资讯和最新动态,请浏览www.lenovo.com上的故事中心。

职位描述和要求:

岗位职责:
1、负责分布式AI训练和推理系统的大规模互连网络架构设计;
2、负责大规模AI互连网络的仿真场景、性能评价指标设计;
3、负责大规模AI互连网络仿真系统的搭建、测试和验证工作
 
岗位要求:
1、全日制硕士以上学历,计算机科学与技术,通信工程,软件工程等相关专业;
2、熟练掌握C/C++编程语言语言、数据结构以及计算机系统结构,有良好的工程实现能力;
3、熟悉NS3、OMNeT++、OPNET、GEM5、MATLAB等仿真器,具有基于上述仿真器的工程开发经验;
4、熟悉分布式AI系统的网络互连拓扑和网络协议标准,了解TCP/IP和RDMA网络协议,了解NCCL集合通信库,熟悉NCCL,Socket和IB verbs编程

加分项:
1、了解数据中心网络架构,有数据中心网络拥塞控制和负载均衡工程经验优先;
2、在网络系统或AI/HPC系统领域发表过高水平学术论文;
3、熟悉Megatron-LM、DeepSpeed、Colossal-AI等至少一种模型训练框架,并能基于框架进行二次开发和优化

其他工作城市
* China - Beijing - 北京(Beijing)
* China - Beijing - 北京(Beijing)
* China - Beijing
* China