基本信息

职位编号:
WD00066364
工作领域:
Research/Development
国家/地区:
中国
省:
北京
市:
北京(Beijing)
日期:
星期三, 6 月 5, 2024
工作性质:
Full-time
其他工作城市
* China - Beijing - 北京(Beijing)

为什么选择联想

联想文化,我们称之为 “We Are Lenovo”(我们,就是联想),其核心是:“说到做到,尽心尽力,成就客户”。

联想集团是一家年收入569亿美元的全球化科技巨头,位列《财富》世界500强第248名,服务遍布全球180个市场数以百万计的客户。为实现“智能,为每一个可能” 的公司愿景,联想在不断夯实全球个人电脑市场冠军地位的基础上,积极构建全栈式的计算能力,现已拥有包括人工智能赋能、人工智能导向和人工智能优化的终端、基础设施、软件、解决方案和服务在内的完整产品路线图,包括个人电脑、工作站、智能手机、平板电脑等终端产品,服务器、存储、边缘计算、高性能计算以及软件定义等基础设施产品。这一变革与联想改变世界的创新一起,共同为世界各地的人们成就一个更加包容、值得信赖的智慧未来。联想集团有限公司在香港交易所上市(港交所:992)(美国预托证券代号:LNVGY)。

欢迎访问联想官方网站 https://www.lenovo.com,并关注“联想集团”微博及微信公众号等社交媒体官方账号,或关注“联想招聘”公众号,获取联想最新动态。

职位描述和要求:

岗位职责:
1、负责分布式AI训练和推理系统的大规模互连网络架构设计;
2、负责大规模AI互连网络的仿真场景、性能评价指标设计;
3、负责大规模AI互连网络仿真系统的搭建、测试和验证工作
 
岗位要求:
1、全日制硕士以上学历,计算机科学与技术,通信工程,软件工程等相关专业;
2、熟练掌握C/C++编程语言语言、数据结构以及计算机系统结构,有良好的工程实现能力;
3、熟悉NS3、OMNeT++、OPNET、GEM5、MATLAB等仿真器,具有基于上述仿真器的工程开发经验;
4、熟悉分布式AI系统的网络互连拓扑和网络协议标准,了解TCP/IP和RDMA网络协议,了解NCCL集合通信库,熟悉NCCL,Socket和IB verbs编程

加分项:
1、了解数据中心网络架构,有数据中心网络拥塞控制和负载均衡工程经验优先;
2、在网络系统或AI/HPC系统领域发表过高水平学术论文;
3、熟悉Megatron-LM、DeepSpeed、Colossal-AI等至少一种模型训练框架,并能基于框架进行二次开发和优化

其他工作城市
* China - Beijing - 北京(Beijing)
* China - Beijing - 北京(Beijing)
* China - Beijing
* China