基本信息

职位编号:
WD00066360
工作领域:
Research/Development
国家/地区:
中国
省:
北京
市:
北京(Beijing)
日期:
星期三, 6 月 5, 2024
工作性质:
Full-time
其他工作城市
* China - Beijing - 北京(Beijing)

为什么选择联想

联想文化,我们称之为 “We Are Lenovo”(我们,就是联想),其核心是:“说到做到,尽心尽力,成就客户”。

联想集团是一家年收入569亿美元的全球化科技巨头,位列《财富》世界500强第248名,服务遍布全球180个市场数以百万计的客户。为实现“智能,为每一个可能” 的公司愿景,联想在不断夯实全球个人电脑市场冠军地位的基础上,积极构建全栈式的计算能力,现已拥有包括人工智能赋能、人工智能导向和人工智能优化的终端、基础设施、软件、解决方案和服务在内的完整产品路线图,包括个人电脑、工作站、智能手机、平板电脑等终端产品,服务器、存储、边缘计算、高性能计算以及软件定义等基础设施产品。这一变革与联想改变世界的创新一起,共同为世界各地的人们成就一个更加包容、值得信赖的智慧未来。联想集团有限公司在香港交易所上市(港交所:992)(美国预托证券代号:LNVGY)。

欢迎访问联想官方网站 https://www.lenovo.com,并关注“联想集团”微博及微信公众号等社交媒体官方账号,或关注“联想招聘”公众号,获取联想最新动态。

职位描述和要求:

岗位职责:
1.负责面向AI应用的GPU高性能Kernel实现和调优;
2.与AI平台和算法团队合作,定位GPU计算和网络性能瓶颈;
3.集成GPU计算性能调优工具链,开发相关脚本和自动化工具
职位要求:
1.全日制硕士以上学历,计算机科学与技术等相关专业;
2.熟练C/C++编程语言语言、数据结构以及计算机系统结构,有良好的工程实现能力;
3.具备基础的GPU编程能力(CUDA,OpenCL或ROCm),熟悉GPU编译与运行原理,有PTX或SASS汇编级别代码开发经验优先,有GPU驱动开发优化经验优先;
4.有GPU高性能库开发经验,包括但不限于矩阵运算,求解器,深度学习,信号处理,计算机视觉或图像处理等在GPU上移植和调优经验优先
加分项:
1.了解国产AI加速器SDK工具链,有性能优化相关经历;
2.在AI或者HPC领域发表过高水平学术论文;
3.熟悉DMA,PCIe等硬件特性,了解IB、RoCE、iWARP等高性能网络架构,有GPU-Direct开发工程经验优先

其他工作城市
* China - Beijing - 北京(Beijing)
* China - Beijing - 北京(Beijing)
* China - Beijing
* China