职位描述
主要职责:性能分析与优化:深入分析和优化GPU应用程序,识别并消除性能瓶颈,包括内存访问模式、线程调度和执行效率。算法开发:利用CUDA或DirectX等并行计算框架,开发和实现高效的GPU加速算法,提升计算密集型任务的处理速度。向团队提供技术指导和培训,分享GPU编程的实践和优化技巧。持续关注GPU技术和行业趋势,评估并整合新技术以提升系统性能。任职要求:计算机科学、电子工程或相关领域的学士或硕士学位及以上。至少5年的GPU编程和性能优化经验,具有丰富的CUDA或DirectX开发背景。精通C/C++编程,具备深入的计算机体系结构和并行计算原理知识。熟练使用GPU性能分析和调试工具,具有实际的性能优化案例和成果。具备分析和调整各种AI/HPC工作负载性能的经验。加分项:具备高性能计算(HPC)领域的相关研究经验。对机器学习框架如TensorFlow或PyTorch有深入的GPU优化经验。使用Orin或Xavier平台进行AI模型部署和优化,以及开发自动驾驶相关算法的实战经验。具有NVIDIA GPU和CUDA编程的经验。
企业介绍
文远知行WeRide成立于2017年,已经在全球7个国家30个城市开展自动驾驶研发、测试及运营,是同时拥有中国、美国、阿联酋、新加坡四地自动驾驶牌照的科技企业,在广州、北京、上海、深圳、无锡、郑州、南京、武汉、圣何塞、阿布扎比、新加坡、斯图加特等地设有办公室。文远知行致力于开发安全可靠的无人驾驶技术,应用场景覆盖智慧出行、智慧货运和智慧环卫,已进入自动驾驶商业化运营阶段,商业营收居全球同类企业之首,形成自动驾驶出租车(Robotaxi)、自动驾驶小巴(Robobus)、自动驾驶货运车(Robovan)、自动驾驶环卫车(Robosweeper)、高阶智能驾驶(Advanced Driving Solution)等五大产品矩阵,提供网约车、随需公交、同城货运、智能环卫、高阶智能驾驶解决方案等多种服务。文远知行在技术研发、商业化和企业管理等方面都拥有丰富的海内外实践经验,已与多家全球主机厂和一级供应商达成战略合作伙伴关系,包括雷诺日产三菱联盟、宇通集团、广汽集团、博世等。