职位描述
岗位职务:深度学习推理平台研发专家和工程师薪资面议地点:南京,北京,西安,珠海南京 & 北京:Junior & Senior西安:Senior岗位描述: 1.开发与完善基于自研芯片的新一代深度学习推理平台软件,为各类深度学习应用和框架提供运行支撑; 2.开发与实现深度学习推理平台核心技术,设计/优化高性能推理的模型优化算法、资源管理算法、调度运行算法; 3.参与深度学习软件栈整体设计和实现的创新工作。 岗位要求: 1.计算机/数学/物理/电子工程/自动控制专业,本科及以上学历,3年以上工作经验;2.熟练掌握计算机科学基础知识,对计算机系统(包括操作系统、计算机体系结构、并行处理等)有深刻的理解,且具有较丰富的相关实践经验;3.精通 C/C++/Python,且熟悉数据结构、多线程、网络、分布式系统原理及开发;4.精通多进程/线程调度;5.熟练掌握 Linux应用程序开发流程及环境。加分项: 1.熟悉TVM、TensorRT、CUDA的原理、系统结构,具有实践经验; 2.具有CUDA、cuDNN编程经验,具有基于GPU/加速卡的性能调优经验; 3.熟悉现有流行的机器学习框架及相关软件,如 TensorFlow/XLA、PyTorch、PaddlePaddle、NNVM、ONNX; 4.熟悉深度学习图优化、图编译、量化等关键技术,具有实践经验。
企业介绍
海飞科(Hexaflake)是一家致力于通用并行处理器(GPU)研发,并建立通用并行计算软件开发生态的高科技企业。 AI 的迅速发展正在深刻改变人类社会和世界的面貌,深度学习之所以有今天的繁荣,除了有创新的算法模型外,还有强大的算力支撑。云端和边缘汇聚端的大规模 AI 处理运算是 AI 应用的核心,也是 AI 产业的基础。云端的 AI 处理器应具备以下特点:高并行算力、通用性、开放性、易用性、完整的开发生态、高性价比、高性耗比。 海飞科以为 AI 应用提供强大、高效和通用的算力为使命,具体研发的技术和产品,包括以下方面: 1. 研发为机器学习优化的通用并行处理器架构和指令集; 2. 研制通用可编程、高算力、高能效比、高性价比的 AI 处理器系列芯片产品; 3. 开发包括驱动、Runtime、Kernel、编译器及支持主流深度学习和并行计算框架的完整工具链; 4. 和产业链深入合作,开发云服务和边缘计算的软硬件整体解决方案。 海飞科公司的核心团队汇集了中美两地的多位资深专家,其专长涵盖并行计算与 AI 处理器体系架构、GPU 等超大规模 SoC 芯片设计以及处理器系统软件等核心技术,并有丰富的初创企业经验,其核心成员来自 Nvidia、Intel、海思和中兴等著名公司,曾领导开发出多款成功的芯片和系统产品。海飞科公司以追求持续创新和高的工程实践标准为企业立命之本。