职位描述
薪资面议地点:南京,北京,西安岗位描述:1.设计和开发大规模分布式深度学习训练和推理平台;2.跟踪/分析/评估各主流开源深度学习框架,参与自研深度学习软件栈的整体设计和实现,性能调优;3.在海飞科自研AIGPU芯片上,设计与实现高性能的算子加速库。岗位要求:1.计算机/数学/物理/电子工程/自动控制专业,本科及以上学历,3年以上工作经验 (特别优秀者可适当放宽要求);2.熟练掌握计算机科学基础知识,对计算机系统(包括操作系统,计算机体系结构,并行处理等)有深刻的理解,且具有较丰富的相关实践经验;3.精通C++/Python编程,有3年以上工作经验;4.熟练掌握Linux应用程序开发流程及环境;5.熟悉图编译及网络优化;6.理解深度学习理论,熟悉至少一种深度学习框架及相关软件,如TensorFlow/XLA,TVM,PyTorch,PaddlePaddle,NNVM,ONNX等,对框架内部有所了解;7.良好的编程风格习惯,优秀的书面和口头沟通能力,团队协作精神。加分项:1.具有AI算子开发和优化经验;2.CUDA/OpenMP/OpenCL相关开发经验; 3.任一种推理引擎TensorRT/TF-Lite/AndroidNN/CoreML/MNN上的开发使用经验;4.熟悉常见深度学习模型算法,在计算机视觉、语音、自然语言处理中任一个领域的应用经验。
企业介绍
海飞科(Hexaflake)是一家致力于通用并行处理器(GPU)研发,并建立通用并行计算软件开发生态的高科技企业。 AI 的迅速发展正在深刻改变人类社会和世界的面貌,深度学习之所以有今天的繁荣,除了有创新的算法模型外,还有强大的算力支撑。云端和边缘汇聚端的大规模 AI 处理运算是 AI 应用的核心,也是 AI 产业的基础。云端的 AI 处理器应具备以下特点:高并行算力、通用性、开放性、易用性、完整的开发生态、高性价比、高性耗比。 海飞科以为 AI 应用提供强大、高效和通用的算力为使命,具体研发的技术和产品,包括以下方面: 1. 研发为机器学习优化的通用并行处理器架构和指令集; 2. 研制通用可编程、高算力、高能效比、高性价比的 AI 处理器系列芯片产品; 3. 开发包括驱动、Runtime、Kernel、编译器及支持主流深度学习和并行计算框架的完整工具链; 4. 和产业链深入合作,开发云服务和边缘计算的软硬件整体解决方案。 海飞科公司的核心团队汇集了中美两地的多位资深专家,其专长涵盖并行计算与 AI 处理器体系架构、GPU 等超大规模 SoC 芯片设计以及处理器系统软件等核心技术,并有丰富的初创企业经验,其核心成员来自 Nvidia、Intel、海思和中兴等著名公司,曾领导开发出多款成功的芯片和系统产品。海飞科公司以追求持续创新和高的工程实践标准为企业立命之本。