职位描述
职位描述1. 负责 SoC AI 推理引擎软件的需求分析、架构设计、功能开发等工作。2. 负责 SoC 上 AI 模型的适配,推理工作流原型开发及性能优化等工作。3. 负责 Soc 上LLM模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。职位要求1.熟悉C/C++,熟悉算法与数据结构,熟悉Python;2.具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。3. 熟悉常见的模型量化技术,并能够进行模型的量化优化。4. 熟悉mindspore/tensorflow/pytorch训练框架,有mindspore-lite/TensorRT/OnnxRuntime/TFServing等深度学习推理框架的实际使用经验;5. 熟悉LLM相关的算法技术以及推理加速方法。6. 熟悉NPU/GPU/CPU异构加速方法7. 具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。
企业介绍
上海华为技术有限公司于2001年1月16日在自贸区市场监督管理局登记成立。法定代表人孙亚芳,公司经营范围包括程控交换机、传输设备、数据通信设备、宽带多媒体设备等。