职位描述
岗位职责:1、从事大语言模型(LLM)预训练和微调算法研究、训练、应用,涉及多语言、知识增强、模型性能提升等方面2、负责自然语言处理(NLP)方向基于 GPU的并行多机多卡训练、高性能模型推理等:3、负责行业大模型技术研发与应用落地,包括行业知识库构建、检索以及大模型增强4、前沿技术跟进研究,快速地将相关先进技术落地
企业介绍
上海数字大脑研究院面向中国和全球数字化业务需求,聚焦决策智能大模型、多智能体强化学习、机器学习驱动的运筹优化算法、人在环路算法、数字孪生等新一代人工智能关键技术研究与应用,以科技创新与资本联动方式加速科技成果快速商业化,以华裔科学家为先导推进国际科研人才与中国市场高效对接,融合科技、资本、人オ、市场等要素实现协作创新。上海数字大脑研究院项目汇聚众多华人科学家为代表的全球人才和科研资源,并且充分发挥机构自身的投资和商业经营积累之优势,以人工智能核心前沿领域决策智能的商业化落地应用为主要抓手,促成多智能体、强化学习、决策智能等数字大脑核心技能与传统行业相结合,力争逐步打造和不断丰富的应用场景。上海数字大脑研究院创始团队成员背景覆盖伦敦大学学院、帝国理工学院、伦敦国王学院、中国科学院、北京大学、上海交通大学、复旦大学等国内外的高校和科研机构,目前研究团队成员包括欧洲科学院院士3人, IEEE Felow3人, Turing Felow3人。研究院运营管理团队核心成员背景覆盖亚马逊、微软、 IBM 、华为等全球科技企业且兼具丰富的业务创新和商业化落地经验。