职位描述
岗位职责:1. 提高模型在长上下文处理能力及逻辑推理能力方面的表现,减少大模型的幻觉问题。2. 对大规模模型结构进行创新和优化,提高其性能和效果,推动模型在场景中的应用3. 跟进最新的文本、多模态预训练相关技术。4. 撰写并发表优质会议论文任职条件:1. 计算机、电子、通信、自动化、微电子等相关专业博士。2. 具备大规模语言模型(百亿以上)研究与实践经验,并至少拥有1篇相关顶会论文3. 熟练掌握Python、Java、C/C++等编程语言中的至少一种。4. 在AI领域优化方向发表CCF B或以上的文章。
企业介绍
启元实验室成立于2020年7月,由北京市人民政府设立,是北京市新型研发机构、独立事业法人科研单位。实验室聚焦智能科技领域科研攻关,立足“体现国家意志,服务国家战略,承担国家使命,代表国家水平”的定位,以勇闯智能科技前沿“无人区”的信念,打造智能科技创新平台。实验室设有十余个研究部门,正在建设一批大型科研基础设施,将汇聚、支持国内外科研与管理人才,聚力开展智能领域的基础理论研究、核心关键技术攻关、应用研究与开发。实验室位于北京市海淀区中关村科学城环保科技园,拥有园林规划、百亿级投入的独立科研园区,环境优美、清新静谧、交通便利。实验室将以稳定的科研项目、科研条件、友好的科研环境、待遇保障,为各方人才提供施展才华、建功立业的广阔舞台。