职位描述
视频大模型【岗位职责】1. 负责视频基础模型的研发,并与多模态大模型结合2. 跟踪业内前沿技术,包括但不限于视频分类、视频分割、Video-LLM等3. 负责将视频大模型应用于实际项目,满足业务目标及创新要求【任职要求】1. 拥有计算机科学、人工智能、电子工程等相关领域的硕士或博士学位2. 了解视频大模型训练相关的性能和效果优化技术,熟悉模型架构、损失函数、优化器等方面的知识;3. 熟练使用PyTorch等深度学习框架。有分布式系统和并行计算的相关经验优先4. 对学术前沿有浓厚兴趣,时刻跟进技术前沿,并善于利用各类技术解决复杂的实际问题,有良好的沟通表达能力5. 在会议或期刊上发表过有影响力的学术论文或在重要算法比赛中取得过优秀名次的候选人优先
企业介绍
格灵深瞳是一家行业领先的人工智能公司,专注于将先进的计算机视觉技术、大数据分析技术、机器人和人机交互技术与应用场景深度融合,提供面向智慧金融、城市管理、商业零售、轨交运维、体育健康、元宇宙等领域的人工智能产品及解决方案。公司成立于 2013 年,2022年3月在上海证券交易所科创板挂牌上市,成为A股第一家AI计算机视觉上市公司。