职位描述
岗位职责:1、负责大模型相关算法的设计、调试并训练,包括但不限于GPT、Llama、Qwen、DeepSeek等模型训练、SFT、RLHF及相关**** Engineering;2、负责垂域大语言模型的继续预训练、SFT、RLHF等工作,积极跟进AIGC业内应用趋势,包括但不限于MoE、Long Context、RAG、Agent等方向;3、与产品和业务团队紧密合作,根据业务场景的需求,快速迭代和开发AI应用程序,解决业务上的痛点和挑战,实现卓越的用户体验;4、使用向量数据库、langchain、大模型构建大模型应用服务,构建并持续完善大模型算法流水线;任职要求:1、本科及以上学历,人工智能、计算机、数学、统计学等专业优先;2、具备扎实的算法功底和编程能力,熟练掌握Python,熟悉PyTorch或TensorFlow等深度学习框架;3、熟悉自然语言处理相关理论,熟悉Transformer/BERT/GPT等基础模型结构,熟悉大模型的微调和评估方法;4、具备优秀的沟通能力,学习能力,有强烈的上进心和主动性;5、自驱力和责任心强,积极主动,较强的沟通表达能力,能够与非技术团队成员有效沟通;6、在顶级会议上有论文发表者优先,参与过有影响力的开源项目开发者优先;我们可提供:1、与国内顶级研究机构团队合作,碰撞思维;2、充足的算力资源,验证创意。
企业介绍
云钠科技是专注于人工智能技术落地化场景应用的高科技企业,主要产品包括AI Agent(智能体),魔像RPA和无人机视觉大模型等。公司自成立以来得到了数百家头部制造、零售、流通、贸易等泛供应链企业及政府公用事业客户的认可。云钠是上海市专精特新企业、高新技术企业、微软加速器成员,也是合肥综合性国家科学技术中心孵化企业。拥有多项自主研发专利和软著产品、以及ISO和安全认证,曾获得第一届全球科大人创新创业大赛上海赛区一等奖。公司由红杉资本、线性资本、云九资本、昊辰资本等一线机构投资。