用户平台部(2)算法实习生

DiDi

  • 北京市
  • 培训
  • 全职
  • 28天前
岗位职责(具体工作内容)【大模型训练实习生】工作内容:深入参与垂类场景Agent大模型的预训练和后训练,构建领域对话大模型。具体工作:1.支持预训练和后训练任务,并在导师指导下完成 PPO/DPO/GRPO 等算法应用及改进,支持大模型分布式训练实验。2.协助构建奖励模型:偏好数据清洗、特征工程、鲁棒性测试,跟踪实验指标及可视化分析。3.驱动效果闭环:搭建离线多维度指标与在线 A/B 体系,打造自迭代数据飞轮。任职资格(学历、目标院校、语言、技能、性格等要求)1.计算机/AI相关专业本科或硕士在读,至少可实习 4 个月、每周至少3 天。2.熟练Linux 系统常用命令、Python 、PyTorch、SQL3.熟悉 NLP 基本任务、深度学习、强化学习4.熟悉大模型基本原理,有大模型训练经验。5.对 RLHF、奖励模型等有浓厚兴趣,自主钻研能力。

DiDi

相似职位

  • 酒店餐饮部实习生

    金奇树酒店

    • 北京市大兴区
    师父一对一指导学习。 公司提供具有竞争力的实习津贴,确保实习生在经济上得到充分的支持。 公司提供宽松温馨的学习氛围,助力实习生学习与成长。 其他要求 计算机能力…
    • 11小时前
  • 实习生

    北京顺承酒店有限公司

    • 北京市朝阳区
    包吃包住 补充医疗 职位描述 实习岗位: 1、餐饮/宴会/网球中心服务员...2、有志在酒店行业发展的应届毕业生/在校实习生。 福利待遇: 国企直招,实习津贴…
    • 1天前