视频生成RL算法工程师/专家-Seed

字节跳动 查看所有职位

  • 北京市
  • 长期
  • 全职
  • 8天前
2、负责生成模型RL后训练框架及多模态Reward Model/Verifier的设计与迭代,推动RLHF、ReFL、GRPO、DPO等方法在图像/视频生成中的应用;
3、负责后训练全链路建设与业务落地,包括数据构建、模型评测、训练加速、推理优化、蒸馏压缩,并探索视频生成、交互编辑、音视频联合生成、Agent RL等方向。

字节跳动

相似职位

  • 推荐算法工程师

    Joyy

    • 北京市
    电商推荐算法工程师 工作职责 1、负责电商领域推荐系统的召回...,逐步完善和优化推荐系统各模块的模型和算法,提高点击率、转化率等指标; 3、…
    • 1个月前
  • 大模型应用算法工程师-电商业务

    字节跳动

    • 北京市
    4、参与构建挖掘电商直播、商品、商家和带货主播等多种实体的数据,对大规模网络/海量特征序列进行建模,支撑商家、达人分类/风险团伙挖掘等业务场景解决问题,并为商家…
    • 5小时前
  • 推荐算法工程师-国际电商

    字节跳动

    • 北京市
    1、参与千万~亿级规模的电商个性化推荐算法的优化,主要包括TikTok Feeds的电商直播推荐、新用户推荐、直播冷启动、长期价值建模、体验优化等工作; 2、…
    • 8小时前