强化学习系统工程师-Ads Infra

字节跳动

  • 北京市
  • 长期
  • 全职
  • 1个月前
1、参与字节跳动交易与广告投放系统相关的机器学习系统研发工作,连接字节跳动海量流量和商业营销需求,支持字节跳动商业化收入增长,构建和优化包括抖音、今日头条等商业化产品解决方案;
2、负责构建Agent、Function Call、Sandbox、以及其他环境交互场景下的强化学习下的分布式训练奖励评估系统;
3、负责强化学习任务性能优化,提升模型迭代效率,构建Agent框架与平台,支持复杂交互下的强化学习模型训练;
4、负责强化学习环境下的可观测性、可解释性的系统建设。职位要求:1、优秀的代码能力、数据结构和基础算法功底,熟练掌握Linux环境下的C/C++、Python;
2、熟悉至少一种机器学习框架(PyTorch/TensorFlow/JAX或其他自研框架);
3、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动。加分项:
1、有分布式训练、模型并行、数据并行等大规模训练经验,至少了解一种分布式框架(如FSDP/Megatron-Core/DeepSpeed/veScale等);

字节跳动

相似职位

  • 化学工程师

    北京中亚康源环保工程有限公司

    • 北京市
    能适应长期驻外工作!!! 岗位职责: -协助工程师进行化学品和药剂的研发工作,包括配方设计...、声学设计、产品制造、工程安装于一体的专业化声学工程公司。…
    • 22天前
  • 油田化学工程师

    石油在线

    • 北京市
    • 陕西省西安市
    • 月薪 人民币25,000-35,000元
    水物理和化学性质的化验检测; 2. 油、气、水各相化学组分检测; 3. 酸化、压裂等措施化学溶液性能检测...; 5. EOR(IOR)相关化学药剂的配方优化筛选; 6. …
    • 2个月前