机器学习平台研发工程师 - 搜广推离线训练框架方向

Bigo Technology

  • 广东省广州市番禺区
  • 长期
  • 全职
  • 3天前
岗位职责1、核心框架开发与维护:负责内部基于开源X-DeepLearning(XDL)的离线训练框架的架构设计、开发、迭代和维护,保障其稳定性、高效性和易用性。2、性能极致优化:深入分析训练 pipeline 中的性能瓶颈(数据读取、传输、计算等),并进行针对性优化,提升大规模稀疏模型训练和评估的整体效率,降低资源成本。3、大规模分布式训练:设计和实现高性能的分布式训练策略,解决大规模稀疏特征 embedding 训练问题4、研究基于GPU/异构硬件的训练加速方案。5、为算法工程师提供框架使用支持、技术咨询和最佳实践指导,编写技术文档,赋能业务团队高效迭代模型。任职要求:1、计算机科学或相关专业本科及以上学历2、熟悉Python和C++,具备扎实的编程能力和良好的代码风格3、有机器学习平台、分布式训练框架或大数据系统方向开发经验优先。4、有搜索、广告、推荐等领域的离线训练框架(如XDL, TFRA, DeepRec等)实际开发或优化经验者优先

Bigo Technology

相似职位

  • 基础架构研发工程师

    Bigo Technology

    • 广东省广州市番禺区
    职位描述 【岗位职责】: 1. 负责公司核心RPC框架的研发、性能调优及稳定性保障,支撑高并发、低延迟的分布式服务场景。 2. 参与设计和开发Service …
    • 22天前
  • 广告在线引擎研发工程师

    Bigo Technology

    • 广东省广州市番禺区
    岗位描述: 1,负责Bigo广告平台的架构升级和性能优化,为Bigo产品矩阵提供商业化解决方案。 2,负责日均百亿级流量访问的广告在线系统的系统架构优化…
    • 22天前