音频编码算法研究员-音视频技术

字节跳动

  • 广东省深圳市
  • 长期
  • 全职
  • 1个月前
团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品,如抖音、今日头条、番茄小说、西瓜视频等APP的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。1、负责流媒体场景(RTC、点播、直播等)音频编解码压缩需求和功能开发维护;
2、针对流媒体场景(RTC、点播、直播等)特点研发音频编码算法,提升音频体验,降低成本;
3、负责撰写技术方案、专利申请、论文发表和算法集成落地等开发工作。职位要求:1、2026届获得硕士及以上学位,计算机科学、通信、信号处理、模式识别等相关专业优先;
2、具备较强的Python/C/C++编程能力,并有实际算法开发经验;
3、具备较强的主观能动性、团队协作和创新能力,优秀的分析、解决问题能力,对解决挑战性问题充满激情;
4、具备丰富的Pytorch框架模型开发经验,包括但不限于音频多模态模型、语音大模型、音频大模型、AI codec(Soundstream/Dac/Vocos等)、TTS、VAE、Vocoder、Tokenizer、模型轻量化或者知识蒸馏等;

字节跳动