【实习】抖音多业务场景的大模型训练与应用-抖音AI
字节跳动 查看所有职位
- 北京市
- 培训
- 全职
1、用户体验:抖音场景下的端侧大模型架构与推理加速体系研究;
2、抖音直播:迭代3D生成大模型,优化数据、编码和模型架构,提升3D资产生成效率和品质;
3、汽水音乐:聚焦音乐生成大模型的核心算法研究与优化,旨在攻克上述技术瓶颈,提升AI音乐创作的质量、可控性与创新性,赋能短视频配乐、虚拟偶像等多元应用场景;
4、AI技术研究与赋能:随着大模型在代码生成与软件开发中的应用不断深化,构建端到端AI Coding模型已成为提升研发效率的关键方向。本课题聚焦从数据构建、模型训练(SFT/RL)、到推理部署的全链路优化,探索从需求理解,代码生成与修复,与功能上线的一体化建模方法。重点解决领域知识注入、大规模SFT训练、Agentic RL等问题,推动AI在抖音等真实业务研发场景中的规模化落地;
5、小荷健康:围绕问诊、工具调用、科普与病例分析,提升医疗大模型任务规划与推理能力,保证结果准确稳定可用。课题挑战:
1、资源约束极强,需兼顾算力、内存与功耗;通用性要求高,需支撑多业务场景高精度处理;面向差异化设备,实现任务复杂度的弹性适配;
2、高质量3D数据严重稀缺,3D几何与纹理表征复杂,生成质量与美术水准比仍有差距,当前链路冗长效率偏低;
3、音乐审美偏好的量化建模问题、长序列高品质音乐生成问题、多风格泛化与创新生成问题、推理增强方法的迁移应用问题;
4、抖音研发大模型需高效的业务知识注入,复杂且超长的上下文管理,解决高质量训练数据稀缺,Agentic RL的持续训练;
5、小荷健康围绕医疗场景基座模型 ,Agent Foundation构建与评测体系,强化模型复杂知识检索、任务分解及长链路执行能力。通过优化 SFT、RL、OPD等后训练方法的组合策略,兼顾模型效果、稳定性与泛化性。同时探究线上用户体验与基座模型训练间的关联,实现医疗大模型能力与实际应用效果的协同提升。课题价值:
1、技术价值:等参数量级下,可大规模落地的业界领先模型;业务价值:提升抖音用户和业务接入的覆盖面,获得用户和营收价值;
2、技术上提升3D表征与生成能力,迭代3D生成大模型;业务上支撑直播和社交应用,产出丰富3D资产,满足海量用户的个性化需求;
3、技术上突破音乐生成在审美建模、长序列连贯性等核心瓶颈,引领AI音乐生成技术前沿;业务上提升抖音/汽水音乐的AI创作能力,降低音乐创作门槛,丰富内容生态,提供音乐内容供给;
4、技术上探索前沿模型训练策略,构建字节内部真实环境下的数据飞轮,提高业务研发效率,提升代码质量与性能;
5、技术上提升医疗大模型Agent与Post-Training方向的关键技术突破,提升问诊、科普、病例分析等核心场景业务效果,沉淀可复用的数据、训练与评测方法,支撑长期模型演进。