【实习】抖音多业务场景的大模型训练与应用-抖音AI

北京市
培训
全职

9小时前

团队介绍：抖音AI团队主要负责抖音项目以及团队内的AI落地相关基础建设工作。我们的职责是用前沿的AI技术去赋能抖音应用以及抖音团队。我们希望在AI技术的加持下，能够更好的给抖音用户带来更好的信息消费体验，也能够让抖音这个大型组织能够更加高效的运转，从而更加及时的满足用户的各项诉求。团队主要负责抖音AI基础建设，包括但不限于模型训练、Agent相关的工程链路开发、通用Agent工具抽象以及AI Native的各类产品开发工作。AGI信仰强，以发展成为AI Native组织为目标，努力拓展传统协作模式的职责边界，充分给同学们提供自身探索的空间。课题介绍：抖音研发团队，负责抖音短视频、直播、中长视频、搜索、图文、音乐、社交通讯、医疗等业务技术开发，以及字节跳动旗下产品的客服平台、业务安全、用户增长、用户体验、抖音账号、AI技术研究与赋能等中台团队的研发工作。本次课题共涉及5个方向：
1、用户体验：抖音场景下的端侧大模型架构与推理加速体系研究；
2、抖音直播：迭代3D生成大模型，优化数据、编码和模型架构，提升3D资产生成效率和品质；
3、汽水音乐：聚焦音乐生成大模型的核心算法研究与优化，旨在攻克上述技术瓶颈，提升AI音乐创作的质量、可控性与创新性，赋能短视频配乐、虚拟偶像等多元应用场景；
4、AI技术研究与赋能：随着大模型在代码生成与软件开发中的应用不断深化，构建端到端AI Coding模型已成为提升研发效率的关键方向。本课题聚焦从数据构建、模型训练（SFT/RL）、到推理部署的全链路优化，探索从需求理解，代码生成与修复，与功能上线的一体化建模方法。重点解决领域知识注入、大规模SFT训练、Agentic RL等问题，推动AI在抖音等真实业务研发场景中的规模化落地；
5、小荷健康：围绕问诊、工具调用、科普与病例分析，提升医疗大模型任务规划与推理能力，保证结果准确稳定可用。课题挑战：
1、资源约束极强，需兼顾算力、内存与功耗；通用性要求高，需支撑多业务场景高精度处理；面向差异化设备，实现任务复杂度的弹性适配；
2、高质量3D数据严重稀缺，3D几何与纹理表征复杂，生成质量与美术水准比仍有差距，当前链路冗长效率偏低；
3、音乐审美偏好的量化建模问题、长序列高品质音乐生成问题、多风格泛化与创新生成问题、推理增强方法的迁移应用问题；
4、抖音研发大模型需高效的业务知识注入，复杂且超长的上下文管理，解决高质量训练数据稀缺，Agentic RL的持续训练；
5、小荷健康围绕医疗场景基座模型，Agent Foundation构建与评测体系，强化模型复杂知识检索、任务分解及长链路执行能力。通过优化 SFT、RL、OPD等后训练方法的组合策略，兼顾模型效果、稳定性与泛化性。同时探究线上用户体验与基座模型训练间的关联，实现医疗大模型能力与实际应用效果的协同提升。课题价值：
1、技术价值：等参数量级下，可大规模落地的业界领先模型；业务价值：提升抖音用户和业务接入的覆盖面，获得用户和营收价值；
2、技术上提升3D表征与生成能力，迭代3D生成大模型；业务上支撑直播和社交应用，产出丰富3D资产，满足海量用户的个性化需求；
3、技术上突破音乐生成在审美建模、长序列连贯性等核心瓶颈，引领AI音乐生成技术前沿；业务上提升抖音/汽水音乐的AI创作能力，降低音乐创作门槛，丰富内容生态，提供音乐内容供给；
4、技术上探索前沿模型训练策略，构建字节内部真实环境下的数据飞轮，提高业务研发效率，提升代码质量与性能；
5、技术上提升医疗大模型Agent与Post-Training方向的关键技术突破，提升问诊、科普、病例分析等核心场景业务效果，沉淀可复用的数据、训练与评测方法，支撑长期模型演进。

字节跳动

立即申请