办公场景的企业级AI Agent智能体平台构建(Agent训练)-飞书AI(北京/深圳/上海)
字节跳动 查看所有职位
- 北京市
- 长期
- 全职
随着大模型能力趋于成熟,飞书正处于将AI能力从单点功能升级为端到端“企业智能体平台”的关键窗口期。本课题聚焦于办公生产力场景,以Memory与Context体系为底座,以知识问答、会议数字分身为典型Long-Horizon任务场景,以自动化评测为质量度量引擎,以通用智能体框架为演进方向,系统性地探索企业级AI Agent的落地路径。目标是打造一套可扩展、可度量、可持续进化的办公智能体基础设施,让AI真正成为企业员工的协作伙伴与数字分身。课题挑战:
1、Memory质量与演化:企业多源异构数据理解难度大,Memory的生产、消费与持续进化链路尚不成熟;现有学术Benchmark与真实办公场景存在较大差距,难以有效指导工程实践;
2、全模态流式内容理解:会议场景要求对音视频、文档、参会人上下文进行实时全模态理解,Streaming Omni能力的稳定性与泛化性是核心技术瓶颈;
3、评测体系的区分度与规模化:如何从海量线上Query中动态筛选出具有能力区分度的测试样本,并通过自动化手段生成覆盖全面、可校验的评分标准(Rubrics),以支撑天级别迭代,是工程与算法的双重挑战;
4、通用Agent框架的动态适配:Agent框架与多业务场景的动态适配、跨场景排序因子融合、奖励工程的训练数据稀缺,以及Memory的结构化与跨任务迁移,均是企业级智能体规模化落地的关键障碍。课题价值:
1、产品价值:以飞书套件为依托,打通从Memory建设到Agent执行再到效果评测的完整闭环,实现AI能力从孤立Feature向协作式智能体平台的跃迁,显著提升企业用户的生产力效率;
2、技术引领:在Memory Benchmark、Omni Streaming理解、LLM-as-a-Judge裁判模型、长程Agent任务等前沿方向建立技术积累,形成学术与工业界双向影响力;
3、生态战略:会议、文档、知识问答等场景天然是多Agent协作的孵化土壤,本课题构建的基础能力将为未来多智能体企业协作生态奠定核心基础,支撑飞书成为国内领先的企业 AI 智能体平台。