办公场景的企业级AI Agent智能体平台构建（Agent训练）-飞书AI（北京/深圳/上海）

北京市
长期
全职

6小时前

团队介绍：Intelligence and Innovation团队，是飞书部门内部负责做算法创新与实践的部门，深耕于ToB办公场景的LLM应用相关的前沿技术探索与落地。既通过ASR、大模型文本总结、智能函数、多模态等AI中台能力的建设来支持飞书内外语音识别、会议纪要生成、智能表格公式等各类AI产品，同时也负责了企业AI搜索与知识管理等业务的落地和推广，团队目标是将飞书打造为AI与人高效协作的下一代智能平台，实现 “有效率、有方法、有结果” 的产品愿景。课题介绍：
随着大模型能力趋于成熟，飞书正处于将AI能力从单点功能升级为端到端“企业智能体平台”的关键窗口期。本课题聚焦于办公生产力场景，以Memory与Context体系为底座，以知识问答、会议数字分身为典型Long-Horizon任务场景，以自动化评测为质量度量引擎，以通用智能体框架为演进方向，系统性地探索企业级AI Agent的落地路径。目标是打造一套可扩展、可度量、可持续进化的办公智能体基础设施，让AI真正成为企业员工的协作伙伴与数字分身。课题挑战：
1、Memory质量与演化：企业多源异构数据理解难度大，Memory的生产、消费与持续进化链路尚不成熟；现有学术Benchmark与真实办公场景存在较大差距，难以有效指导工程实践；
2、全模态流式内容理解：会议场景要求对音视频、文档、参会人上下文进行实时全模态理解，Streaming Omni能力的稳定性与泛化性是核心技术瓶颈；
3、评测体系的区分度与规模化：如何从海量线上Query中动态筛选出具有能力区分度的测试样本，并通过自动化手段生成覆盖全面、可校验的评分标准（Rubrics），以支撑天级别迭代，是工程与算法的双重挑战；
4、通用Agent框架的动态适配：Agent框架与多业务场景的动态适配、跨场景排序因子融合、奖励工程的训练数据稀缺，以及Memory的结构化与跨任务迁移，均是企业级智能体规模化落地的关键障碍。课题价值：
1、产品价值：以飞书套件为依托，打通从Memory建设到Agent执行再到效果评测的完整闭环，实现AI能力从孤立Feature向协作式智能体平台的跃迁，显著提升企业用户的生产力效率；
2、技术引领：在Memory Benchmark、Omni Streaming理解、LLM-as-a-Judge裁判模型、长程Agent任务等前沿方向建立技术积累，形成学术与工业界双向影响力；
3、生态战略：会议、文档、知识问答等场景天然是多Agent协作的孵化土壤，本课题构建的基础能力将为未来多智能体企业协作生态奠定核心基础，支撑飞书成为国内领先的企业 AI 智能体平台。

字节跳动

立即申请