大模型评测实习生-AI数据与安全

北京市
培训
全职

6小时前

团队介绍：AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务，覆盖数据生产全流程，包含模型评估标准的制定、数据规模化生产、数据飞轮搭建，不断提升数据质量，支持模型快速迭代。
团队由产品经理、数据工程、数据运营等跨职能人才组成，并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作，从真实场景中收集反馈并分析模型表现数据，解决AI前沿突破过程中的复杂数据问题，推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者，也是模型和AI产品的一手用户。1、评测体系建设：参与大模型评测的工程基础设施的开发工作，包括评测集的接入、生产、管理，评测对象的链路采样，人评/机评能力建设，评估结果的分析等评测核心能力的开发工作；
2、评测Agent搭建：探索自动评测、高质量评测集构建等前沿评测方法，在评测场景搭建AI Agent，为评测业务提供端到端的高效、自动化的交付能力。职位要求:1、2027届本科及以上学历在读，计算机、人工智能、软件工程等相关专业优先；
2、具备优秀的逻辑思维能力及较强的学习能力，能快速理解复杂Agent逻辑、评测痛点与业务目标，主动思考能力突出，能够积极推进工作；有大模型/LLM/Agent评测、对话系统评估、模型迭代相关经验优先；

字节跳动

立即申请