
AI数据运营实习生(提效方向)-内容质量与数据服务平台
- 北京市
- 培训
- 全职
2、负责数据清洗与标准化:处理数据中的错误、重复及缺失值,对文本进行适配性处理以符合模型训练格式,参与数据处理工具开发,提升流程自动化效率;
3、负责标注质量监控:制定统一标注规则,通过监控机制保障数据一致性与准确性,结合模型后训练需求优化标注针对性;
4、负责数据增强与扩充:运用文本复述、同义词替换等技术增强数据多样性,借助数据合成生成稀缺数据,满足模型迭代的规模需求;
5、跨团队协作提效:与算法、研发团队协作,依据模型训练反馈调整数据处理策略,参与工具迭代开发,支撑模型优化。职位要求:1、2026届本科及以上学历在读,计算机、数据科学等相关专业优先;
2、掌握Python,能独立完成数据清洗、预处理及合成工作,有数据处理工具开发经验者优先;熟悉NLP基础原理与大语言模型训练逻辑,了解大语言模型后训练的流程与数据要求;