AI数据开发实习生-Seed
字节跳动 查看所有职位
- 北京市
- 培训
- 全职
2、负责构建针对不同场景、不同数据类型、不同数据规模有足够的扩展性的数据处理技术链路和框架,以支撑大模型数据集持续高效迭代,实现高质量数据集沉淀;
3、负责数据生成和数据增强,利用大模型工具生成来扩充和完善数据集。职位要求:1、2027届硕士及以上学位在读,计算机、人工智能等专业优先;
2、熟练掌握文本、多模态等非结构化数据处理方法,熟悉数据清洗、特征提取和数据增强等技术,能够解决数据工作中各种问题;
3、精通Python、Golang、Java等至少一种编程语言,具备良好的编码能力和代码质量意识,熟悉常用的数据处理、文本处理和图像处理库,能够高效地实现数据清洗和处理的算法和流程;