
服务器性能评估与验证工程师-算力数据中心与供应链
- 广东省深圳市
- 长期
- 全职
2、负责服务器硬件性能评估体系建,提升对芯片选型、缺陷识别、机型导入、TCO核算等业务的支撑能力,形成更符合字节跳动业务场景、架构设计合理、产品组合最优的落地表现;
3、参与服务器业务应用数据挖掘工作,提炼设计优化点,提升服务器在字节跳动业务场景落地的竞争力;
4、负责数据中心多样性计算的的系统测试设计、测试方案及测试执行,对异构硬件系统的功能、性能、可靠性验证质量负责;
5、跟进GPU服务器研发测试、生产测试及线上质量问题,结合研发、生产及现网质量问题,进行GPU故障预测,落地新测试场景、测试方法,推动GPU选型标准化、流程化;
6、跟进和探索CPU、GPU测试理论和测试方法,寻找合适的技术路径,支撑新技术的快速验证、形成评估结论,支撑新产品研发和产品化交付。职位要求:1、2026届获得硕士及以上学位,计算机、电子、通信、网络及相关专业优先;
2、掌握X86/ARM/RISC-V等各架构CPU中一种或多种架构的性能评估测试方法,熟悉计算系统Benchmark评价体系,具备数据挖掘分析能力、性能评估数学模型理论研究经验等;
3、掌握GPU测试方法及原理,掌握了解P2P、GPU虚拟化、GDR、NCLL等测试,熟悉了解MLPerf、CNN模型、Transformer等模型,了解深度学习、机器学习测试方法;
4、熟悉服务器各硬件模块基础知识,掌握系统整合测试、部件测试的测试用例、测试方法及原理,熟练使用相关测试工具;
5、熟悉Linux操作系统,具备脚本开发能力,编写开发自动化测试用例; 具备较强的问题分析及调试能力;对服务器测试有深刻的理解,能以全局出发,考量各测试设计点及测试合理性;