视觉算法工程师（人机交互/XR多模态方向）-PICO

北京市
长期
全职

4天前

2、基于深度学习方法进行模型设计、训练与评测，持续优化算法在真实设备上的鲁棒性、时延、功耗与体验指标，推动移动端/嵌入式侧部署（如量化、剪枝、加速与性能调优）；
3、参与数据与评测体系建设：数据采集与清洗、自动/半自动标注、合成数据（仿真/渲染）、建立可复用的数据闭环与指标体系；
4、与产品、交互、硬件、系统软件等团队协作，推进算法在端侧应用落地；参与关键技术方案评审、问题定位与迭代优化；
5、探索多模态交互在XR场景的融合应用，研究多模态信息的对齐与融合（时空对齐、语义融合、置信度建模等），并参与原型系统验证。职位要求:1、计算机、自动化、电子、数学等相关专业，本科及以上学历，硕士学位、博士学位优先；
2、数学与算法基础扎实：线性代数、概率统计、优化方法、数值计算等；对机器学习/深度学习核心理论有系统理解；
3、编程基础扎实：熟练使用Python/C++（至少其一非常熟练）；具备良好的工程习惯（调试、性能分析、单元测试、代码规范等）；
4、熟悉至少一种深度学习框架（PyTorch/TensorFlow等），有模型训练、调参、评估与问题诊断的经验；理解常见视觉网络/Transformer等结构与训练范式；
5、具备良好的沟通协作能力与自驱力，能在不确定问题中快速学习、拆解并推进落地。加分项：
1、在AI/计算机视觉/多模态方向发表过会/刊论文或有高质量开源项目贡献（CVPR/ICCV/ECCV/NeurIPS/ICLR等）；
2、有多模态大模型（MLLM/VLM）相关项目业务落地经历：多模态预训练、后训练、指令跟随、RAG、Agent工具调用、端侧推理优化等；
3、有OpenClaw/Agent框架相关项目经验，或具备将模型能力与工程系统结合、实现自动化任务/工具编排的实践；
4、有端侧部署经验（Android/iOS/嵌入式/NPU），熟悉TensorRT/ONNX Runtime/CoreML/NNAPI/TFLite等任一工具链；

字节跳动

立即申请