视觉算法工程师(人机交互/XR多模态方向)-PICO
字节跳动 查看所有职位
- 北京市
- 长期
- 全职
3、参与数据与评测体系建设:数据采集与清洗、自动/半自动标注、合成数据(仿真/渲染)、建立可复用的数据闭环与指标体系;
4、与产品、交互、硬件、系统软件等团队协作,推进算法在端侧应用落地;参与关键技术方案评审、问题定位与迭代优化;
5、探索多模态交互在XR场景的融合应用,研究多模态信息的对齐与融合(时空对齐、语义融合、置信度建模等),并参与原型系统验证。职位要求:1、计算机、自动化、电子、数学等相关专业,本科及以上学历,硕士学位、博士学位优先;
2、数学与算法基础扎实:线性代数、概率统计、优化方法、数值计算等;对机器学习/深度学习核心理论有系统理解;
3、编程基础扎实:熟练使用Python/C++(至少其一非常熟练);具备良好的工程习惯(调试、性能分析、单元测试、代码规范等);
4、熟悉至少一种深度学习框架(PyTorch/TensorFlow等),有模型训练、调参、评估与问题诊断的经验;理解常见视觉网络/Transformer等结构与训练范式;
5、具备良好的沟通协作能力与自驱力,能在不确定问题中快速学习、拆解并推进落地。加分项:
1、在AI/计算机视觉/多模态方向发表过会/刊论文或有高质量开源项目贡献(CVPR/ICCV/ECCV/NeurIPS/ICLR等);
2、有多模态大模型(MLLM/VLM)相关项目业务落地经历:多模态预训练、后训练、指令跟随、RAG、Agent工具调用、端侧推理优化等;
3、有OpenClaw/Agent框架相关项目经验,或具备将模型能力与工程系统结合、实现自动化任务/工具编排的实践;
4、有端侧部署经验(Android/iOS/嵌入式/NPU),熟悉TensorRT/ONNX Runtime/CoreML/NNAPI/TFLite等任一工具链;