大模型算法工程师--电商业务

字节跳动

  • 北京市
  • 长期
  • 全职
  • 4天前
团队介绍:Data-电商-平台治理-内容理解基础算法团队,主要 focus 在 NLP/CV/多模态的大模型算法和基础算法研发上,旨在沉淀CV/NLP/多模态方向上的业界SOTA模型,同时也需要在这几个方向持续深耕,针对电商数据优化算法,提升电商业务效果。职位描述:
1、大模型算法研发:构建电商领域的大模型LLM底座,融合电商的知识,快速落地电商业务,例如:沉淀电商大模型预训练链路,研发电商NLP大模型,或者研发电商图文或者视频多模态大模型;
2、基础算法研发:持续建设和深耕NLP/CV/多模态基础预训练算法(BERT类算法),例如:沉淀&优化电商场景的预训练模型,包括超长文本/口语文本预训练,电商图片/视频自监督,适配电商商品的多模态表征学习等;
3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率;
4、技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文。职位要求:1、扎实的机器技术基础,了解前沿的AI技术,发表过高水平学术会议论文或者有竞赛经验者优先;
2、熟悉大数据相关框架和应用 MR/Spark 等优先;
3、熟悉TensorFlow/PyTorch模型的训练和部署,了解混合精度训练、分布式训练等训练加速方法优先;
4、了解模型压缩&推理加速的研究和技术进展,包括但不限于模型量化、剪枝、蒸馏、TensorRT推理优化等;
5、熟悉以下任一方向的技术:
1)CV&多模态
-在多媒体和计算机视觉某个领域有较深入的研究,包括但不限于:图像搜索、图像/视频分类和识别、图像分割、目标检测、OCR、图神经网络、多模态、无监督和自监督学习等;
- 有CV/多模态大模型相关项目经验优先,研发&优化电商视频&商品多模态大模型,结合LLM和视频/商品表征,支持视频多模态分类,视频QA,跨模态检索,商品分类等任务,显著超越线上模型;

字节跳动

相似职位

  • 智能客服算法工程师-电商业务

    字节跳动

    • 北京市
    团队介绍:Data-电商-智能客服团队负责抖音电商场景下的智能对话与问答技术的创新和研究工作...,降低平台/商家运维成本,不断提升业务效果。主要工作方向包括: 1、…
    • 4天前
  • 大模型应用算法工程师-电商业务

    字节跳动

    • 北京市
    4、参与构建挖掘电商直播、商品、商家和带货主播等多种实体的数据...,支撑商家、达人分类/风险团伙挖掘等业务场景解决问题,并为商家/达人治理提供支持…
    • 2个月前
  • NLP/CV算法工程师-电商业务

    字节跳动

    • 北京市
    提升消费者在内容场和货架场购物体验; 5、电商行业大模型:挖掘电商垂直领域大规模、...pretrain数据集,基于字节通用大模型,研发电商行业大模型,探索电商交互式导购新场景。…
    • 4天前