字节跳动开源多模态模型 BAGEL,拥有 70 亿活跃参数,在多模态理解和图文生成编辑方面表现出色,超越部分开源模型。采用 MoT 架构,利用多模态数据预训练,具备自由图像编辑和世界导航等能力。性能随预训练提升,视觉-语义上下文对智能编辑至关重要。
微信扫码分享
关注每日AI行业最新资讯,请前往AI快讯首页