字节发布14B参数多模态神器BAGEL，碾压Qwen2.5-VL，图像生成媲美SD3

10个月前 AI怪打工人

1020

字节跳动发布14亿参数多模态模型BAGEL，采用MoE架构，性能超越Qwen2.5-VL和InternVL-2.5，图像生成媲美SD3，支持复杂推理和自由图像编辑。

技术亮点：MoE架构（14亿参数，7亿活跃参数），数万亿token预训练，双编码器设计。
应用场景：内容创作、教育科研、图像编辑、智能助手等。
开源生态：已在Hugging Face和GitHub开源。
行业影响：字节在多模态AI领域的突破，推动开源AI发展，提升中国AI企业全球竞争力。
未来展望：计划推出多语言优化版本，优化实时视频处理。

来源：AI怪