热门资讯

FIBO – 开源的图像生成模型，首个原生支持JSON

业界来源：AI工具集 2025-11-09 02:49:41

FIBO是什么

FIBO 是首个开源的原生支持 JSON 的文本生成图像模型，专为长结构化描述训练而成。模型在超过 1 亿条结构化 JSON 描述（每条约 1,000 字）上训练，能精确、可重复地控制光线、构图、色彩与相机参数。FIBO 支持生成、精修和灵感三种模式，具备特征解耦能力，能单独调整某个属性不破坏整体场景。FIBO使用 100% 授权数据，确保合规性和法律透明性，适合专业工作流。

FIBO的主要功能

文本到图像生成：根据用户输入的文本描述，生成高质量的图像。
结构化 JSON 提示：将简短文本提示扩展为详细的结构化 JSON 描述，包含光线、构图、色彩等细节。
迭代可控生成：支持从简短提示生成图像，或基于已有 JSON 提示进行多轮细化。
特征解耦控制：单独调整某个属性（如相机角度）而不破坏整体场景。
灵感模式：通过输入图像提取结构化提示，生成相关图像，激发创意。
企业级合规性：100% 使用授权数据，确保法律透明性和可重复性。
生产级集成：模型支持 API 接口、ComfyUI 节点及本地推理。

FIBO的技术原理

架构：基于 8B 参数的 DiT 架构，采用流匹配（Flow Matching）训练方式。
文本编码器：使用 SmolLM3-3B，搭配创新的 DimFusion 条件架构，实现高效的长描述训练。
VAE：采用 Wan 2.2，负责图像的编码和解码。
VLM 引导：通过视觉语言模型（VLM）将简短文本提示扩展为详细的结构化 JSON 提示。
结构化监督：使用结构化 JSON 描述进行训练，促进特征解耦，避免提示词漂移。
数据合规性：在超过 1 亿条授权的长结构化 JSON 描述上训练，确保数据合规性。

FIBO的项目地址

GitHub仓库：https://github.com/Bria-AI/FIBO
HuggingFace模型库：https://huggingface.co/briaai/FIBO
在线体验Demo：https://huggingface.co/spaces/briaai/FIBO

FIBO的应用场景

专业设计与创意工作流：为广告、产品设计和平面设计生成高质量图像，支持快速迭代和精准控制，提升创意效率。
影视与娱乐：FIBO 能生成电影、游戏和动画的概念艺术与场景设计，助力视觉化创作，加速开发流程。
教育与培训：模型能生成教学图像和虚拟实验场景，辅助教育内容制作，提升学习体验。
科学研究：模型能将科学数据转化为直观图像，辅助研究展示和数据可视化。
医疗与健康：FIBO 可生成医学示意图和虚拟手术场景，支持医学教学和手术培训。

延伸阅读

SAM Audio – Meta开源的音频分割模型

SAM Audio是什么SAM Audio是Meta开源的音频分割模型，能通过文本、视觉和时间片段等多模态提示，从复杂的音频混合中分离出特定的声音。核心技术是Perception Encoder Au
Molmo 2 – Ai2开源的AI视频分析模型

Molmo 2是什么Molmo 2 是艾伦人工智能研究所（Ai2）推出的开源视频分析模型，专注于视频理解、指向和追踪。模型基于 Qwen 3 和 Olmo 架构，具备强大的视频分析能力，能在视频中精准
LongCat-Video-Avatar – 美团开源的数字人视频生成模型

LongCat-Video-Avatar是什么LongCat-Video-Avatar 是美团 LongCat 团队推出的音频驱动角色动画模型。模型能生成超逼真、口型同步的长视频，保持人物身份一致性和

关注公众号：拾黑（shiheibook）了解更多

友情链接：

关注数据与安全，洞悉企业级服务市场：https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站：https://www.yaorank.com/

*文章为作者独立观点，不代表牛品汇立场

本文由 Delight_778发表，转载此文章须经作者同意，并请附上出处( 牛品汇 )及本页链接。

原文链接 https://www.niupinhui.com/net/it/19697.html

AI工具集 FIBO

图库

猜你喜欢

公众号

关注网络尖刀微信公众号
随时掌握互联网精彩

赞助链接