FIBO – 开源的图像生成模型,首个原生支持JSON
FIBO是什么
FIBO 是首个开源的原生支持 JSON 的文本生成图像模型,专为长结构化描述训练而成。模型在超过 1 亿条结构化 JSON 描述(每条约 1,000 字)上训练,能精确、可重复地控制光线、构图、色彩与相机参数。FIBO 支持生成、精修和灵感三种模式,具备特征解耦能力,能单独调整某个属性不破坏整体场景。FIBO使用 100% 授权数据,确保合规性和法律透明性,适合专业工作流。

FIBO的主要功能
- 文本到图像生成:根据用户输入的文本描述,生成高质量的图像。
- 结构化 JSON 提示:将简短文本提示扩展为详细的结构化 JSON 描述,包含光线、构图、色彩等细节。
- 迭代可控生成:支持从简短提示生成图像,或基于已有 JSON 提示进行多轮细化。
- 特征解耦控制:单独调整某个属性(如相机角度)而不破坏整体场景。
- 灵感模式:通过输入图像提取结构化提示,生成相关图像,激发创意。
- 企业级合规性:100% 使用授权数据,确保法律透明性和可重复性。
- 生产级集成:模型支持 API 接口、ComfyUI 节点及本地推理。
FIBO的技术原理
- 架构:基于 8B 参数的 DiT 架构,采用流匹配(Flow Matching)训练方式。
- 文本编码器:使用 SmolLM3-3B,搭配创新的 DimFusion 条件架构,实现高效的长描述训练。
- VAE:采用 Wan 2.2,负责图像的编码和解码。
- VLM 引导:通过视觉语言模型(VLM)将简短文本提示扩展为详细的结构化 JSON 提示。
- 结构化监督:使用结构化 JSON 描述进行训练,促进特征解耦,避免提示词漂移。
- 数据合规性:在超过 1 亿条授权的长结构化 JSON 描述上训练,确保数据合规性。
FIBO的项目地址
GitHub仓库:https://github.com/Bria-AI/FIBO
HuggingFace模型库:https://huggingface.co/briaai/FIBO
在线体验Demo:https://huggingface.co/spaces/briaai/FIBO
FIBO的应用场景
专业设计与创意工作流:为广告、产品设计和平面设计生成高质量图像,支持快速迭代和精准控制,提升创意效率。
影视与娱乐:FIBO 能生成电影、游戏和动画的概念艺术与场景设计,助力视觉化创作,加速开发流程。
教育与培训:模型能生成教学图像和虚拟实验场景,辅助教育内容制作,提升学习体验。
科学研究:模型能将科学数据转化为直观图像,辅助研究展示和数据可视化。
医疗与健康:FIBO 可生成医学示意图和虚拟手术场景,支持医学教学和手术培训。
-
FlowithOS – Flowith推出的全球首个智能体操作系统
FlowithOS是什么FlowithOS是Flowith推出的全球首个智能体操作系统,使其能像人类一样与数字世界互动。FlowithOS具备浏览器、终端和脚本使用功能,能自动执行复杂任务,如文件管理
-
LTX-2 – Lightricks推出的电影级AI视频生成模型
LTX-2是什么LTX-2 是 Lightricks 开发的先进 AI 视频生成模型,专为高质量视频创作设计。能以原生 4K 分辨率和 50fps 的帧率生成电影级视频,支持多模态输入,包括文字、图片
-
WOWService – 美团推出的大模型交互系统技术报告
WOWService是什么WOWService 是美团 LongCat 团队发布的智能交互系统,通过融合大型语言模型(LLMs)和多智能体架构,优化用户体验并降低成本。系统针对智能交互领域的五大挑战:
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/







关注网络尖刀微信公众号
