FIBO – 开源的图像生成模型,首个原生支持JSON
FIBO是什么
FIBO 是首个开源的原生支持 JSON 的文本生成图像模型,专为长结构化描述训练而成。模型在超过 1 亿条结构化 JSON 描述(每条约 1,000 字)上训练,能精确、可重复地控制光线、构图、色彩与相机参数。FIBO 支持生成、精修和灵感三种模式,具备特征解耦能力,能单独调整某个属性不破坏整体场景。FIBO使用 100% 授权数据,确保合规性和法律透明性,适合专业工作流。

FIBO的主要功能
- 文本到图像生成:根据用户输入的文本描述,生成高质量的图像。
- 结构化 JSON 提示:将简短文本提示扩展为详细的结构化 JSON 描述,包含光线、构图、色彩等细节。
- 迭代可控生成:支持从简短提示生成图像,或基于已有 JSON 提示进行多轮细化。
- 特征解耦控制:单独调整某个属性(如相机角度)而不破坏整体场景。
- 灵感模式:通过输入图像提取结构化提示,生成相关图像,激发创意。
- 企业级合规性:100% 使用授权数据,确保法律透明性和可重复性。
- 生产级集成:模型支持 API 接口、ComfyUI 节点及本地推理。
FIBO的技术原理
- 架构:基于 8B 参数的 DiT 架构,采用流匹配(Flow Matching)训练方式。
- 文本编码器:使用 SmolLM3-3B,搭配创新的 DimFusion 条件架构,实现高效的长描述训练。
- VAE:采用 Wan 2.2,负责图像的编码和解码。
- VLM 引导:通过视觉语言模型(VLM)将简短文本提示扩展为详细的结构化 JSON 提示。
- 结构化监督:使用结构化 JSON 描述进行训练,促进特征解耦,避免提示词漂移。
- 数据合规性:在超过 1 亿条授权的长结构化 JSON 描述上训练,确保数据合规性。
FIBO的项目地址
GitHub仓库:https://github.com/Bria-AI/FIBO
HuggingFace模型库:https://huggingface.co/briaai/FIBO
在线体验Demo:https://huggingface.co/spaces/briaai/FIBO
FIBO的应用场景
专业设计与创意工作流:为广告、产品设计和平面设计生成高质量图像,支持快速迭代和精准控制,提升创意效率。
影视与娱乐:FIBO 能生成电影、游戏和动画的概念艺术与场景设计,助力视觉化创作,加速开发流程。
教育与培训:模型能生成教学图像和虚拟实验场景,辅助教育内容制作,提升学习体验。
科学研究:模型能将科学数据转化为直观图像,辅助研究展示和数据可视化。
医疗与健康:FIBO 可生成医学示意图和虚拟手术场景,支持医学教学和手术培训。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 逐梦体育强国 7903988
- 2 央视新闻频道迎来90后新主播王晨 7809665
- 3 凌晨4点一群外国人在机场排队等什么 7711822
- 4 全运热潮席卷粤港澳三地 7618241
- 5 拜登狠批特朗普:让国家蒙羞 7522355
- 6 荒野求生32天 “冷美人”冒雨搬家 7425120
- 7 内蒙古现蝴蝶状不明飞行物 7332303
- 8 25岁海军陆战队队员谢丛欣牺牲 7236876
- 9 福建舰上有“哪吒” 7141665
- 10 20岁小伙一年猛长25厘米 确诊巨人症 7041461







快手小倔驴
