酷应用

Image-to-LoRA-V2 – 魔搭社区开源的免训练风格迁移工具

动态来源：AI工具集 2026-06-20 13:39:53

Image-to-LoRA-V2是什么

Image-to-LoRA-V2（i2L-V2）是魔搭社区开源的免训练风格迁移工具。上传1-8张风格图，一次推理预测文生图模型的LoRA权重。工具支持Z-Image、FLUX.2、Hidream-O1三大基座，风格保真超越IP-Adapter等方法。LoRA可导出复用，支持ControlNet组合实现多风格融合与结构控制。

Image-to-LoRA-V2的主要功能

免训练风格 LoRA 生成：上传 1-8 张风格一致图片，一次前向推理直接输出可下载的 LoRA 权重文件。
多基座模型适配：原生支持 Z-Image、FLUX.2、Hidream-O1 三个主流文生图基座模型。
模块化组合能力：生成的显式 LoRA 可通过标准接口与 ControlNet、AttriCtrl、Inpainting 等模块组合使用。
多风格融合：从多张不同风格参考图预测单一 LoRA，让生成图同时继承多种视觉属性。
一键上传与导出：生成 LoRA 可一键上传魔搭社区，或下载后在 AIGC 专区及其他工具中继续调用。

Image-to-LoRA-V2的技术原理

结构化 LoRA Query：现代扩散 Transformer 有大量待适配的全连接层，参考信号只有几张图，存在明显的规模不匹配。i2L 不从单个池化向量生成全部权重，让每个 LoRA query 对应 LoRA 矩阵的某一行或某一列：对每个适配层，k 个 query 生成矩阵 A 的行、k 个 query 生成矩阵 B 的列，总 query 数为 2kL。参考图经 SigLIP2 编码器编码为图像 token，与 LoRA query 拼接后送入单流 Transformer 聚合，再由每层独立的压缩线性解码头还原出 LoRA 矩阵。
风格-内容解耦：普通图文对会诱导模型把参考语义也编码进 LoRA（如猫的参考图让生成的狗也带猫的特征）。i2L 在 MegaStyle-1M 上训练，构造风格一致、内容不同的训练元组，且 prompt 只描述目标内容而非参考图，使损失奖励风格一致性、抑制把物体或身份当作捷径复制。
非对称 LoRA 引导：令参考风格 LoRA 作用于 CFG 正分支，由同一 i2L 网络从纯灰图预测的中性 LoRA 作用于负分支。两个分支参数化相近，其差异主要反映参考图带来的风格更新，让引导方向放大风格相关效果。

微信关注回复 “开源”，加入AI开源项目交流群

如何使用Image-to-LoRA-V2

上传参考图片：在魔搭创空间上传 1-8 张具有目标风格的图片，混合不同主题有助于提高泛化能力。
生成 LoRA 模型：点击生成按钮，模型通过一次前向推理预测 LoRA 权重并输出 .safetensors 文件。
输入提示词：填写目标内容提示词，设置图像高度、宽度、LoRA 强度等生成参数。
生成图像：基于选定基座模型和预测 LoRA 实时生成风格化图像并预览效果。
导出与复用：将 LoRA 文件一键上传魔搭社区，或下载后在 AIGC 专区、ComfyUI 等工具中继续调用。

Image-to-LoRA-V2的核心优势

免训练即用：无需在 GPU 上跑数百上千步训练，一次推理即可生成可直接使用的 LoRA。
风格保真度领先：在 CLIP-Style、Aesthetic、PickScore、HPSv2/v3 等多项指标上全面超越 IP-Adapter、InstantStyle 等基线。
内容一致性强：CLIP-Text 得分最高达 34.71，说明预测 LoRA 在套用风格的同时较好地保留 prompt 内容可控性。
模块化可复用：输出显式 LoRA 而非临时条件特征，可存储、插值、复用，通过标准 LoRA 接口与其他控制模块组合。
开源生态完善：模型权重与代码完全开源，创空间可直接在线体验，生成结果可无缝接入魔搭 AIGC 专区。

Image-to-LoRA-V2的项目地址

模型权重：https://modelscope.cn/collections/DiffSynth-Studio/Image-to-LoRA-V2
创空间：

Z-Image 版：https://modelscope.cn/models/DiffSynth-Studio/ZImage-i2L-v2
FLUX.2 版：https://modelscope.cn/models/DiffSynth-Studio/KleinBase4B-i2L-v2
Hidream-O1 版：https://modelscope.cn/models/DiffSynth-Studio/HidreamO1-i2L-v2

Image-to-LoRA-V2的同类竞品对比

维度	Image-to-LoRA-V2	InstantStyle
技术路线	直接预测 LoRA 权重（权重级内化）	图像特征注入适配器（条件级外部化）
训练需求	用户端免训练，一次前向推理	用户端免训练，一次前向推理
输出形式	显式 LoRA 文件（可存储、复用、插值、导出）	临时条件特征（每次推理重新计算，不可复用）
风格保真	高（CLIP-Style 25.57）	中等（CLIP-Style 22.65）
内容一致性	高（CLIP-Text 33.58）	中等（CLIP-Text 30.90）
美学质量	高（Aesthetic 6.36）	中等（Aesthetic 6.08）
人类偏好	高（PickScore 21.57 / HPSv3 6.03）	中等（PickScore 20.70 / HPSv3 3.71）
组合能力	强，标准 LoRA 接口可组合 ControlNet / Inpainting / AttriCtrl	弱，仅作为外部条件注入，无法模块化组合
基座支持	Z-Image、FLUX.2、Hidream-O1	主要支持 Stable Diffusion 系列