图像界的DeepSeek！12B参数对标GPT-4o消费级硬件玩转编辑生成

现正在FLUX.1 Kontext[dev]可能让小狗迟缓分开画面，为小老鼠戴上髯毛，增加文字、编削后台也不正在话下。

FLUX.1 Kontext模子上个月曾经宣告，就由于其壮大的上下文天生和编辑成效广受好评。

与现有的文本到图像模子差别，FLUX.1 Kontext系列实行上下文图像天生，可能直接利用文本和图像实行提示，并无缝提取和编削视觉细节。

FLUX.1 Kontext[dev]动作FLUX.1 Kontext最新宣告的开源版本，不只承受了其图像天生的上风，它还更静心于编辑工作，可能直接正在消费类硬件上运转。

最初模子架构上，还是基于的是FLUX.1模子，它是一种正在图像自愿编码器的潜正在空间中熬炼的整流流Transformer模子，由双流块和单流块夹杂修建而成。

然后利用整流流立室吃亏实行熬炼，正在熬炼时从FLUX.1的文本到图像检讨点发端，采集并料理数百万个联系对实行模子优化。

优化后取得的流立室模子实行潜正在分裂扩散蒸馏（LADD），正在省略采样举措的同时进步样性质地，使FLUX.1 Kontext[dev]更高效。

最终取得的FLUX.1 Kontext[dev]模子蕴涵120亿参数，可能更静心于编辑工作，接济迭代编辑，可能正在百般场景和处境中保存脚色特色，并答应用户实行无误的个人或整体编辑。

试验引入自研的KontextBench基准实行模子本能验证，该基准蕴涵1026个图像-提示对，涵盖个人编辑、整体编辑、脚色参考、作风参考和文本编辑五个工作种别。

其它，FLUX.1 Kontext[dev]还特意针对新的NVIDIA Blackwell架构实行了TensorRT权重优化，可能正在坚持高质地的图像编辑本能的同时，极大地进步推理速率并省略内存利用量。

官方还供给了BF16、FP8和FP4 TensorRT的权重变体，用户可能自行对其速率、作用和质地实行调解，归纳确保FLUX.1 Kontext[dev]填塞应用最新的硬件成效。

然则也有网友提到，正在MacBook Pro的芯片上运转时，迭代年华较长，每次迭代都须要1分钟操纵。