图像界的DeepSeek!12B参数对标GPT-4o消费级硬件玩转编辑生成

2025-07-07 20:20:00
aiadmin
原创
14

现正在FLUX.1 Kontext[dev]可能让小狗迟缓分开画面,为小老鼠戴上髯毛,增加文字、编削后台也不正在话下。

FLUX.1 Kontext模子上个月曾经宣告,就由于其壮大的上下文天生和编辑成效广受好评。

与现有的文本到图像模子差别,FLUX.1 Kontext系列实行上下文图像天生,可能直接利用文本和图像实行提示,并无缝提取和编削视觉细节。

FLUX.1 Kontext[dev]动作FLUX.1 Kontext最新宣告的开源版本,不只承受了其图像天生的上风,它还更静心于编辑工作,可能直接正在消费类硬件上运转。

最初模子架构上,还是基于的是FLUX.1模子,它是一种正在图像自愿编码器的潜正在空间中熬炼的整流流Transformer模子,由双流块和单流块夹杂修建而成。

然后利用整流流立室吃亏实行熬炼,正在熬炼时从FLUX.1的文本到图像检讨点发端,采集并料理数百万个联系对实行模子优化。

优化后取得的流立室模子实行潜正在分裂扩散蒸馏(LADD),正在省略采样举措的同时进步样性质地,使FLUX.1 Kontext[dev]更高效。

最终取得的FLUX.1 Kontext[dev]模子蕴涵120亿参数,可能更静心于编辑工作,接济迭代编辑,可能正在百般场景和处境中保存脚色特色,并答应用户实行无误的个人或整体编辑。

试验引入自研的KontextBench基准实行模子本能验证,该基准蕴涵1026个图像-提示对,涵盖个人编辑、整体编辑、脚色参考、作风参考和文本编辑五个工作种别。

其它,FLUX.1 Kontext[dev]还特意针对新的NVIDIA Blackwell架构实行了TensorRT权重优化,可能正在坚持高质地的图像编辑本能的同时,极大地进步推理速率并省略内存利用量。

官方还供给了BF16、FP8和FP4 TensorRT的权重变体,用户可能自行对其速率、作用和质地实行调解,归纳确保FLUX.1 Kontext[dev]填塞应用最新的硬件成效。

然则也有网友提到,正在MacBook Pro的芯片上运转时,迭代年华较长,每次迭代都须要1分钟操纵。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号