图像界的DeepSeek!12B参数对标GPT-4o消费级硬件玩转编辑生成
- 2025-07-07 20:20:00
- aiadmin 原创
- 14
现正在FLUX.1 Kontext[dev]可能让小狗迟缓分开画面,为小老鼠戴上髯毛,增加文字、编削后台也不正在话下。
FLUX.1 Kontext模子上个月曾经宣告,就由于其壮大的上下文天生和编辑成效广受好评。
与现有的文本到图像模子差别,FLUX.1 Kontext系列实行上下文图像天生,可能直接利用文本和图像实行提示,并无缝提取和编削视觉细节。
FLUX.1 Kontext[dev]动作FLUX.1 Kontext最新宣告的开源版本,不只承受了其图像天生的上风,它还更静心于编辑工作,可能直接正在消费类硬件上运转。
最初模子架构上,还是基于的是FLUX.1模子,它是一种正在图像自愿编码器的潜正在空间中熬炼的整流流Transformer模子,由双流块和单流块夹杂修建而成。
然后利用整流流立室吃亏实行熬炼,正在熬炼时从FLUX.1的文本到图像检讨点发端,采集并料理数百万个联系对实行模子优化。
优化后取得的流立室模子实行潜正在分裂扩散蒸馏(LADD),正在省略采样举措的同时进步样性质地,使FLUX.1 Kontext[dev]更高效。
最终取得的FLUX.1 Kontext[dev]模子蕴涵120亿参数,可能更静心于编辑工作,接济迭代编辑,可能正在百般场景和处境中保存脚色特色,并答应用户实行无误的个人或整体编辑。
试验引入自研的KontextBench基准实行模子本能验证,该基准蕴涵1026个图像-提示对,涵盖个人编辑、整体编辑、脚色参考、作风参考和文本编辑五个工作种别。
其它,FLUX.1 Kontext[dev]还特意针对新的NVIDIA Blackwell架构实行了TensorRT权重优化,可能正在坚持高质地的图像编辑本能的同时,极大地进步推理速率并省略内存利用量。
官方还供给了BF16、FP8和FP4 TensorRT的权重变体,用户可能自行对其速率、作用和质地实行调解,归纳确保FLUX.1 Kontext[dev]填塞应用最新的硬件成效。
然则也有网友提到,正在MacBook Pro的芯片上运转时,迭代年华较长,每次迭代都须要1分钟操纵。
联系人: | 王先生 |
---|---|
电话: | 15640228768 |
微信: | 1735252255 |
地址: | 沈阳市铁西区兴华南街58-6号 |
-
思陌产品
深度学习系统产品介绍 -
使用帮助
使用手册 -
关于我们
公司简介 -
资讯反馈
交流论坛 -
联系我们
Tel 15640228768 QQ/WX技术支持 1735252255