聊天讨论 最近在研究 AI 图片生成,发现了个挺有意思的模型,顺手分享一下。

andywu2012(andywu) · March 25, 2026 · 10 hits

用过 Midjourney 和 Flux 的应该都知道,这类模型的通病是"听话"程度参差不齐——提示词写得很细,出来的图还是跑偏,空间关系错,多角色场景更是一塌糊涂。

最近试了个叫 Uni-1 的模型,底层逻辑和别的不太一样——它在生成之前会先做推理,把提示词拆解、分析空间约束、规划构图,然后再出图。实际体验下来,复杂场景的还原度确实比 Midjourney 强一截,多人物合照基本一次过。

另外支持上传最多 8 张参考图做身份锚定,风格迁移也比较稳,不会出那种"参考了但完全不像"的情况。支持 76+ 种风格,日系漫画、电影感、产品摄影都能跑。 Human Preference Elo 排名目前是 #1,比 GPT Image 和 Midjourney v6 都高。价格大概 $0.09/张(2048px),免费额度可以先试试效果。

这个方向——生成前先推理——比单纯堆模型参数更有意思,感兴趣的可以看看。 https://uni-1.me/

No Reply at the moment.
You need to Sign in before reply, if you don't have an account, please Sign up first.