聊天讨论最近在研究 AI 图片生成，发现了个挺有意思的模型，顺手分享一下。

andywu2012(andywu) · March 25, 2026 · 151 hits

用过 Midjourney 和 Flux 的应该都知道，这类模型的通病是"听话"程度参差不齐——提示词写得很细，出来的图还是跑偏，空间关系错，多角色场景更是一塌糊涂。

最近试了个叫 Uni-1 的模型，底层逻辑和别的不太一样——它在生成之前会先做推理，把提示词拆解、分析空间约束、规划构图，然后再出图。实际体验下来，复杂场景的还原度确实比 Midjourney 强一截，多人物合照基本一次过。

另外支持上传最多 8 张参考图做身份锚定，风格迁移也比较稳，不会出那种"参考了但完全不像"的情况。支持 76+ 种风格，日系漫画、电影感、产品摄影都能跑。 Human Preference Elo 排名目前是 #1，比 GPT Image 和 Midjourney v6 都高。价格大概 $0.09/张（2048px），免费额度可以先试试效果。

这个方向——生成前先推理——比单纯堆模型参数更有意思，感兴趣的可以看看。 https://uni-1.me/

No Reply at the moment.

You need to Sign in before reply, if you don't have an account, please Sign up first.

聊天讨论 最近在研究 AI 图片生成，发现了个挺有意思的模型，顺手分享一下。

聊天讨论 最近在研究 AI 图片生成，发现了个挺有意思的模型，顺手分享一下。

聊天讨论最近在研究 AI 图片生成，发现了个挺有意思的模型，顺手分享一下。

聊天讨论最近在研究 AI 图片生成，发现了个挺有意思的模型，顺手分享一下。