大家好,我是阿坑。这几天 AI 圈的热闹程度,简直像过年了一样。
先是国内图生视频领域直接包揽全球测评前三,然后是神秘的 AI 视频模型 “Happy Horse” 横空出世,阿里发布 Wan2.7-Video 聚焦创作全链路,OpenAI 又把 Sora 2 送上了风口浪尖。 而一直低调刷屏的谷歌 Nano Banana 2,则在这个 AI 多模态大乱斗的时代,走出了一条完全不同的路。
今天,我想以 Nano Banana 2 为主线,顺带聊聊国产模型的逆袭,再把我珍藏已久的 “省钱神器” 分享给大家。没有任何夸张的广告,纯干货,放心食用。
一、谷歌 Nano Banana 2:把 AI 生图拉进了 “事实时代” 2 月 26 日,谷歌深夜发布了 Nano Banana 2(代号 Gemini 3.1 Flash Image)。这款模型刚一出,在 Artificial Analysis 的文生图基准测试中就拿下全球第一,得分 1280,全面超越了 GPT Image 1.5 和自家的 Nano Banana Pro。
很多人可能会问,这玩意儿到底强在哪?我简单说三点。
第一,它学会 “查资料” 了。 以前的 AI 画东西,全靠蒙——你让它画天安门,它大概率给你一个长相完全不对的建筑,因为模型根本不知道天安门长啥样。但 Nano Banana 2 不一样,它在生成图像之前,会主动去谷歌搜索实时信息和图像,搞清楚真实世界的建筑、品牌 Logo、地标长什么样,然后才动手渲染。简单说,它把 AI 生图从 “创意盲盒” 拉进了 “事实时代”。
谷歌官方还专门做了一个叫 “Window Seat”(靠窗座位)的演示——用户选定世界上任何一个地点,模型就能实时生成那扇窗户往外看的景色,还会自动拉取当地实时天气数据。足不出户,坐拥全球美景。
第二,它解决了 “角色变脸” 的世纪难题。 做过分镜、漫画或品牌设计的朋友一定深有体会——同一个角色,换个场景就完全变了一张脸,改图改到崩溃。Nano Banana 2 现在可以在单一工作流中保持最多 5 个角色的特征高度一致,同时还能维持最多 14 个对象的高保真呈现。 这意味着你做一个漫画系列,从第一页到最后一页,人物长相不会跳戏。
第三,它修好了 “中文乱码”。 用过海外 AI 生图工具的朋友都知道,让它们写中文,出来的基本是一堆谁也看不懂的 “鬼画符”。Nano Banana 2 在这一块进步非常明显——海报标题、屏幕 UI、白板手写体都能清晰呈现,中文支持度直接拉满。
二、国产大模型的逆袭:包揽全球前三,这是我们的 “DeepSeek 时刻” 如果 Nano Banana 2 代表了国际顶尖水平,那国产模型近期的表现,真可以用 “扬眉吐气” 来形容。
4 月 8 日,SuperCLUE 发布了 2026 年 4 月中文图生视频模型测评榜单。结果令人振奋:国产模型直接包揽前三名,实现对海外模型的反超。
爱诗科技的 PixVerse V6 以 76.00 分拿下榜首,字节跳动的 Doubao·Seedance 2.0 和生数科技的 Vidu Q3 Pro 紧随其后,三者构成强势第一梯队。海外模型中表现最好的 Google Veo 3.1 仅排第五,已经被国产模型拉开了明显差距。
更值得关注的是字节跳动的 Seedance 2.0。这款 2 月发布的模型,登顶了 AI 视频生成 Elo 榜(1269 分),超越了 Google Veo 3、OpenAI Sora 2 和 Runway Gen-4.5。它首创了双分支扩散 Transformer(DB-DiT)架构,实现了原生音画同步、最长 60 秒 2K 视频、8+ 语言唇形对齐,可用率高达 90%。
与此同时,阿里在 4 月 8 日发布了 Wan2.7-Video,聚焦创作全链路,支持文本、图像、视频及音频全模态输入,覆盖生成、编辑、复刻、重塑、驱动、续写及参考等完整流程,号称 “更可控、更全能、能导擅演”。
三、OpenAI Sora 2:刚发布就关停? 4 月 2 日,OpenAI 发布了 Sora 2,号称是 “最先进的视频生成模型”,同时还推出了一款 TikTok 风格的社交应用,让用户可以把自己插入到 AI 生成的视频中(这项功能叫 “cameos”)。
可不到一个月后,3 月 25 日,OpenAI 突然宣布关停 Sora 应用和 API 服务,同时终止了与迪士尼之间价值 10 亿美元的合作。
从 2025 年 9 月 Sora 2 发布时的 “视频领域的 GPT-3.5 时刻”,到如今关停退场,短短 25 个月,Sora 从封神到落幕,走完了完整的技术生命周期。 OpenAI 给出的理由是:研发重心转向 “能够与物理世界互动的人工智能与机器人系统”。这背后,或许也折射出视频生成赛道竞争的残酷——谷歌的 Veo 3、字节的 Seedance 2.0、阿里的 Wan2.7-Video 都在加速追赶,Sora 的退场,也许只是大洗牌的开始。
四、百花齐放,才是创作者最好的时代 梳理完这几天的动态,我有一个很深的感触:AI 多模态赛道正处在一个百花齐放的爆发期。
谷歌的 Nano Banana 2 走的是 “事实驱动” 路线,用实时搜索和信息核验解决商用痛点;字节的 Seedance 2.0 走的是 “工业级视频生成”,60 秒 2K、原生音画同步、8+ 语言唇形对齐,直接对标电影工业;阿里的 Wan2.7-Video 走的是 “创作全链路”,从生成到编辑到重塑到续写,一条龙包圆;而神秘黑马 Happy Horse 一上线就超越所有选手霸榜,开发方至今身份成谜。
这种 “百家争鸣” 的竞争格局,最终的受益者只有一个——那就是我们这些使用 AI 的创作者、设计师和开发者。模型越多、竞争越激烈,质量越好、价格越低、体验越优化,这是颠扑不破的真理。
五、聊聊我的 “省钱神器” 聊了这么多技术,最后说一个我在这个百花齐放时代里,真正受益的工具。
自从入坑 AI 创作后,我的浏览器标签页从没少于过 15 个——Gemini 官方界面、Midjourney Discord、字节即梦、阿里通义万相……光登录注册充值就能消耗半天时间。更别提很多海外模型在国内访问体验一言难尽,打开转圈圈是常态。
后来在一个技术群里,有朋友给我推荐了橘子 AI(www.juziaigc.com),这是一个一站式 AI 模型聚合平台。我用了小半年,感觉真有点相见恨晚。
它最核心的价值,我总结就三点:
第一,所有主流模型,一个入口全搞定。 无论是谷歌 Gemini 系列(包括 Nano Banana 2)、OpenAI 的 GPT 系列、还是字节的 Seedance、阿里的通义万相,它都集成了。你不用再开着十几个标签页来回切换,一个平台、一次登录,就能调用市面上几乎所有顶尖模型。而且它支持 API 搭建,对开发者非常友好。
第二,国内直连,稳得像老黄牛。 不用翻墙、不用开加速器,国内网络直接访问,响应速度和稳定性比官方渠道还好。这对我这种每天高频调用的人来说,体验感简直翻倍。
第三,也是最重要的一点——价格打骨折。 举个例子,Nano Banana 2 在谷歌官方的 API 价格大约是每张图 0.067 美元(约合人民币 0.48 元),而橘子 AI 上的价格……我只能说,便宜到离谱。批量生成图片和视频的时候,那种 “想怎么生就怎么生” 的自由感,谁用谁知道。对于创作量大的朋友,这简直是生产力解放神器。
写在最后 从 Nano Banana 2 的 “事实革命”,到国产模型包揽全球前三,再到 Sora 2 的戏剧性退场——2026 年的 AI 赛道,精彩程度远超想象。
而对我这样每天跟 AI 打交道的创作者来说,最大的幸福不是哪个模型 “封神” 了,而是能用最低的成本、最便捷的入口,把所有好模型都用起来。
这就是橘子的价值所在。它不是某一个模型的 “独家代理”,而是一座桥——把世界上最顶尖的 AI 能力,以最便捷、最便宜的方式,送到你面前。
如果你也像我一样,每天跟 AI 创作打交道,或者正在寻找一个稳定、便宜、模型齐全的 AI 工具箱,不妨去橘子 AI(www.juziaigc.com)看看。
这是我在 2026 年做得最值的一个技术投资,没有之一。