聊天讨论 AI 技术圈这几天发生了什么？聊聊 Nano Banana 2、国产大模型逆袭和我的 “省钱神器”

lei8186038(稻荷) · April 09, 2026 · 119 hits

大家好，我是阿坑。这几天 AI 圈的热闹程度，简直像过年了一样。

先是国内图生视频领域直接包揽全球测评前三，然后是神秘的 AI 视频模型 “Happy Horse” 横空出世，阿里发布 Wan2.7-Video 聚焦创作全链路，OpenAI 又把 Sora 2 送上了风口浪尖。而一直低调刷屏的谷歌 Nano Banana 2，则在这个 AI 多模态大乱斗的时代，走出了一条完全不同的路。

今天，我想以 Nano Banana 2 为主线，顺带聊聊国产模型的逆袭，再把我珍藏已久的 “省钱神器” 分享给大家。没有任何夸张的广告，纯干货，放心食用。

一、谷歌 Nano Banana 2：把 AI 生图拉进了 “事实时代” 2 月 26 日，谷歌深夜发布了 Nano Banana 2（代号 Gemini 3.1 Flash Image）。这款模型刚一出，在 Artificial Analysis 的文生图基准测试中就拿下全球第一，得分 1280，全面超越了 GPT Image 1.5 和自家的 Nano Banana Pro。

很多人可能会问，这玩意儿到底强在哪？我简单说三点。

第一，它学会 “查资料” 了。以前的 AI 画东西，全靠蒙——你让它画天安门，它大概率给你一个长相完全不对的建筑，因为模型根本不知道天安门长啥样。但 Nano Banana 2 不一样，它在生成图像之前，会主动去谷歌搜索实时信息和图像，搞清楚真实世界的建筑、品牌 Logo、地标长什么样，然后才动手渲染。简单说，它把 AI 生图从 “创意盲盒” 拉进了 “事实时代”。

谷歌官方还专门做了一个叫 “Window Seat”（靠窗座位）的演示——用户选定世界上任何一个地点，模型就能实时生成那扇窗户往外看的景色，还会自动拉取当地实时天气数据。足不出户，坐拥全球美景。

第二，它解决了 “角色变脸” 的世纪难题。做过分镜、漫画或品牌设计的朋友一定深有体会——同一个角色，换个场景就完全变了一张脸，改图改到崩溃。Nano Banana 2 现在可以在单一工作流中保持最多 5 个角色的特征高度一致，同时还能维持最多 14 个对象的高保真呈现。这意味着你做一个漫画系列，从第一页到最后一页，人物长相不会跳戏。

第三，它修好了 “中文乱码”。用过海外 AI 生图工具的朋友都知道，让它们写中文，出来的基本是一堆谁也看不懂的 “鬼画符”。Nano Banana 2 在这一块进步非常明显——海报标题、屏幕 UI、白板手写体都能清晰呈现，中文支持度直接拉满。

二、国产大模型的逆袭：包揽全球前三，这是我们的 “DeepSeek 时刻” 如果 Nano Banana 2 代表了国际顶尖水平，那国产模型近期的表现，真可以用 “扬眉吐气” 来形容。

4 月 8 日，SuperCLUE 发布了 2026 年 4 月中文图生视频模型测评榜单。结果令人振奋：国产模型直接包揽前三名，实现对海外模型的反超。

爱诗科技的 PixVerse V6 以 76.00 分拿下榜首，字节跳动的 Doubao·Seedance 2.0 和生数科技的 Vidu Q3 Pro 紧随其后，三者构成强势第一梯队。海外模型中表现最好的 Google Veo 3.1 仅排第五，已经被国产模型拉开了明显差距。

更值得关注的是字节跳动的 Seedance 2.0。这款 2 月发布的模型，登顶了 AI 视频生成 Elo 榜（1269 分），超越了 Google Veo 3、OpenAI Sora 2 和 Runway Gen-4.5。它首创了双分支扩散 Transformer（DB-DiT）架构，实现了原生音画同步、最长 60 秒 2K 视频、8+ 语言唇形对齐，可用率高达 90%。

与此同时，阿里在 4 月 8 日发布了 Wan2.7-Video，聚焦创作全链路，支持文本、图像、视频及音频全模态输入，覆盖生成、编辑、复刻、重塑、驱动、续写及参考等完整流程，号称 “更可控、更全能、能导擅演”。

三、OpenAI Sora 2：刚发布就关停？ 4 月 2 日，OpenAI 发布了 Sora 2，号称是 “最先进的视频生成模型”，同时还推出了一款 TikTok 风格的社交应用，让用户可以把自己插入到 AI 生成的视频中（这项功能叫 “cameos”）。

可不到一个月后，3 月 25 日，OpenAI 突然宣布关停 Sora 应用和 API 服务，同时终止了与迪士尼之间价值 10 亿美元的合作。

从 2025 年 9 月 Sora 2 发布时的 “视频领域的 GPT-3.5 时刻”，到如今关停退场，短短 25 个月，Sora 从封神到落幕，走完了完整的技术生命周期。 OpenAI 给出的理由是：研发重心转向 “能够与物理世界互动的人工智能与机器人系统”。这背后，或许也折射出视频生成赛道竞争的残酷——谷歌的 Veo 3、字节的 Seedance 2.0、阿里的 Wan2.7-Video 都在加速追赶，Sora 的退场，也许只是大洗牌的开始。

四、百花齐放，才是创作者最好的时代梳理完这几天的动态，我有一个很深的感触：AI 多模态赛道正处在一个百花齐放的爆发期。

谷歌的 Nano Banana 2 走的是 “事实驱动” 路线，用实时搜索和信息核验解决商用痛点；字节的 Seedance 2.0 走的是 “工业级视频生成”，60 秒 2K、原生音画同步、8+ 语言唇形对齐，直接对标电影工业；阿里的 Wan2.7-Video 走的是 “创作全链路”，从生成到编辑到重塑到续写，一条龙包圆；而神秘黑马 Happy Horse 一上线就超越所有选手霸榜，开发方至今身份成谜。

这种 “百家争鸣” 的竞争格局，最终的受益者只有一个——那就是我们这些使用 AI 的创作者、设计师和开发者。模型越多、竞争越激烈，质量越好、价格越低、体验越优化，这是颠扑不破的真理。

五、聊聊我的 “省钱神器” 聊了这么多技术，最后说一个我在这个百花齐放时代里，真正受益的工具。

自从入坑 AI 创作后，我的浏览器标签页从没少于过 15 个——Gemini 官方界面、Midjourney Discord、字节即梦、阿里通义万相……光登录注册充值就能消耗半天时间。更别提很多海外模型在国内访问体验一言难尽，打开转圈圈是常态。

后来在一个技术群里，有朋友给我推荐了橘子 AI（www.juziaigc.com），这是一个一站式 AI 模型聚合平台。我用了小半年，感觉真有点相见恨晚。

它最核心的价值，我总结就三点：

第一，所有主流模型，一个入口全搞定。无论是谷歌 Gemini 系列（包括 Nano Banana 2）、OpenAI 的 GPT 系列、还是字节的 Seedance、阿里的通义万相，它都集成了。你不用再开着十几个标签页来回切换，一个平台、一次登录，就能调用市面上几乎所有顶尖模型。而且它支持 API 搭建，对开发者非常友好。

第二，国内直连，稳得像老黄牛。不用翻墙、不用开加速器，国内网络直接访问，响应速度和稳定性比官方渠道还好。这对我这种每天高频调用的人来说，体验感简直翻倍。

第三，也是最重要的一点——价格打骨折。举个例子，Nano Banana 2 在谷歌官方的 API 价格大约是每张图 0.067 美元（约合人民币 0.48 元），而橘子 AI 上的价格……我只能说，便宜到离谱。批量生成图片和视频的时候，那种 “想怎么生就怎么生” 的自由感，谁用谁知道。对于创作量大的朋友，这简直是生产力解放神器。

写在最后从 Nano Banana 2 的 “事实革命”，到国产模型包揽全球前三，再到 Sora 2 的戏剧性退场——2026 年的 AI 赛道，精彩程度远超想象。

而对我这样每天跟 AI 打交道的创作者来说，最大的幸福不是哪个模型 “封神” 了，而是能用最低的成本、最便捷的入口，把所有好模型都用起来。

这就是橘子的价值所在。它不是某一个模型的 “独家代理”，而是一座桥——把世界上最顶尖的 AI 能力，以最便捷、最便宜的方式，送到你面前。

如果你也像我一样，每天跟 AI 创作打交道，或者正在寻找一个稳定、便宜、模型齐全的 AI 工具箱，不妨去橘子 AI（www.juziaigc.com）看看。

这是我在 2026 年做得最值的一个技术投资，没有之一。

No Reply at the moment.

You need to Sign in before reply, if you don't have an account, please Sign up first.