聊天讨论 AI 技术圈这几天发生了什么？聊聊 Nano Banana 2、国产大模型逆袭和我的 “省钱神器”

lei8186038(稻荷) · 2026年04月09日 · 147 次阅读

大家好，我是阿坑。这几天 AI 圈的热闹程度，简直像过年了一样。

先是国内图生视频领域直接包揽全球测评前三，然后是神秘的 AI 视频模型 “Happy Horse” 横空出世，阿里发布 Wan2.7-Video 聚焦创作全链路，OpenAI 又把 Sora 2 送上了风口浪尖。而一直低调刷屏的谷歌 Nano Banana 2，则在这个 AI 多模态大乱斗的时代，走出了一条完全不同的路。

今天，我想以 Nano Banana 2 为主线，顺带聊聊国产模型的逆袭，再把我珍藏已久的 “省钱神器” 分享给大家。没有任何夸张的广告，纯干货，放心食用。

一、谷歌 Nano Banana 2：把 AI 生图拉进了 “事实时代” 2 月 26 日，谷歌深夜发布了 Nano Banana 2（代号 Gemini 3.1 Flash Image）。这款模型刚一出，在 Artificial Analysis 的文生图基准测试中就拿下全球第一，得分 1280，全面超越了 GPT Image 1.5 和自家的 Nano Banana Pro。

很多人可能会问，这玩意儿到底强在哪？我简单说三点。

第一，它学会 “查资料” 了。以前的 AI 画东西，全靠蒙——你让它画天安门，它大概率给你一个长相完全不对的建筑，因为模型根本不知道天安门长啥样。但 Nano Banana 2 不一样，它在生成图像之前，会主动去谷歌搜索实时信息和图像，搞清楚真实世界的建筑、品牌 Logo、地标长什么样，然后才动手渲染。简单说，它把 AI 生图从 “创意盲盒” 拉进了 “事实时代”。

谷歌官方还专门做了一个叫 “Window Seat”（靠窗座位）的演示——用户选定世界上任何一个地点，模型就能实时生成那扇窗户往外看的景色，还会自动拉取当地实时天气数据。足不出户，坐拥全球美景。

第二，它解决了 “角色变脸” 的世纪难题。做过分镜、漫画或品牌设计的朋友一定深有体会——同一个角色，换个场景就完全变了一张脸，改图改到崩溃。Nano Banana 2 现在可以在单一工作流中保持最多 5 个角色的特征高度一致，同时还能维持最多 14 个对象的高保真呈现。这意味着你做一个漫画系列，从第一页到最后一页，人物长相不会跳戏。

第三，它修好了 “中文乱码”。用过海外 AI 生图工具的朋友都知道，让它们写中文，出来的基本是一堆谁也看不懂的 “鬼画符”。Nano Banana 2 在这一块进步非常明显——海报标题、屏幕 UI、白板手写体都能清晰呈现，中文支持度直接拉满。

二、国产大模型的逆袭：包揽全球前三，这是我们的 “DeepSeek 时刻” 如果 Nano Banana 2 代表了国际顶尖水平，那国产模型近期的表现，真可以用 “扬眉吐气” 来形容。

4 月 8 日，SuperCLUE 发布了 2026 年 4 月中文图生视频模型测评榜单。结果令人振奋：国产模型直接包揽前三名，实现对海外模型的反超。

爱诗科技的 PixVerse V6 以 76.00 分拿下榜首，字节跳动的 Doubao·Seedance 2.0 和生数科技的 Vidu Q3 Pro 紧随其后，三者构成强势第一梯队。海外模型中表现最好的 Google Veo 3.1 仅排第五，已经被国产模型拉开了明显差距。

更值得关注的是字节跳动的 Seedance 2.0。这款 2 月发布的模型，登顶了 AI 视频生成 Elo 榜（1269 分），超越了 Google Veo 3、OpenAI Sora 2 和 Runway Gen-4.5。它首创了双分支扩散 Transformer（DB-DiT）架构，实现了原生音画同步、最长 60 秒 2K 视频、8+ 语言唇形对齐，可用率高达 90%。

与此同时，阿里在 4 月 8 日发布了 Wan2.7-Video，聚焦创作全链路，支持文本、图像、视频及音频全模态输入，覆盖生成、编辑、复刻、重塑、驱动、续写及参考等完整流程，号称 “更可控、更全能、能导擅演”。

三、OpenAI Sora 2：刚发布就关停？ 4 月 2 日，OpenAI 发布了 Sora 2，号称是 “最先进的视频生成模型”，同时还推出了一款 TikTok 风格的社交应用，让用户可以把自己插入到 AI 生成的视频中（这项功能叫 “cameos”）。

可不到一个月后，3 月 25 日，OpenAI 突然宣布关停 Sora 应用和 API 服务，同时终止了与迪士尼之间价值 10 亿美元的合作。

从 2025 年 9 月 Sora 2 发布时的 “视频领域的 GPT-3.5 时刻”，到如今关停退场，短短 25 个月，Sora 从封神到落幕，走完了完整的技术生命周期。 OpenAI 给出的理由是：研发重心转向 “能够与物理世界互动的人工智能与机器人系统”。这背后，或许也折射出视频生成赛道竞争的残酷——谷歌的 Veo 3、字节的 Seedance 2.0、阿里的 Wan2.7-Video 都在加速追赶，Sora 的退场，也许只是大洗牌的开始。

四、百花齐放，才是创作者最好的时代梳理完这几天的动态，我有一个很深的感触：AI 多模态赛道正处在一个百花齐放的爆发期。

谷歌的 Nano Banana 2 走的是 “事实驱动” 路线，用实时搜索和信息核验解决商用痛点；字节的 Seedance 2.0 走的是 “工业级视频生成”，60 秒 2K、原生音画同步、8+ 语言唇形对齐，直接对标电影工业；阿里的 Wan2.7-Video 走的是 “创作全链路”，从生成到编辑到重塑到续写，一条龙包圆；而神秘黑马 Happy Horse 一上线就超越所有选手霸榜，开发方至今身份成谜。

这种 “百家争鸣” 的竞争格局，最终的受益者只有一个——那就是我们这些使用 AI 的创作者、设计师和开发者。模型越多、竞争越激烈，质量越好、价格越低、体验越优化，这是颠扑不破的真理。

五、聊聊我的 “省钱神器” 聊了这么多技术，最后说一个我在这个百花齐放时代里，真正受益的工具。

自从入坑 AI 创作后，我的浏览器标签页从没少于过 15 个——Gemini 官方界面、Midjourney Discord、字节即梦、阿里通义万相……光登录注册充值就能消耗半天时间。更别提很多海外模型在国内访问体验一言难尽，打开转圈圈是常态。

后来在一个技术群里，有朋友给我推荐了橘子 AI（www.juziaigc.com），这是一个一站式 AI 模型聚合平台。我用了小半年，感觉真有点相见恨晚。

它最核心的价值，我总结就三点：

第一，所有主流模型，一个入口全搞定。无论是谷歌 Gemini 系列（包括 Nano Banana 2）、OpenAI 的 GPT 系列、还是字节的 Seedance、阿里的通义万相，它都集成了。你不用再开着十几个标签页来回切换，一个平台、一次登录，就能调用市面上几乎所有顶尖模型。而且它支持 API 搭建，对开发者非常友好。

第二，国内直连，稳得像老黄牛。不用翻墙、不用开加速器，国内网络直接访问，响应速度和稳定性比官方渠道还好。这对我这种每天高频调用的人来说，体验感简直翻倍。

第三，也是最重要的一点——价格打骨折。举个例子，Nano Banana 2 在谷歌官方的 API 价格大约是每张图 0.067 美元（约合人民币 0.48 元），而橘子 AI 上的价格……我只能说，便宜到离谱。批量生成图片和视频的时候，那种 “想怎么生就怎么生” 的自由感，谁用谁知道。对于创作量大的朋友，这简直是生产力解放神器。

写在最后从 Nano Banana 2 的 “事实革命”，到国产模型包揽全球前三，再到 Sora 2 的戏剧性退场——2026 年的 AI 赛道，精彩程度远超想象。

而对我这样每天跟 AI 打交道的创作者来说，最大的幸福不是哪个模型 “封神” 了，而是能用最低的成本、最便捷的入口，把所有好模型都用起来。

这就是橘子的价值所在。它不是某一个模型的 “独家代理”，而是一座桥——把世界上最顶尖的 AI 能力，以最便捷、最便宜的方式，送到你面前。

如果你也像我一样，每天跟 AI 创作打交道，或者正在寻找一个稳定、便宜、模型齐全的 AI 工具箱，不妨去橘子 AI（www.juziaigc.com）看看。

这是我在 2026 年做得最值的一个技术投资，没有之一。

暂无回复。

需要登录后方可回复, 如果你还没有账号请注册新账号