聊天讨论 Gemini 3.1 Pro 上线橘子 AI：0.03 元/次，推理能力翻倍，谷歌这是要掀桌？

15610048619(juzi) · 2026年05月02日 · 最后由 loobayn170 回复于 2026年06月06日 · 135 次阅读

说实话，我之前推荐了这么久 Nano Banana 2，今天看到 Gemini 3.1 Pro 在橘子 AI（www.juziaigc.com）上线，价格直接干到了 0.03 元/次，第一反应是谷歌这是要把 OpenAI 往死里逼。

先别急，给你看几个硬核数据。

推理能力翻倍，价格不涨，谷歌动真格了 Gemini 3.1 Pro 跟老前辈相比，在 ARC-AGI-2 这个公认的推理基准测试中拿到了 77.1%，老前辈只有 31.1%。你没看错，翻了一倍多。谷歌的策略也很简单粗暴：能力翻倍，价格不涨。

核心原因是，它把 Gemini 3 Deep Think 里那个 “深度思考” 的架构直接拿来用了，定位就是处理 “一个简单答案不够用” 的复杂问题。

多模态：它更像个 “理解大师” Gemini 3.1 Pro 是原生多模态架构，一出生就统一处理文本、图像、音频、视频。简单说，它不是靠猜，而是真正理解。

举个例子，你让它设计一把电竞椅，它会先去搜人体工学数据，再按物理规律生成设计图。甚至能同时分析攀岩视频和文字，给你出一份图文并茂的报告。这种跨模态的合并能力，叫一声 “通才” 不为过。

它还能分析 PDF 报告里的复杂图表，指出作者没明说的潜在相关性。100 万 Token 的上下文，一部小说加整个代码库都能一次性读完。不过有人反馈文档中间部分的信息召回会弱一点，但这并不影响它多数场景下的超级表现。

代码能力强，编程质感有提升编程这块，LiveCodeBench Pro 上它的 Elo 积分断层领先；Terminal-Bench 2.0 里它干掉了 GPT-5.3-Codex。SWE-Bench Verified 上它拿了 80.6%，也高于 Claude Opus 4.6 的 72.6%。

我个人体验，做日常编码完全够用，构建复杂系统架构和多层逻辑时，会明显感觉到它先 “自我博弈” 再给出方案。不过也有数据指出，在需要极高严谨性的数学证明场景，Claude 的准确率（85%）略高于它（80%）。

多模态理解与文字渲染在视频会议测试里，它能准确生成多个真实人物加一名二次元角色的截图，连 “镜像翻转” 这种逻辑都考虑到了。把不同人物锁定、引用、协同放置，能力相当突出。

文字渲染上，它对上千字的学术论文也能智能排版，直接产出带论点图表的海报。做了个 “肾该按哪里” 的中医指令测试，它也能准确标注足底涌泉穴。

安全隐私和性价比最高极客最关心的安全隐私：100 万 Token 的长上下文、幻觉率大幅下降。最关键的是，Gemini 3.1 Pro 只要 0.03 元/次。

怎么用？在橘子 AI（www.juziaigc.com）的导航栏里，直接点击 Gemini 3.1 Pro 模型就行。新用户注册送 10000 积分，够生好几百次。以前的几大模型依然在线，现在多了这个多模态新选择。

如果你想做推理密集型任务（写代码、分析复杂文档、生成结构化报告）或者跨模态数据处理的场景，这个新模型的 0.03 元/次的价格是完全没压力的试错。

去 www.juziaigc.com 直接试试，输入你的复杂代码库，或者让它分析那堆没人看的行业报告，你自己的感受比别人说的更重要。

loobayn170 #2 2026年06月06日

进不去链接是怎么回事

需要登录后方可回复, 如果你还没有账号请注册新账号