聊天讨论 Gemini 3.1 Pro 上线橘子 AI:0.03 元/次,推理能力翻倍,谷歌这是要掀桌?

15610048619(juzi) · 2026年05月02日 · 22 次阅读

说实话,我之前推荐了这么久 Nano Banana 2,今天看到 Gemini 3.1 Pro 在橘子 AI(www.juziaigc.com)上线,价格直接干到了 0.03 元/次,第一反应是谷歌这是要把 OpenAI 往死里逼。

先别急,给你看几个硬核数据。

推理能力翻倍,价格不涨,谷歌动真格了 Gemini 3.1 Pro 跟老前辈相比,在 ARC-AGI-2 这个公认的推理基准测试中拿到了 77.1%,老前辈只有 31.1%。你没看错,翻了一倍多。谷歌的策略也很简单粗暴:能力翻倍,价格不涨。

核心原因是,它把 Gemini 3 Deep Think 里那个 “深度思考” 的架构直接拿来用了,定位就是处理 “一个简单答案不够用” 的复杂问题。

多模态:它更像个 “理解大师” Gemini 3.1 Pro 是原生多模态架构,一出生就统一处理文本、图像、音频、视频。简单说,它不是靠猜,而是真正理解。

举个例子,你让它设计一把电竞椅,它会先去搜人体工学数据,再按物理规律生成设计图。甚至能同时分析攀岩视频和文字,给你出一份图文并茂的报告。这种跨模态的合并能力,叫一声 “通才” 不为过。

它还能分析 PDF 报告里的复杂图表,指出作者没明说的潜在相关性。100 万 Token 的上下文,一部小说加整个代码库都能一次性读完。不过有人反馈文档中间部分的信息召回会弱一点,但这并不影响它多数场景下的超级表现。

代码能力强,编程质感有提升 编程这块,LiveCodeBench Pro 上它的 Elo 积分断层领先;Terminal-Bench 2.0 里它干掉了 GPT-5.3-Codex。SWE-Bench Verified 上它拿了 80.6%,也高于 Claude Opus 4.6 的 72.6%。

我个人体验,做日常编码完全够用,构建复杂系统架构和多层逻辑时,会明显感觉到它先 “自我博弈” 再给出方案。不过也有数据指出,在需要极高严谨性的数学证明场景,Claude 的准确率(85%)略高于它(80%)。

多模态理解与文字渲染 在视频会议测试里,它能准确生成多个真实人物加一名二次元角色的截图,连 “镜像翻转” 这种逻辑都考虑到了。把不同人物锁定、引用、协同放置,能力相当突出。

文字渲染上,它对上千字的学术论文也能智能排版,直接产出带论点图表的海报。做了个 “肾该按哪里” 的中医指令测试,它也能准确标注足底涌泉穴。

安全隐私和性价比最高 极客最关心的安全隐私:100 万 Token 的长上下文、幻觉率大幅下降。最关键的是,Gemini 3.1 Pro 只要 0.03 元/次。

怎么用? 在橘子 AI(www.juziaigc.com)的导航栏里,直接点击 Gemini 3.1 Pro 模型就行。新用户注册送 10000 积分,够生好几百次。以前的几大模型依然在线,现在多了这个多模态新选择。

如果你想做推理密集型任务(写代码、分析复杂文档、生成结构化报告)或者跨模态数据处理的场景,这个新模型的 0.03 元/次的价格是完全没压力的试错。

去 www.juziaigc.com 直接试试,输入你的复杂代码库,或者让它分析那堆没人看的行业报告,你自己的感受比别人说的更重要。

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请 注册新账号