(GPT-4)时隔两年多,GPT-5 终于来了。
自从订阅升级到 ChatGPT Pro 档,我几乎只用 o3-pro 和 GPT-4.5。o3-pro(现在或许要改成 GPT-5 Pro 了)对我来说是无可替代的存在,也是我愿意每月花 200 美元的最大理由。
很多人说 Claude 是目前最强的编程模型,但我认为它的“强”更多体现在 JS、Python、Go 这些语言上。可能是因为这些语言的训练数据更丰富、工具链摩擦更小、惯用法更稳定。而在其他语言上——比如我常用的 Java、Objective-C,甚至 Pascal/Delphi——Claude 的实用价值就差很多了,尤其容易出现与实际框架不匹配的“幻觉”,调用不存在的函数。即便写出代码,也往往需要高强度的审查和修改,才能勉强用于生产。
而 o3-pro 在代码审查和方向性调研上的价值,对我来说无可替代。o3-pro 找 bug 的能力非常强。我通常会把 Claude 写的代码交给 o3-pro 审查,再让 Claude 根据审查意见修改,直到 o3-pro 给出“可用于生产环境”的结论,我才会安心。
对于我不熟悉的领域,o3-pro 虽不擅长直接生成代码,但它几乎就是一个轻量级 Deep Research:能在几分钟到十几分钟内给出方向和边界,大幅减少查资料和试错的成本。相比 Deep Research,o3-pro 耗时短一些,输出的内容少一些(不生成详尽的报告),但其“调研”程度远超一般对话/思考模型。很多人嫌它回答慢,但正是这种每个问题都要耗时几分钟到十几分钟的“深思熟虑”,让我对它调研问题的深度和广度深感信赖。
综合来说,Claude 就像一个有若干年工作经验的程序员,而 o3-pro 则像一个架构师,或者 CTO。
今天 GPT-5 发布后,我体验了 GPT-5 Pro。在给出同样问题:
AppKit 的 NSTextView 中,表格用 NSTextTable/NSTextTableBlock 来实现渲染。那么在 UIKit 的 UITextView 中,表格渲染应该用什么方案?
GPT-5 Pro 和 o3-pro 给出了相似的结论——UIKit 的UITextView 里没有 AppKit 那样的“表格模型”,同时 o3-pro 提出了四种替代方案,而 GPT-5 Pro 则给出了五种。可见两者“调研”大致水平相当。
顺便提一下,同样的问题,Claude Sonnet 4/DeepSeek R1 也给出了相同的结论,但是在替代方案方面则均过于简陋,显然是因为欠缺了“调研”能力;Gemini 2.5 Pro 则信誓旦旦虚幻出了“完美”的 TextKit 2 支持表格渲染的结论。
之后,着重测试了一下 API 场景下 GPT-5 的文本能力,结论是真不错。之前,GPT-4.5-Preview 的 API 价格太贵,没有实际接入测试过。接入 GPT-5 的 API 实测,输出文案(包括中文)的质量,普遍超越头部的国产模型。
GPT-5,是继年初的 R1 之后,又一个 AI 领域的兴奋节点。
另外,有些人使用 ChatGPT 的体验很差,常常觉得模型非常弱智。这种情形,大概率是账号被标记为“降智”状态了。要使用满血不降智的 ChatGPT,必须确保自己访问 ChatGPT 的 IP 地址干净,最佳方案是买一个美国家庭宽带的 IP 地址。
|