新的 OpenAI 模型来了! 4倍速度,降价20%,网友却
发布时间:2025-12-18 10:24
作者 |潇潇制作 |网易的技术参数还是很不错的,但是体验真的能打败它吗?在谷歌纳米香蕉的压力下,一直标榜的OpenAI最终不得不选择“降低身价”。新版本GPT-Image-1.5的推出,虽然实现了4倍的生成速度和“像素级”的控制,甚至在API端直接采用了降价20%的肉搏战术,但这一切都无法掩盖其快速防御的姿态。舆论场顿时四分五裂。实用主义者称赞其“出色的图像质量、精确的控制、适合实际生产”,并认为这是工作流程的福音;然而,权威专家却给它泼了一盆冷水:“在处理复杂的视觉内容时,它的性能甚至会比竞品Nano Banana Pro还要低。”有评论指出:当OpenAI试图以“军备竞赛”的方式应对竞争时,它是否忘记了自己的初心?发誓要创造AGI吗?当科技巨头不再讲故事,而是专注于“分层材料”和“降价”时,是技术的进步还是创新精神的衰落?带着这些问题,让我们去掉GPT-Image-1.5的极速外衣。哪些“看不见的缺陷”仍然困扰着这位视觉大师? (GPT-Image-1.5代效果) 1.硬核评测,从“佛陀式等待”到“实时反馈” 这次ChatGPT Images产品的策略非常明确:用极致的速度和精确的控制在效率和可控性上攻击专业用户的伤痕累累。 (AI生成图像)——“极速”能力的质变:创意工作流程的福音。如果你是一位认真的创作者或营销者,GPT-Image-1.5在速度上的进化无疑将是你眼中的绝对对手。官方数据显示,新模型的生成速度比原来提升高达4倍!有网友评论称,这是“自 Nano Banana 发布以来,AI 图像生成领域模型排名的最大跃升!”在追求实时交互和高效迭代的今天,这种速度的革命性意义在于: · 并行创作:用户可以在现有图像合成的同时,继续发起新的创作请求,彻底消除“试错期”。 · 减少试错成本:以前需要几分钟测试的东西,现在可以在几十秒内完成多轮迭代,大大提高了“试错效率”。这种速度的提高,使图像生成从“被动等待”变为近乎“实时反馈”,为后续的图像生成奠定了坚实的基础。 ——独立工作空间:对用户体验的颠覆性重构 为了满足这种高速迭代的需求,OpenAI推出了独立的图像创作空间,不再让图像功能出现在聊天窗口中。(图片由AI生成)这个专属“创意工作室”预设了多种滤镜,不断更新流行趋势词、创意模板。此外,用户还可以上传一次个人照片(肖像),以便后续重复创作,从而降低重复插画的成本。正如 OpenAI 应用负责人 Fiji Simo 所说,新界面旨在让图像生成过程变得有趣,让创意探索变得轻松。 ——“精准编辑”的力量:告别一般漂移。在具体的编辑应用场景中,GPT-Image-1.5也有了质的飞跃:(图像由AI生成)一致性维护(核心):能够更精准地区分图像中“需要改变的部分”和“应该保持不变的部分”,并“钉住”内部推理中的关键视觉锚点。例如,你可以改变角色的衣服和发型,而五官、五官和灯光条件人物的s保持不变,大大增强了“试衣”和“人物兼容性”的实用价值。 · 指令跟随和文本渲染:模型在理解多重约束和复杂组合要求方面的鲁棒性得到了提高。同时在文字渲染方面也有了很大的提升,可以更清晰地显示密集的文字和小字体的内容。被认为是图像模型“走向实用”的必修附加课程。全球领先的免疫学家Derya Unutmaz形容用户体验“令人惊叹”,并特别称赞ChatGPT Images在命令执行的准确性和图像编辑的细腻度方面的出色表现。 2、深挖:行业魅力与焦虑背后的“隐秘缺陷”。但我们不能只看军官所展示的肌肉。 GPT-Image-1.5令人眼花缭乱的参数背后,也存在一些值得关注的缺陷和业界担忧警觉。 ——技术“护城河”的丧失和GPT-Image-1.5的定位是奥特曼“红色警戒”的主要原因之一。尽管OpenAI声称GPT-Image-1.5在一致性方面取得了突破,但目前业界的现状是:差距很小。 (AI 生成的图像)​​Google Nano Banana Pro 在精确编辑和背景去除方面一直处于领先地位。 Runway在视频开发领域甚至超越了Sora。有网友评论称,将版本号定为1.5而不是2.0本身就表明了OpenAI的谨慎态度:本质上是一次迭代而不是代际革命。有时,OpenAI 比竞争对手领先一年甚至两年;如今,这一领先优势被压缩为数周甚至数天。图像生成的底层范式已经成为业界共识,OpenAI 不再有独特的配方。 ——复杂组成和结构化设计的挑战虽然模型在大多数情况下表现良好在保持基本要素的一致性方面,面对复杂和结构化的任务时仍然存在挑战。 (AI 生成的图像)​​沃顿商学院教授 Ethan Mollick 认为,在处理复杂的视觉内容(例如多图像幻灯片、信息图表和其他结构化设计)时,ChatGPT Images 的表现可能仍然不如 Nano B 的竞争产品 Anana Pro。前 OpenAI 研究员 Miles Brundage 抱怨,当单词提示太长或太复杂时,ChatGPT Images 可能无法完全理解和协调所有细节,导致输出显得随机或不精确。这说明该模型在“抽象理解”和“多要素逻辑协调”方面尚未达到完美状态。 ——降本增效:商业成功的布局 这次升级也是智慧商业的成功。 GPT-Image-1.5通过API正式开放。其最大的亮点在于图像输入输出的总成本减少了20%左右! API 定价为每百万个输入代币 8 美元,每百万个输出代币 32 美元。 (图片由AI生成)这对于预算有限的sa初创企业和电商公司来说无疑是一大利好。 Wix 和 Canva 等领先公司已经开始采用这种模式。正如Wix AI研究和数据科学负责人Hila Gat表示,GPT Image 1.5图像质量优异,控制精确,能够准确执行编辑指令,支持端到端迭代,适合实际生产。 3、结论:GPT-Image-1.5在“王座守护”视觉时代与未来创作自由的双重进化——速度快、精准锁定——再次向世人证明了OpenAI在AI基础设施领域的主导地位。不再满足于做一名偶尔突发灵感的“艺术家”,而是立志成为每个创意工作者办公桌上的“数字版Photoshop”。然而,面对日益增加的压力谷歌和Anthropic等巨头可以肯定,当所有模型都接近人类专家的水平时,“第一”的头衔将变得越来越昂贵和脆弱。 OpenAI真正的考验将不再是能否超越对手,而是能否跨越它为自己设定的“商业化”门槛。这次成像能力的升级,本质上是Open AI为征服B端市场、为未来计算能力的高额支出而打的一张效率和成本牌。这给用户带来了前所未有的创作自由,但也将人工智能竞争推向了一个新的维度:谁能以最低的成本、最简单的方式将领先的能力融入到企业和个人的每一个工作流程中,谁就是真正的赢家。 (图片由AI生成)对于用户来说,巨头的“军备竞赛”是最大的福气。更强大的型号、更低的价格、更方便的工具——这些都是竞争的红利。如果GPT-Image-1.5能成真最终游戏结束,答案不在参数列表中,而在每个创作者的鼠标和键盘中。