PokerStars扑克官网

起源:新疆万亩沙地变连片良田作者: 邓仪

起源:新疆万亩沙地变连片良田作者: 邓仪绍:

细到能在米粒上写字 ,OpenAI让人对所有截图的信赖归零了

在 AI 巨头焦灼对战的此刻 ,谁也想不到 ,还有能靠榜单数据 ,拉出一个代差的文生图模型。

没错 ,说的就是GPT Images 2。

测试样例相信各人应该都看的差不多了 ,根基都能总结出它相比上一代好在哪。

好比高正确、高密度的文字渲染 ,出格是中文 ,甚至能天生可运行的代码;真切甚侄裣癌瘆人的 UI 截图仿照 ,昨天应该有不少人被一则 Claude Code 的推文骗到;画面精密度和审美水平也大大提升 ,那些一眼 AI 的狼狈打光出现的概率一下子低了太多 ,估计能让 Midjourney 吓出一身盗汗;强推理能力 ,能关注到好多你没写的细节 ,越来越靠近大说话模型的交互履历。至于弊端 ,OpenAI 自己也认可 ,在空间理解上的能力还不够。

当然 ,知危在测试一下后也能感触到 ,好多沉复无数遍的论点依然成立:设计圈不会因而崩塌 ,审美和创意仍旧属于人类 ,告白人才是受益最大的人群 ,行业市场价值的确必要沉估 ,但不会直接归零。要知路 ,每次一个炸裂的 AI 模型颁布后 ,都是幼白、老板和投资人最兴奋。老板和投资人想什么各人都知路 ,幼白不愿定是指纯门表汉 ,还有各类业务中必要补足艺术创作的人 ,好比告白导演能够省去大量拍摄和后期成本。至少在当下 ,AI 都是用来补足人的短板 ,而不是代替人的。

但 ,相比取代人类 ,我们要关切可能是另一种;喝嗣嵌酝计男爬悼赡芑岜捞 ,之后看到的每一张截图都必要留个心眼。

在今天知危对 GPT Images 2 的测评中 ,就会将上述提到的文字渲染、UI 仿照、精密节造、强推理这些利益 ,做一个极限测试 ,看看天堑在哪 ,也看看安全隐患有多大。

首先是文字渲染方面 ,知危出格把稳到 OpenAI 颁布的一张图 ,看似是一个平平无奇的铺在夏布上的白米堆。

但放大后有彩蛋 ,能够看到正中心的一粒米上写了文字 “ GPT Image 2 ”。

这张图能够说是给知危带来最大震撼的官规划例。

知危当即筹算把这个例子复刻出来。但在 ChatGPT 和 Lovart 尝试屡次后发现成效通常。大部门情况下 ,要么所有米粒都很大 ,能够轻松写下文字。

要么会以一种 “ 舞弊 ” 的方式写上去 ,好比只有写字的米;岜涞眉却。

后来通过一种多步迭代的方式来尝试 ,要求模型把上图写着文字的米粒缩幼 ,反复屡次之后 ,终于有了差不多的样子 ,但文字状态已经很难看清了。

而后知危才发现 ,OpenAI 提供的例子是 4K 分辨率的 ,而在 ChatGPT 和 Lovart 上免费使用时只能天生 1K 分辨率的图像。为此 ,知危买了个会员来测试 GPT Image 2 的最高质量和最高分辨率版本( 通过 Higgsfield AI ) ,以下每张图都基于这个规格。

是不是选取最高规格就能成功复刻了呢?并没有。一样的问题还是一向出现 ,不是所有米粒都太大 ,就是有文字的米粒太大 ,无论怎么提醒模型 “ 文字只有 75x30 像素大幼 ”、“ 写着文字的米粒和其它米粒一样大 ”。

以下是知危感触还算比力惊艳的两个例子。第一张图在于文字渲染的物理真实性 ,第二张图在于文字足够幼但很清澈。

接下来再刁难它一下 ,让它把上图的 “ Zhiwei ” 复造到另一颗米上去 ,这回倒是很顺利 ,但很显著模型特意新天生了一粒米来写文字。

若是是一粒米上写大量文字 ,好比一首诗呢?舞弊手法再次出现。即便强调字体大幼为原来的极度之一 ,以及写诗的米粒不比其它米粒大 ,依然很违和。

再从唐诗换为宋词 ,模型直接自己洒了一把不知种类的大米来写。

到这里只能先作罢 ,目前看了局要么是提醒词没猜对 ,要么 OpenAI 只是给了一个无意的了局 ,要么 OpenAI 是用更高级此外算力天生出来的。终于必要放大后能力看到文字 ,可能隐含了多一个级此外场景复杂度和推理难度。模型由于节俭算力而降智 ,宣传片和内测阶段都很牛逼的模型 ,一旦正式颁布就发现大打折扣 ,相信各人已经遇到不少次了。

当然 ,这也隐含了一种可能性 ,大模型公司内部的 AI 能力比我们能见到的还强得多 ,但受限于算力无法遍及。不外这个例子也象征性地让我们感触到文生图模型再一次突破了极限。

对了 ,猜猜 GPT Images 2 老冤家 Nano Banana Pro 会怎么做这路题?

别笑 ,这事 GPT Image 2 也可能做得出来。

接下来 ,我们再看一些比力有实用价值的测试维度 ,好比文字渲染密度。这可能是这一版模型最具实用价值的一个能力 ,在海报、产品图、科普图中都有大用。

测试很单一 ,就是看 GPT Image 2 在一张图中最多能塞进几多个文字。

我们以《西纪杏追原文为例 ,将第一章的内容逐步增长字数提供给模型 ,看看成效若何。

首先是从开篇到孙悟空刚出世 ,或许 1300 字。

天生了局如下 ,险些看不到一个错字或崩坏的字 ,甚至提醒词中蕴含的拼音注解也加进去了。

接下来 ,增长文本 ,从开篇一向到孙悟空称美猴王 ,约莫 2800 字。这一回 ,模型有些吃不消了 ,不仅后面的文本出缺失 ,末尾的文字也显得有些凌乱和拥挤。

我们再增长更多文本 ,从开篇一向到孙悟空单独出行追求永生不老之方 ,遇到了老樵夫 ,约莫 5600 字。这一回 ,模型直接吐妨了 ,或许只渲染了 1500 字内容。

最后我们直接将文自飒幅提升到万字规模 ,模型直接傻了 ,输出了一个换胎的科普图 ,还有一个前沿信息技术的 PPT ,不知路受了什么刺激。现实上我输入的内容是知危之前的采访文章全篇 ,不知路模型是怎么遐想到换胎的。

最后 ,我们折衷一下 ,在让模型出现轻微崩坏的 2800 自飒幅下稍微缩幼篇幅 ,从《西纪杏追的开篇一向到刚发现水帘洞 ,约莫 2500 字 ,这一回模型算是面子地实现了工作。

老冤家 Nano Banana Pro 能做到什么水平呢?

你可能感触 Nano Banana Pro 更懂宏观上的排版美学 ,但其实细节不忍直视 ,有太多文字崩坏。

对比一下 GPT Image 2 天生的部门放大 ,立见高下。实用场景下此刻注定得选择 GPT Image 2。

这个测试结论就一句 ,就知危的测试了局来看 ,模型的文字渲染上限或许是 2500 字。

以上重要针对文字元素 ,接下来重要看图像元素方面的节造精密度 ,出格是针对 UI 天生。

要说对于大部门人而言 ,最复杂的软件是什么 ,可能就是 PhotoShop 了。

我们来让 GPT Image 2 复刻一个 PhotoShop 的作业进行中的工作界面 ,首先是人像抠图场景 ,作业内容是在对人类头发部门进行详细的抠图操作。

提醒词:

一个超真怯注高清的桌面工作场景 ,占有电影级的光影成效;嬷魈迨堑缒云聊 ,布景中显示着 Adobe Photoshop(深色主题) ,屏幕上在进行精密的人像抠图。图像中心是一张高分辨率的半身人像 ,布景复杂(例如街路或天然环境)?偻脊淘诮兄 ,尚未实现。

的界面高度真切 ,与当前操作缜密有关:左侧工具栏清澈地显示了急剧选择工具、魔棒工具、套索工具、钢笔工具和画笔工具;顶部工具选项栏显示了“选择和蒙版”参数 ,例如边缘检测、羽化、对比度和移动边缘的滑块;画布上主体周围会出现动态的“蚂蚁线”选区 ,头发区域拥有半通明的边缘加强成效 ,批注在处置细节。

右侧面板蕴含丰硕的真实信息:“图层”面板至少蕴含布景、人像、蒙版、边缘调整和色彩校对图层或图层组;当前选中的图层拥有清澈的图层蒙版缩略图(是非对比显著) ,部门区域被涂成玄色或白色;“属性”面板显示蒙版参数;“汗青纪录”面板列出最近的操作步骤 ,例如急剧选择、细化头发和画笔蒙版;“通路”面板显示 RGB 和各个通路的预览 ,提醒能够使用基于通路的图像抠图职能。

图像至少蕴含三个清澈可辨的图像元素:首先是主体图像 ,其边缘已被抠出 ,并保留了复杂的头发细节;其次是原始布景 ,已被移除或暗藏(部门区域出现通明棋盘格图案或被蒙版遮挡);第三是待代替的新布景图层(例如 ,吞吐的景致) ,鄙人方隐隐可见 ,尚未齐全融合。

画布上显示一个柔边画笔光标 ,轻轻地沿着主体头发的边缘涂抹 ,部门边缘出现半通明过渡成效 ,体现了“细化”的过程;整体界面简洁了然 ,信息丰硕 ,所有 UI 元素的布局均切合 Photoshop 的现实工作流程。屏幕背光柔和地照亮键盘和桌面环境 ,营造出专一、专业且真切的氛围 ,强调“操作过程中的瞬间” ,而非最终制品。它占有 4K 分辨率、极高的细节阐发、真切的用户界面结构以及流畅无 bug 的界面。

天生了局:

周边环境和人类可能还有些 AI 味 ,至少 PS 的界面自身一眼是看不出来有什么问题的 ,重要是信息密度太大 ,是在很难相信 AI 能做到 ,但 GPT Image 2 就是做到了。当然 ,知危对 PS 的好多专业知识并不熟悉 ,无法判断上图是否真的齐全无误 ,就不再细细分析了。

我们再考验一下模型的精轻微调能力 ,把节造布景图可见性的幼眼睛图标改为 “ 不私见 ” 状态 ,也就是空的方框 ,模型真的做到了( 看图中橙色象征 )。

知危仔细对比过原图 ,真的只有这里扭转了 ,险些是像素级的精密度。但还是要挑刺一下 ,若是布景图被改为 “ 不私见 ” ,画布中的布景应该隐没才对 ,终于模型都号称有强推理能力了。

相比之下 Higgsfield AI 提供的便宜批改器的成效是这样的。固然也有把幼眼睛改为空方框 ,但给人脸也做了一个抠除 ,光照也变动了 ,很难做到可控。

再看一个游戏概想设计场景 ,作业内容是在将海盗帆船主体和大海布景进行融合 ,是 PS 中比力复杂的操作。

提醒词:

一幅超真怯注高清、广角的电脑桌面场景;嬷魈迨 Adobe Photoshop(深色主题)界面 ,捉拿了“3D 海盗游戏帆船概想设计”过程中图像合成的瞬间。

屏幕上显示着一块巨大的横向画布 ,中心地位在合成一幅优美的海盗帆船概想图。船体由多张图片拼接而成 ,蕴含木质船体、破旧的白色船帆、绳索、桅杆、大炮、金属铆钉、波浪飞溅的浪花以及浓雾和狂风浪 ,所有元素同时出现。图像仍处于未实现的编纂状态 ,显然是在进行后期建饰 ,而非最终制品展示。

Photoshop 界面必须高度真切且齐全。

画布周围可见参考图像的缩略图预览 ,展示了从图像网络到合成的整个过程。

超真怯注细节丰硕、结构精确的用户界面 ,丰硕的层级结构 ,看似混乱却又专业 ,动态的编纂进行中感 ,4K 分辨率 ,电影级光照 ,以及极高的保真度。

天生了局:

又是一个通过复杂度就能让人感触真假莫辨的了局。但必要把稳的是 ,模型对画面元素的节造还不够 ,我提醒的是 “ 主体和布景临时还没有天然融合的瞬间 ” ,类似下图的成效( 来自 Youtube 博主 Imad Awan) ,模型没有实现 ,而是直接在画布中给到了一个实现的文章。

我进一步要求模型实现这个成效 ,天生了局是这样的 ,直接把布景抠掉了 ,而不是调整帆船主体的光照。

能够看到 ,模型不论在 UI 细节天生还是精密节造上都远超之前的模型能做到的水平。但对于 UI 设计而言 ,精度不愿定够。

结合知危之前和产品设计专家的互换 ,其实必要真正达到像素级微调的工具才是够用的 ,这种要求下 ,还是传统工具更高效 ,若是你让模型将图像的某个元素偏移两个像素 ,模型根基就是啥也不干 ,输出原图。但 GPT Image 2 作为灵感索求和原型设计已经是肯定水平的够用 ,后续的细节微调工作 ,能够将图片输入 Codex 开发出原型或者转换为 Figma 文件后再进行。

最后要上大考了 ,就是强推理能力。

知危之前在测试 Nano Banana Pro 的时辰用过一个例子 ,就是通过在提醒词刻画 6X6 阵列的玩具机械人的行属性和列属性 ,让模型自己去推理每一个玩具机械人应该长什么样子。在这个例子下 ,Nano Banana Pro 和 GPT Image 1 实现的都不好 ,只有把每一个玩具机械人的属性直接列出来后 ,Nano Banana Pro 能力较好地实现这个工作 ,GPT Image 1 则是齐全失败。

这次我们再次把最高难度的提醒词直接给 GPT Image 2。

提醒词:

严格俯视(正上刚正交/orthographic top-down) ,整齐分列的 6x6 网格(6 行 × 6 列) ,白色布景 ,细薄灰色网格线将每个单元格分隔开。每个单元格正中搁置一个玩具机械人(总计 36 个) ,每个机械人都有确定且唯一的表形属性和编号(两位数 ,从 01 到 36 ,编号以玄色或深灰色幼字印在机械人底座或底盘一侧 ,清澈可辨)。

机械人风格:复古玩具(怀旧机械/齿轮/铆钉感) ,色彩鲜艳但材质各别(按规定分配) ,每行和每列遵循确定性属性映射(见下方规定) ,确保所有机械人互不沉复。

严格维持顶视无透视变形(无鱼眼、无倾斜) ,均匀平行光(自上而下)、轻微柔和投影以显示立体感但不扭转顶视概括。

高分辨率、超细节 ,4K 输出(或更高) ,极致细节(纹理、螺丝、划痕、贴纸、反光、铆钉、漆面厚度等) ,无景深吞吐。

画面干净:只出现机械人、网格线与白色布景。高保真、真实感玩具质感 + 稍微卡通化的色彩鼓和度。

确定性天生规定:

为了保障“每一个机械人都分歧且可复现” ,请依照下面规定组合属性(行 × 列 的组合天生唯一表形):

行主色(Row 1 → Row 6 ,决定主色调)

Row 1: 正红(crimson)

Row 2: 橙黄(amber)

Row 3: 橙(tangerine)

Row 4: 黄(sunny yellow)

Row 5: 绿(emerald)

Row 6: 青(teal)

列材质/表表处置(Column 1 → Column 6 ,决定材质与整体质感)

Col 1: 抛光金属(polished steel)

Col 2: 拉丝铝(brushed aluminum)

Col 3: 黄铜(brass)

Col 4: 铬镀层(chrome)

Col 5: 涂漆塑料(high-gloss painted plastic)

Col 6: 半通明塑料(translucent acrylic)

GPT Image 2 一雪前耻 ,色彩、材质、编号一样都没错。

接下来 ,我们再提升一个难度等级 ,做 10X10 阵列的玩具机械人 ,不仅要遵循按行分歧色彩和按列分歧材质的细节 ,还要加上按行分歧头部造型和按列分歧眼睛类型的细节。

提醒词:

严格俯视(正上刚正交 / orthographic top-down) ,整齐分列的 10×10 网格(10 行 × 10 列) ,纯白布景 ,极细灰色网格线精确分隔每个单元格(线宽一致、无透视收敛)。每个单元格正中央搁置一个玩具机械人(总计 100 个) ,所有机械人尺寸统一、居中对齐、边距一致。

每个机械人必须具备 齐全唯一的表观组合与编号(01–100 ,三位数体式 001–100) ,编号以微幼但清澈的玄色或深灰色印刷字体标注于底座或底盘边缘 ,方向统一且可读(不成旋转或遮挡)。

整体风格:复古机械玩具(nostalgic retro toy robots) ,强调齿轮结构、铆钉衔接、机械拼接感;造型统一基础结构(头+躯干+手脚) ,但细节变动极丰硕。色彩高鼓和但真实材质响应正确。

光照:均匀平行顶光(从正上方垂止卣射) ,极轻微柔和接触阴影(ambient occlusion) ,无方向性阴影偏移;严格无透视、无镜头畸变、无鱼眼成效。

画质:超高分辨率(4K) ,极致细节(微划痕、油漆厚度、金属氧化、模具分型线、螺丝纹理、微尘、指纹痕迹、反射粗糙度差距等) ,无景深吞吐(everything in focus)。

画面约束:布景纯净 ,仅蕴含机械人 + 网格线;无额表元素、无文字注明(除编号表)、无杂物。

确定性天生规定(10×10 全唯一组合)

1. 行主色(Row 1 → Row 10:决定主色调)

Row 1: crimson(正红)

Row 2: amber(褐色)

Row 3: tangerine(橙)

Row 4: sunny yellow(亮黄)

Row 5: lime green(浅酸橙绿)

Row 6: emerald(深祖母绿)

Row 7: teal(天蓝)

Row 8: azure(钴蓝)

Row 9: cobalt blue(粉红)

Row 10: violet(紫罗兰)

2. 列材质(Column 1 → Column 10:决定整体材质)

Col 1: polished steel(抛光钢)

Col 2: brushed aluminum(拉丝铝)

Col 3: brass(黄铜)

Col 4: chrome(铬)

Col 5: high-gloss painted plastic(高光漆塑料)

Col 6: translucent acrylic(半通明亚克力)

Col 7: matte rubberized coating(哑光橡胶涂层)

Col 8: anodized metal(阳极氧化金属)

Col 9: ceramic enamel(陶瓷釉)

Col 10: frosted glass composite(磨砂玻璃复合材质)

3. 行决定头部造型(Head Type)

Row 1–10 对应:

圆顶/立方体/六棱柱/圆柱体/梯形/天线罩/双眼面罩/复古电视/头盔/虫豸状

4. 列决定眼睛类型(Eye Style)

Col 1–10:

单透镜/双圆形/LED 灯条/面罩发光/像素眼/机械虹膜/十字准星/双筒望远镜/狭缝眼/无可见眼

关键约束(极度沉要)

每个机械人 = 唯一组合(色彩 × 材质 × 头 × 眼)

不允许出现两个视觉上一样的机械人

所有机械人朝向一致(正上视不成旋转)

网格严格对齐 ,无偏移、无错位

编号必须齐全覆盖 001–100 且无沉复

乍一看又被惊到 ,色彩按行排布齐全正确 ,眼睛类型根基没问题 ,每一列的机械人造型都很分歧。但仔细看就会发现 ,玩具机械人险些没有材质上的差距 ,多了一列 ,第 7 列编号沉复并和第 10 列一样 ,模型按列而不是按行来画玩具机械人的头部造型 ,第 4 列玩具机械人的头部造型没有要求过 ,正本该实现的圆柱体头部造型放到了第 6 列 ,短缺复古电视和虫豸状头部造型 ,等等。

所以 ,GPT Image 2 的批量天生能力的确有大幅提升 ,还一举超过了 Nano Banana Pro ,但能力天堑还是很快被探到。

总体而言 ,GPT Image 2 的精密天生和节造能力都有很大水平的提升 ,但能力天堑也很显著 ,对各类场景能带来提效是注定的 ,至于提效的水平 ,还是要具体场景具体分析。对于告白估计是大跨度的量变 ,对于 UI 设计则可能是质变的水平 ,即从不成用到可用。

最后 ,我们聊聊模型的安全风险。

能够看到 GPT Image 2 在天生 UI 上精密水平出格高 ,足以以假乱真 ,甚至前面的 PS 画布里的帆船概想设计都能倒劓图来交作业了。

知危也尝试问 Gemini 那张帆船图是不是 AI 天生的 ,由于没有 Google AI 的水印 ,Gemini 只能凭据画面元素进行判断 ,了局 Gemini 齐全沉浸在画布中去分析帆船是不是 AI 天生的 ,得出结论说这是基于 AI 天生的图进行人为批改后的帆船图 ,齐全没意识到 UI 自身也是 AI 天生的。

ChatGPT 也给出了类似的了局。

而对于好多通常人来讲 ,各人可能在对一张图分析的时辰 ,还没 AI 详细呢。

从昨天到此刻 ,网上流传着各类 AI 天生的新闻软件截图、社媒截图 ,个个都是假新闻;褂腥送娓骼喽窀愎I踔恋赜 ,蕴含不限于川普与高市早苗成婚、张雪峰代言长命乡、科比代言直升飞机等等......

这导致在编纂部群里 ,从昨全国午起头 ,每有人发一张图 ,下面就顿时有意有人问:这是 AI 天生的吗?

今后的世界 ,注定是 AI 假图满天飞。若是每一张截图都必要仔细甄此外话 ,降低上网摸鱼履历还是幼事 ,最可怕确当然是危及财富安全。

此刻 ,GPT Image 2 已经全量颁布 ,靠人为检测必然跟不上假图颁布的速度 ,必要 AI 的助力 ,但当前的 AI 检测技术似乎还没筹备好。

所以只能说 ,人们对图片的信赖 ,根基归 0 了 ,至于什么时辰能沉新成立信赖 ,还真不好说。

@吕长帆:牛宝体育平台入口 ,新疆一水渠遍布救命绳
@周孟儒:90后高三班主任两鬓已斑白
@张圣福:章若楠回应《雨霖铃》剧中措施

【网站地图】