在明天清晨 OpenAI 宣布新一代文生图功效的时间,各人还不是很明白它的气力,还认为是跟在 Gemini 背面,带来一些迟到的进级。GPT 不语,只是一昧地让用户案例震动全场。




在最新的迭代中,OpenAI 带来了文生图功效上,冲破性的指令遵守跟分歧性表示。只要最简略的笔墨 prompt,就能够实现高精度的图片细部微调——所有修正只要要在会话傍边停止,无需任何按钮、笔刷等额定操纵。邪术不必笔刷,只用咒语跟 Gemini 相似,此次 OpenAI 的更新,重点不在于能做多写实、多庞杂的图片,而在于指令遵守跟十大滚球外围平台分歧性,而且是在只应用天然言语指令的条件下。先来看一组比拟入门级的食品照片,prompt 也十分简略:generate an image of coffee and bread。

随后,在原图的基本上请求改成冰咖啡、涂果酱。

除了杯柄之外,该加的加,该留的留,指令遵守十分杰出。波及到人像的图片,也有稳固的表示。

细心看的话,仍是有一些小处所是在变化的,但最要害的人体举措、衣服皱褶、心情,都不瑕疵。在这组图的时间,遇到了内容风控,报错称不合乎政策请求。不外,它懂得到了原指令的用意,提出了修正计划。

这最后一张,也是天生后果最好最天然的一张。画面内容简略的义务天然是手拿把掐,那么庞杂一点的呢?之前在 Gemini 的生图测试中,咱们出过一张都会陌头气象,后果十分惊人,再看一遍:

同样的 prompt,给 ChatGPT 履行,在画面后果上略微差了一点,尤其是到夜晚这张,多少乎曾经看不到人群细节了。

固然这个成绩比拟倾向于是审美差别,在对要害元素的辨认上是没成绩的,乃至能捕获到「茑屋书店」如许小的细节,字体天生也挺稳的。除了直接用笔墨天生,还能够上传图片停止修正——这里,最震动的一集来了。在上传了 png 格局的 APPSO 标记之后,第一步简略的变个 3D 破体。

后果还能够,暗影偏向纷歧致,但合乎光芒自身即可。接上去再做点调剂。

震动!这两次调剂的 prompt,不外是二十来个字罢了。