How has ChatGPT Images 2.0 evolved from DALL-E 3? This article compares identical prompts to examine realism, style reproduction, prompt understanding, and remaining quirks.
相模原市で IoT 設計を受託しているファームロジックスです。
以前(2023年10月)に、こんな記事を書いたことがあります。
それから 3年近く経過し、最近 OpenAI から ChatGPT Images 2.0 が発表されました。過去のプロンプトと同じものを使い、どのような変化(成長)があったのか試してみたくなりました。(ゴールデンウィークボケで頭が働いていないので、こんなブログを書いています。)
以下、特に記していない場合は、GPT-5.5 の Thinking モードを使っています。
日本の古風な切り絵風

プロンプト: Image crafted to resemble traditional Japanese paper cutting. A countryside temple’s courtyard as the sun sets. An elderly man and a young girl observe a majestic chestnut tree. Shadows dominate the scene, making it seem dreamlike. The evening’s first star is on the verge of shining. If one looks closely, a faint ghostly figure can be spotted on the right side, watching the father and daughter. Aspect ratio 16:9.
「paper cutting」という感じではなくなってしまいましたが、絵の質感は向上し、女の子がスカートではなくなりました。
月の沙漠

プロンプト: In a dreamlike watercolor scene, an expansive Arabian desert is lit by a radiant full moon. The time is night, and gusty winds sweep up swirling sands. Far off, two figures that appear to be traders trek with multiple camels in tow. The image has a 16:9 aspect ratio.
DALL-E 3 のものより、イラストとしての質が向上したように思います。
天体観測をする母子

プロンプト: Oil painting reminiscent of the early 1900s in America. A serene countryside night where a mother and her boy are engrossed in observing Halley’s Comet through a telescope. The sky above is a blanket of stars. A cat lounges nearby, enjoying the tranquility. Far off, a barn stands with a fence, hinting at livestock resting within. Aspect ratio 16:9.
DALL-E 3 版よりも、ずっと指示通りの油絵調になりました。
50年前の東京郊外: 雪の積もった朝

プロンプト: Vintage photo style. Tokyo outskirts from half a century ago. An apartment structure that reflects the architecture of that time period. Morning scene where elementary school children are excitedly playing in the deeper 30cm snow, making their movement somewhat difficult. The focus is closer to capture the happy expressions on their faces. In the distance, light breaks through as the snowfall stops. The school bell is about to ring. Frame with 16:9 ratio.
DALL-E 3 のイラストも好きでしたが、 「The focus is closer to capture the happy expressions on their faces.」という指示によく従っているのはこちらでしょうか。
紅葉の中を走る展望車

プロンプト: Muted watercolor depiction of rural Japan in autumn. An antique steam train journeys through the foliage-rich mountains. The observation car fills the canvas, featuring an elderly couple enjoying the scenery from a wooden deck. An older conductor in uniform stands beside them. Aspect ratio 16:9.
前方を行く汽車と展望車の配置がおかしいです。水彩画としての質感は良いと思いますが。ちなみに、スハフ32 は実在する車両のようですが、このような展望車ではないようです。
街を行く酔った初老の男

プロンプト: Simple illustration with orange tones capturing an 80s Japanese downtown scene without any text. A slightly drunk man in his 60s walks falteringly away, holding an alcohol bottle, with his back facing us. A mother and child, about 5 meters away, are turned away from the viewer, seemingly looking at the man with worry. The scene is set in the evening of a summer day, approximately 7 pm. Aspect ratio 16:9.
DALL-E 3 のものより、指示を正しく理解するようになっています。
子供が描いたような色鉛筆画

プロンプト: 16:9 childlike colored pencil sketch of Tokyo, as if a young child drew it in a very basic manner. Few tall rectangles for buildings, a stick-like representation of Tokyo Tower, and simple dots and lines for pedestrians and vehicles.
日本語を正しく書けるようになったのは、大きな進歩だと思います。
80年代の日本のスーパーにて

プロンプト: Old-fashioned photo effect without text. In a supermarket reminiscent of 1980s Japan, a lady, approximately in her 50s, with a shopping basket, is contemplating over an apple. The scene is busy with the hustle and bustle of shoppers and employees during the evening. Aspect ratio 16:9.
これは間違いなく、DALL-E 3 よりも大きな進歩です。女性はまだ、50代にしては老けた印象ですが、1980年代だとこんなものでしょうか!?
草原を馬で駆ける少年

プロンプト: Oil painting style of a close-up view of a young boy earnestly riding a horse across European plains. He is accompanied by about 10 other horses running alongside him. The season is summer and it’s daytime, with the sun shining intensely. The aspect ratio is 16:9.
DALL-E 3 のものより、ずっと油絵ぽくなりました。また、顔がしっかりクローズアップされています。馬の数も指定とおりです。
雑木林の間の細い道

プロンプト: Oil painting in a melancholic color scheme illustrating a tranquil early fall landscape in rural Japan from 100 years ago. A dirt path, about 1.5 meters in width, extends from the viewer’s position into the depth of the scene. Here and there, puddles are formed on the path. The path bends to the left after a distance of around 10 meters, with its continuation not visible. Dense, dark woodlands stand on both sides of the path, interspersed with ivy. The forest is so thick that the sky is hidden. Tall grass grows under the trees, tall enough to hide a child. Two elderly women, presumably farmers, are seen walking toward the viewer from down the path. Aspect ratio 16:9.
DALL-E 3 に比べ、明らかに日本風になりました。また、指示にも明確に従うようになりました。
宇宙船のコンピュータルーム

プロンプト: 3D art of a dome-shaped enclosure, approximately 5 meters across. The inside of the dome is well-lit, revealing walls and a ceiling embedded with computers, machinery, and tubes. A glass sphere, about 50 cm in diameter, stands in the middle of the dome, mounted on a shiny gold pillar. The sphere shines with a spinning pale blue light. The ground seems to be constructed from a metallic material from the near future. Aspect ratio 16:9.
DALL-E 3 でもこのようなイラストは得意な印象でしたが、さらに質感が向上し、プロのイラストレータ顔負けの精細さになりました。
研究室でロボットを組み立てる老博士

プロンプト: Artwork in the vein of 1970s Japanese anime with flat, faded, and somber color tones. Within a robotics lab with an ambiance of a Western factory, a veteran Japanese researcher in a white lab coat, with a look of deep concern, is working on a robot prototype reclining on a bed. The robot has a hammer in its right hand and a drill in its left, but its legs are missing. Numerous wires stretch from the robot, reaching the ceiling. The surroundings are densely filled with vintage computers and measurement tools. The lab’s door is open, revealing a young woman, presumably the researcher’s assistant, calling out to him. Aspect ratio 16:9.
マジンガー Z やゲッターロボ(← 古すぎ)みたいなイメージで描きたかったのですが、私のプロンプトが不適切でした。しかし、DALL-E 3 に比べて、明らかにプロンプトへの追従が正しくなり、「実際の70年代の日本アニメから切り出したシーンだ」と説明したら、多くの人が信じてしまうであろうクオリティになりました。
粘土細工風の、にわとりの家族

プロンプト: Pastel-colored 3D claymation-style illustration for children. A rooster and a hen are feeding in an open meadow. Three chicks are playing close by. A male farmer is visible in the mid-distance, slightly blurred, as he works in his field. The distant landscape of the meadow is hazily depicted. Aspect ratio 16:9.
「粘土細工風」にしては、少し造形が細かすぎる感じがします。ま、指示を工夫すればもう少し DALL-E 3 バージョンの作例に近づくのではないでしょうか。
ラジオ工作をする父と娘: 70年代風

プロンプト: A vintage 1970s colored photograph showing a Japanese man and his daughter working together at a workbench. They are focused on building a transistor radio. Tools such as a soldering iron and an old circuit tester can be seen on the table. Aspect ratio 16:9.
DALL-E 3 版よりも、ずっとリアルな 70年代になりました。背景がやや「わざとらしい」ですが、これはプロンプト次第でなんとかなりそうです。
スマートフォンの壁紙

プロンプト: A more subtle and blurred forest landscape for a smartphone wallpaper. The image should be even gentler and softer in color, creating a dreamy, ethereal feel. The forest elements, like trees and foliage, should be lightly defined, providing a sense of a natural setting without sharp details. This approach ensures that the wallpaper remains unobtrusive for smartphone icons and text. The overall impression should be calming, with a hint of forest beauty, perfect for a background that blends seamlessly into a smartphone screen.
これは、わざとアスペクト比を指定していません。DALL-E 3 版では横長の画像を生成してくれましたが、今回は期待通り縦長の、スマートフォンの壁紙向けのアスペクト比になりました。ちょっと縦長すぎるという感じもありますが。
住宅街に甲冑の騎士が現る

プロンプト: In a suburban Japanese neighborhood during a winter evening, a young girl is facing a medieval European knight in full armor. The knight, holding a sword in his right hand, appears suddenly, causing the girl to react with surprise and an attempt to flee. The girl’s expression and posture convey her shock and urge to escape from this surreal encounter. The scene is set against the modern backdrop of the neighborhood, with the fading light of dusk adding to the dramatic and unexpected juxtaposition. Aspect ratio 16:9.
拙宅の近所に、玄関先に中世の騎士が身につけるような甲冑を展示(?)している家があるのです。それをイメージして、写真風のイラストを描いてもらいました。DALL-E 3 に比べて、イラスト(?)としての完成度は高まったと思います。
