ChatGPT のウェブインターフェイスが一新され、PDF の要約も簡単に!

投稿者: | 2023年11月8日

The new ChatGPT release features PDF content interpretation and integrates browsing, advanced data analysis, and DALL-E into a seamless chat experience. Evaluate it now.

In a bright, animated style, there are two robots inspired by Japanese anime. One robot is seated at a desk with a thick book open in front of it, diligently writing a manuscript with a pen. The other robot is standing in front of an easel, holding a paintbrush and palette, painting an oil landscape on a canvas, with a photograph of the landscape as a reference beside it. The scene is set in a cozy, artistic studio with natural light streaming in from a window, highlighting the creative process of both robots. The image is in a wide aspect ratio of 16:9.

相模原市で IoT 設計を受託しているファームロジックスです。

先日、ある AI 関連のニュースサイトで、こんな記事を見つけました。

そこでは、ChatGPT Plus のユーザーに対して 2つの新しい機能が段階的にリリースされている、と紹介されています。この機能が、私のアカウントでも利用できるようになったので紹介させて頂こうと思います。

一つは、PDFファイルをアップロードして内容を解析してもらうことのできる機能です。

もう一つは、これまで、ブラウジング(インターネット上の URL にアクセスして内容を解析する)、アップロードしたファイルの高度なデータ分析、DALL-E によるイラスト作成、という 3つの機能をそれぞれ異なるモードで選択して使用する必要がありましたが、これらを統合して一つのチャット内で全ての機能を同時に使えるというものです。

まずは前者から試してみましょう。

私の PDF プレゼン資料を要約してもらう

以前こちらで、大人のための電子工作会のプレゼンテーション資料を公開させて頂きました。(PDF ファイルへの直接リンクはこちら。)これを要約して貰いましょう。ページ数は、およそ 150ページです。

:

この資料を要約してください。

ChatGPT:

この資料は、「マイコンボードを使用した組込みプログラミングの基礎と実践」というタイトルで、横山篤史様によって著され、ファームロジックスにより出版されたものです。発行日は2020年6月19日で、内容は2015年当時のものを踏まえています​。全文の要約については、引き続き資料を確認して、要点をまとめます。

一度、ここで出力が途切れますが、少し待っていると、要約が表示されます。

資料は、Arduinoマイコンを使ったシリアル通信やGPIOの使い方、デジタルICの基本に関するプレゼンテーションです。通信設定の初期値として、通信速度9600bps、パリティビットなし、データビット8ビット、ストップビット1ビット、フロー制御なしとなっています。プログラムのサンプルにはシリアル通信を介してパソコンに文字列を送信し、パソコンからの入力を読む内容が含まれています。

プレゼンテーションはまた、GPIOピンの使用法や、真と偽を電位の高低で表すマイコンICの動作原理についても説明しています。また、電流の流れ方、ソース電流とシンク電流の違い、入力インピーダンスの高いMOS FETの特性とその電子部品への影響、デジタルIC同士の接続方法、プルアップ抵抗やプルダウン抵抗の必要性、回路図の描き方についても触れています。

具体的なハードウェアの使い方としては、スイッチ、LED、モーターなどの接続例が示され、それらの部品の極性や接続の注意点、リード線の取り扱い方法についての説明がなされています。さらに、Arduino用のユニバーサル基板のレイアウトや、抵抗器カラーコード、部品の極性、静電気対策、ハンダ付けの方法についても触れられており、Arduinoワークショップでの具体的な手順としてプロジェクトの組み立てからハンダ付け、部品の取り付けまでを段階的に解説しています。

最後に、赤外線LEDの点滅回路の設計とその絶対最大定格、プルアップ抵抗やローパスフィルタ、赤外線受光モジュールの回路などについての補足情報が提供されています。これらの情報は、Arduinoを用いた電子回路の基本から応用までをカバーしており、プレゼンテーションでは実践的な工作プロジェクトを通じて学ぶことを重視しています​​。

これは便利ですね。

従来、大きなテキストを要約して貰う場合には、テキストを 8000トークン以下に分割しなければなりませんでしたが、この PDF アップロードおよび読解の機能では、どのような処理になっているのでしょうか。いずれ、機能の詳細が説明されることを期待しています。

写真をアップロードして、イラストに直してもらう

次に、チャットモードを切り替えなくても、ブラウジング、高度データ分析、DALL-E をシームレスに使うことができる機能についてです。今回は、いままで直接にはできなかった、GPT-4V(GPT-4 Vision)によるイメージの分析と DALL-E 3 によるイラストの描画を 1ステップで指示してみましょう。

まずは、こんな画像を用意します。食いしん坊な感じですみません。近所のとんかつ屋さんで撮影した料理の写真です。

以前は

  1. 高度データ分析(Advanced Data Analysis)機能(GPT-4V)のチャットセッションを開き、イラストをアップロードした後、イラストを文章で説明するように指示する。
  2. 続いて別のチャットセッション(DALL-E 機能あり)を開いて、上で得られた説明文をイラストとして描画してもらう

という 2つのステップが必要でした。

今回のアップデートでは、シームレスな一つのチャットで 2つの機能を同時に利用できる、という訳です。さっそく、ChatGPT のシームレスチャットを使ってみましょう。

:

この写真を、フラットなイラストに描いてください。アスペクト比 16:9。

ChatGPT:

イラストが完成しました。ご確認ください。

ここでは、作成例を一つ紹介します。(ちなみに、以前はイラストを自動的に 4つ作成してくれましたが、最近はデフォルトで 2つになってしまいました。)

A flat illustration in a 16:9 aspect ratio depicting a Japanese meal set. The meal consists of a large, crispy breaded pork cutlet (tonkatsu) with a lemon wedge on top, accompanied by a mound of finely shredded cabbage on a plate. Next to it, a bowl of steamed white rice, a small dish with pickled vegetables, a salad with shredded vegetables and corn, and a miso soup bowl with a lid. Include chopsticks and a train pass on the table, embodying a typical Japanese dining scene, with a subtle color palette and a clean, modern aesthetic.

ちょっとおかしな感じもしますが、DALL-E 3 が GPT-4 に統合されてからの時間を考えれば、このシームレスチャット機能は、十分な進展と思います。

ちなみに、最終的にどのような DALL-E 3 プロンプトが生成されたのか、参考までに示します。

A flat illustration in a 16:9 aspect ratio depicting a Japanese meal set. The meal consists of a large, crispy breaded pork cutlet (tonkatsu) with a lemon wedge on top, accompanied by a mound of finely shredded cabbage on a plate. Next to it, a bowl of steamed white rice, a small dish with pickled vegetables, a salad with shredded vegetables and corn, and a miso soup bowl with a lid. Include chopsticks and a train pass on the table, embodying a typical Japanese dining scene, with a subtle color palette and a clean, modern aesthetic.

GPT-4 による日本語訳: 16:9のアスペクト比で、日本の食事セットを描いたフラットなイラストです。この食事には、上にレモンのくし形切りが乗った、大きくてサクサクの衣をまとった豚カツ(とんかつ)が皿の上のきれいに細切りされたキャベツの山とともに盛り付けられています。その隣には、白米の蒸し飯の丼、漬物の小皿、野菜とコーンのサラダ、そして蓋付きの味噌汁の椀があります。テーブルの上には箸と電車の切符を置き、控えめな色使いとクリーンでモダンな美学を持つ、典型的な日本の食事風景を表現しています。)

GPT-4V も DALL-E 3 も、なかなかやるな、という感じです。ちなみに、変な日本文字を生成してしまうのは、相変わらずのようですね。

Chat 画面の変更

最後に、ChatGPT のウェブインターフェイスの画面変更についても紹介しておきます。

まず最初に、ログインしたときの画面左上は、次のようになりました。

右上の ChatGPT 4 の横の下向き矢印(?)をクリックすると、こうなります。

Plugins は別として、その他の機能は一つの GPT-4 チャットに統合されたので、選択肢は表示されません。

また、先ほどの画面で Explore をクリックするとこんな画面になります。

Coming soon の Create a GPT が気になりますが、下の Made by OpenAI にも面白そうなキーワードが並んでいます。

今後、これらの機能についても引き続き紹介できればと考えています。

お問い合わせはお気軽に!

お問い合わせを頂いた後、継続して営業活動をしたり、ニュースレター等をお送りしたりすることはございません。
御返答は 24時間以内(営業時間中)とさせて頂いております。もし返答が届かない場合、何らかの事情でメールが不達となっている可能性がございます。大変お手数ですが、別のメールアドレス等で督促頂けますと幸いです。

コメントを残す