有効なプロンプトの書き方
ChatGPTへの指示を工夫することをプロンプト・エンジニアリングと言う。将来的にはChatGPTは、アプリケーションに組み込まれて、ユーザーがプロンプトをタイプしなくても、環境からユーザーの意図を読み取って、自動的に欲しい結果を出力するようになっていくだろう。しかし、当面は人間が効果的なプロンプトを書く必要がある。
「このデータを分析してデータを美しいグラフにして、分析に基づく提案をWordファイルで生成しなさい」のような複雑なプロンプトは、「データを分析して」「分析のグラフを作成して」「グラフを美しくして」「分析に基づいて提案を書いて」「この提案をWordファイルにして」というシンプルなタスクの複数回のプロンプトに分割した方が賢い。
複雑なプロンプトは、シンプルなプロンプトと比較して結果の確実性が低くなる。シンプルなタスクを実行させて完璧な100%の回答をもらったら、そのデータをもとにして次のシンプルなプロンプトにつないでいく。初めてやらせる作業では、シンプルで確実なプロンプトのパイプラインを作ることを心がけること。
ChatGPTは、英語で使用した時の方が精度が高く、入力、出力できる文章量も多くなる。文章量という点ではおよそ2〜3倍も違ってくる。英語が得意な人は、設定を英語にして英語で使用する方がいい。ChatGPTは翻訳も得意なため、ChatGPTのウィンドウを2つ立ち上げておき、片方は日本語で書いたプロンプトを英語に翻訳して、もう一方にコピー&ペーストするという方法も使える。
ChatGPTは、同じセッションの一連の会話を記憶して、次の質問に答える。この一時記憶機能があることで、会話の文脈が保持されて、便利に使える。GPT-4では日本語で約2万字程度を記憶する性能があるとされる。一度に出力できる文章量は日本語で最大800字ぐらい。原則として1つのセッションは1テーマにするのが無難。同一のテーマであっても15回くらいのやり取りでセッションを終えるのが良い。
新たなセッションを立ち上げると以前の文脈が失われる。前のセッションのまとめの内容をファイル化し、次のセッションでアップロード、その続きをしたいと指示する。ChatGPTは、結果をテキストやCSVなどのファイルに出力できる。データ分析の出力結果は、JSONというデータ型を保持できる形式で出入力を行うとスムーズに進む。
ChatGPTの注意点
ChatGPTには間違いもある。ユーザーの要求に応えようと、学習していないのに、それっぽい回答を出力することがよくある。これをハルシネーションと呼ぶ。ハルシネーションに対応するには、ユーザーにハルシネーションを認識できる知識が必要である。全く知らない分野の文章の生成は危険である。ある程度、ユーザーが知識を持っている必要がある。
正しいとわかっている情報、十分に信用できる情報を与えて、その情報を土台にして文章を生成させる。文章を生成させる前に、そのテーマの重要な情報を入力し「◯◯についてWeb検索して基礎知識を学んで」という指示をしておく。Wikipedia、論文検索のScholar.AIや科学計算や歴史データベースのWolframなどのGPTsを使うのも有効なやり方である。
ChatGPTの様々な機能の使い方
ChatGPTには非常に便利なデータ分析機能があるが、使いこなすにはPythonの基本知識が必要である。そうでないと、ブラックボックスになる。知識があれば、コードを読んで正しい動作をしているかを確認できる。但し、ChatGPTでは大きなデータ分析はできない。大きなデータ分析をするには、ChatGPTにデータ分析のPythonコードを書かせて、外部のコンピュータで実行する。
ChatGPTにはテキストを処理する機能だけでなく、画像を処理する機能がある。DALL-Eという画像生成AIである。また、PythonとDALL-E以外にも外部の強力なアプリケーションの機能を呼び出すGPTsの機能がある。例えば、文章を映像化するHeyGenやVisla、美しい図を作成するWhimsical Diagrams、高度な科学計算を行うWolfram、YouTube動画を要約するVoxScript、ロゴデザインや資料作成のCanvaなど、既に数万種類のカスタムAIが用意されている。
ChatGPTsのメニューから「GPTsを探索する」でGPTsのディレクトリに入り、使いたいGPTsを検索する。メニューの「サイドバーに保持する」をチェックすると、簡単に呼び出せるようになる。サイドバーに保持したGPTsは「メンション」機能を使って呼び出すこともできる。メンション機能を使うと、1つのセッションの中で複数のGPTsを組み合わせて活用することができる。