ChatGPTの認知が広がったおかげで、今や大規模言語モデル(LLM)を基礎にした生成AIサービスは広く一般的に使われるようになった。多くの人がそのパワフルさをどのように使うのかアイデアを巡らせるようになったのではないだろうか。
しかし、使ってみると、なかなか思い通りの成果が上がらないことも多い。いったんは業務に使い始めたものの、挫折した人も多いかもしれない。AIサービスは使いこなしによって、利便性や可能性が大きく変わってしまう。プロンプト、つまり質問の書き方次第で得られる回答の質が大きく変化するからだ。
ではどのようにすれば、LLMから価値を引き出せるのだろうか。
今後は各種業務システムにLLMが組み込まれ、意識をしなくてもAIの能力を引き出せるようになっていくが、それ以前に個人の生産性向上ツールとして活用するコツについて、筆者の経験と活用例をもとに紹介していく。
一度は断念した人も、この記事を読んで、ぜひ再チャレンジしてほしい。
目次
「AIは嘘をつく」の本質とは?
AIチャットは最も身近な生成AIサービスといえる。しかし、AIチャットの問題点として常に挙げられているのが、”正しくない答え”をさも正しいかのように答える点にある。この現象は、ハルシネーションと呼ばれるものだ。
AIは推論によって成り立っている。推論は学習した情報同士を分類し、より確からしい情報を探索しながら結論を探していく。その中で、さも確かのように思われる情報を結びつけ、結びつけられた情報が正解であることを前提に、その先の推論を行ってしまうことで、人間ならば想像もつかないようなとんでもない嘘を、しかもそれが真実であるかのように断言をしてしまう。
が、正確に言うと、嘘をついているわけではない。
膨大な学習情報の中から”より確からしい情報”を探索し、結びつけ、問題解決を図ろうとした結果、導き出した回答だ。そもそもAIはそれが正しいのかどうかを認知する能力を持っていない。より確からしい、つまり確率的に高そうな答えを出しているだけと言える。
人間の推論においても似たようなことがあると気づくだろう。条件が符合する全く異なる事例を一連の事象だと捉え、勘違いをしたまま推論をした経験はないだろうか。人間らしい勘違いや誤解は、雑多な情報を集約的に考慮した上で、何が真実であるかを推論する中で、一定確率で起こりうることだろう。
ハルシネーションも、それと同じような現象だと考えれば、嘘をつくわけではないと理解できるはずだ。
では誤解を避けるためにはどのようにすれば良いのだろうか。
「AIが参照する範囲」を指定しよう
曖昧な質問の答えを探すとき、さまざまな可能性を考慮しながら結論を導き出すために、幅広い知識の探索へと広がり、結論へとなかなか結びつかないといった経験は無いだろうか。脳内で一瞬にして、それらを探索できるとはいえ、知識の範囲があまりに広いと、正しい情報にたどり着かないうちに、誤った結論を正しいと信じてしまうこともある。
AIでも同様だ。基本的な知識は存在する前提だが、推論を行う結論を導くための参照情報を限定することで、誤った答えを導き出さないようにすることが可能だ。
既にAIの活用方法として定着していると思うが、ほとんどのAIチャットでは資料を添付することが可能だ。実はこの点が最も大きなポイントだ。
検索したいテーマに関して、関連する資料を複数アップロードすることにより、その複数の文書を付き合わせた上で、より確かな回答をその文章から引き出すことが可能になる。
この時アップロードする文章は、言語には依存しない。英語の資料や中国語の資料を入手し、それらをアップロードすることによって、日本で出回っている資料と突き合わせた上で回答を得ることができる。
特定の言語に依存しない事は、日本語というグローバルではマイノリティの言語に縛られがちな日本国民にとってはAIを用いる大きなモチベーションになるはずだ。
筆者の場合であれば、記者会見で配布された資料や、評価を行う製品のホワイトペーパー、質疑応答、資料等、文書で表現できるあらゆるものをアップロードする。サービスによっては、アップロードできる文書の数が制限されている場合もあるが、可能な限りアップロードすると良いだろう。
関連リンク
・ホワイトペーパーの意味とは?作り方の手順やダウンロードを促す方法も徹底解説
・ホワイトペーパー・ダウンロード資料作成ハック
そしてプロンプトで、添付した資料に閉じた情報の範囲内で、レポートを書かせれば、事前学習による偏りの影響や、そもそものハルシネーションの影響を最小限に食い止める事は可能だ。
では、具体的な事例を紹介しよう。やや説明が長くなるが、以下は筆者が実際に使った事例。ぜひ参考にしてほしい。
進化したAIボイスレコーダー
筆者は9月初旬に行われたアップルの新製品発表会に参加した。iPhoneを中心とした年間でも最も大きな発表会であり、実にさまざまなニュースがリリースされる。このときの音声データをPLAUD NOTEというAIサービスと連動するボイスレコーダーで録音しておいた。
このボイスレコーダーは、Open AIのWhisperという音声認識AIを活用しており、59カ国語をかなり高い精度で認識できる。今回のアップルの発表会では英語の会話を認識させているが、英語は話者が多いこともあり、かなり高い精度だ。
しかし、AIの時代において、音声認識の正しさはもちろん高いに越した事は無いものの、絶対的な指標とはなりえない。なぜなら、認識が多少間違えていたとしても、AIが前後の関係から補正をしながら、その後の分析を行ってくれるからだ。
PLAUD NOTEはスマホアプリではなく独立した録音装置なので、スマートフォンを占有されてしまうことがない。上の写真のように専用ケースでスマホの背面につなげておくことができる。マルチマイクを用いて、ノイズキャンセリング機能がハードウェアで実装された薄型のデバイスは、64 GBのフラッシュメモリーを持つこともあって、ほぼ無限に近い形で、大量の音声データを記録することができる。
ここで録音したデータは、専用のアプリによってBluetoothもしくはWi-Fiでスマートフォンへと転送。その音声データを自動的に音声認識AIで文字に変換してくれる。それだけではなく、プロンプトを通じてその内容を要約するところまで自動で行う。
関連記事:アップルがネットで大炎上、巨大プレス機の「Crush動画」は何が問題だったのか
キーワードを抽出できる
PLAUD NOTEは本体2万7500円。本体を購入すれば、毎月300分の書き起こしが可能だ。
音声認識時には話者分離(誰が何を話したか自動的に識別、整理する機能)を行った上でどのような議論があったかを要約して、見せてくれる。
これによって、録音された内容の核心部分の話題についてはパッと見ただけで識別できるようになる。
さらに、キーワードを抽出することで、会議や講義の中から重要なキーワードを忘れずにタグづけしてくれることさえやってくれる。
長い会議においては、延々と同じテーマについての話を繰り返すことが多い。参加者がそれぞれの角度から話をするものの結局は同じことを言っている、という冗長さは、多くの会議で存在しているだろう。
しかし、どのような冗長な会議であったとしても、その要点を自動的にまとめてくれれば、その内容をより深く考察する必要があるかどうかを判断する基準にはなる。AIに要点を抜き書きしてもらうことで新しい気づきを得ることもできる
この製品のAI要約機能は、以前はどのような会話なのかを自分で指定する形式であったが、最近のアップデートで自動識別の機能が追加された。これは会話の内容や長さに応じて、出力する要約を自動的に調整してくれる機能で、特定のプロンプトによって決まりきったパターンの要約を作るのではなく、場合によってかゆいところに手が届くような要約をしてくれる。
ただし、省略しすぎることによって、本質的に指摘するはずだった問題や、全体のストーリーを損ねていることが多いのは、現在のAIの弱点、あるいは限界であろう。しかし、人間が使いこなすのであれば、そこは別の探索方法がある。
筆者の場合、どの情報が役立つかを判別した上で、その文字起こし全体の文章を契約しているAIサービスに入力した上で、質問を行うようにしている。
プロンプトを練り込む
今回のこの記事は、スクラッチから筆者が書いているものだが、製品発表会のレポートや技術的なレポートをもとにした、あるいは研究成果を手元にした記事を書く場合には、AIを積極的に使っている。
理由は資料を添付し、その資料に書かれている情報をもとにさせることにより、正確に製品名やサービスの名称、あるいはスペックなどについて正しい表記を期待できるからだ。
AIは嘘をつくはずなのに、正しい表記を期待できるというのは皮肉な表現だと思うかもしれないが、AIは正しい情報を資料として添付し、その資料の中に限って、探索範囲を狭めた上で回答を要求すると正しい答えを出す。
残りの問題は、レポート分として充分に説得力のある文章にできるかどうかにかかっている。この点については、プロンプトの書き方によって大きく依存する。
アップルの発表会に話を戻そう。このイベントの模様をPLAUD NOTEで録音した上で、音声認識をかけて英語の要約を作らせた。シンプルにまとめられているので、その内容に関しては英語力がそれほど高くなくても把握可能だ。要約が的確で短いからである。
その上でレポートを書かせるためには、もうひと工夫が必要だ。
アップルの発表会の例で言えば、発表会全体の録音を文字起こしした文書データに加えて、アップルが発表した一連のニュースリリースを資料としてアップロード。筆者はプレスのため詳細なホワイトペーパーを入手することもできるため、それもアップロードする。
その上で、用いたのがAnthropicが開発した最新生成AIモデル「Claude 3.5 Sonnet」だ。この生成AIモデルは日本語処理に強いからだ。
次のようにプロンプトを入れた。
「添付した資料を日本語でレポートせよ。文体は常体。新製品の発表イベントの録音であり、そこで語られた内容を分類し、それぞれのテーマについて深掘りした上で、添付資料を逸脱しない範囲で深く掘り下げ、語られている情報の全てを省略することなく書け」
その結果は以下の通りだ。完璧ではないが、事実関係を確認する上では必要十分な結果が得られた。
これがAIがまとめたレポート
Apple 新製品発表会 2024年9月 詳細レポート
1. 開会の辞
Tim Cook CEOは、Apple Watch、AirPods、iPhoneが私たちの生活に与える深い影響力について強調した。これらの製品がハードウェア、ソフトウェア、サービスを高度に統合することで、単なるガジェット以上の存在になっていることを示唆している。
特筆すべきは、6月に発表されたApple Intelligenceへの言及だ。これは、Appleが人工知能と機械学習の分野でさらなる飛躍を遂げようとしていることを示している。Apple Intelligenceが今回発表された製品群にどのように組み込まれ、ユーザー体験をどう向上させるのかが注目ポイントとなる。
2. Apple Watch
Apple Watch Series 10
Jeff氏による発表は、Apple Watchの大幅な進化を示すものだった。主要な改善点は以下の通り:
1. ディスプレイ技術:
2. 30%大きくなった画面は、情報表示の改善だけでなく、操作性の向上にもつながる。
3. ワイドアングルOLEDの採用により、斜めからの視認性が大幅に向上。これは実際の使用シーンを考慮した改良と言える。
4. デザインと素材:
5. 9.7mmという薄さは、装着感の向上につながる重要な進化。
6. 新しいアルミニウム仕上げとチタニウムモデルの追加は、ユーザーの選択肢を広げるだけでなく、高級感も演出している。
7. 機能面の進化:
8. スピーカーからの直接メディア再生は、AirPodsを持ち歩かないシーンでの利便性を高める。
9. 充電速度の向上は、日常的な使用において大きなメリットとなる。
これらの改良点は、Apple Watchが単なる時計やフィットネストラッカーから、より多機能なウェアラブルデバイスへと進化していることを示している。
Apple Watch Ultra 2
Stan氏の発表は、Apple Watch Ultra 2がより専門的なユーザーや過酷な環境下での使用を想定していることを明確に示した。
1. スポーツ機能の強化:
2. ランニング、サイクリング、水泳など、各種スポーツに特化した機能の充実は、プロアスリートやアマチュアスポーツ愛好家にとって魅力的。
3. 自動トラック検出やパワーメーター連携など、より高度な機能の追加は、Apple Watchがスポーツウォッチとして本格的に競合できることを示している。
4. アウトドア機能:
5. オフラインマップやターンバイターン方向案内の追加は、ハイカーやアウトドア愛好家にとって非常に有用。
6. これらの機能は、スマートフォンの代替としてのApple Watchの可能性を広げている。
7. デザインの進化:
8. サテンブラック仕上げの追加は、よりプロフェッショナルな印象を与える。
9. チタニウムミラネーゼループバンドは、耐久性と高級感を両立させている。
Apple Watch Ultra 2は、より過酷な環境や専門的な用途に対応することで、Apple Watchのラインナップを幅広いユーザー層に訴求できるものにしている。
3. AirPods
Kate氏の発表は、AirPodsラインナップ全体の大幅な進化を示すものだった。
AirPods 4
1. デザインと快適性:
2. 新しいデザインは、より多くのユーザーに適合することを目指している。これは、長時間の装着を想定した改良と言える。
3. 音質の向上:
4. H2チップの採用により、音質が大幅に向上。これは、AirPodsが単なる便利なイヤホンから、高音質オーディオデバイスへと進化していることを示している。
5. インテリジェント機能:
6. 機械学習を活用した通話品質の向上は、AirPodsがコミュニケーションツールとしても進化していることを示す。
7. パーソナライズされたSpatial Audioは、よりイマーシブな音楽体験を提供。
8. 高度なモデルの追加:
9. アクティブノイズキャンセリングやトランスペアレンシーモードの追加は、より高度な音響体験を求めるユーザーにも対応。
10. アダプティブオーディオや会話認識機能は、日常生活での使いやすさを大幅に向上させる。
AirPods Max
AirPods Maxの更新は比較的小規模だが、重要な改善点がある:
1. USB-C対応:
2. これは、Appleのエコシステム全体がUSB-Cに移行していることを示す重要な一歩。
3. 新色の追加:
4. ユーザーの好みに合わせた選択肢を提供し、ファッションアイテムとしての側面も強化。
5. ソフトウェア面での進化:
6. iOS 18でのパーソナライズされたSpatial Audio対応は、ハードウェアの変更なしに体験を向上させる好例。
AirPods Pro 2
Sumbul氏の発表は、AirPods Pro 2が単なるイヤホンを超えて、健康機器としての側面を強化していることを示している:
1. 聴覚保護機能:
2. 日常的な騒音による聴力への影響を軽減する機能は、ユーザーの長期的な健康を考慮した重要な追加。
3. 聴力検査機能:
4. 臨床的に検証された聴力検査機能の追加は、AirPodsが健康管理デバイスとしての役割を担い始めていることを示す。
5. FDA認可の補聴器機能:
6. これは画期的な機能追加で、AirPods Pro 2が医療機器としての役割も果たせることを意味する。
7. この機能は、聴力に問題を抱える多くの人々にとって、よりアクセスしやすい解決策となる可能性がある。
これらの機能追加は、AppleがAirPodsを通じてヘルスケア市場に本格的に参入しようとしていることを示唆している。
4. iPhone 16
Cayenne氏の発表は、iPhone 16が多くの面で進化を遂げたことを示している:
1. 素材とデザイン:
2. 航空宇宙グレードのアルミニウムの使用と85%のリサイクル素材の採用は、Appleの環境への配慮を示すとともに、製品の高品質さを強調している。
3. 新色の追加は、ユーザーの個性を表現する選択肢を増やしている。
4. ディスプレイ技術:
5. 2つのサイズ展開は、異なるニーズを持つユーザーに対応。
6. 新機能:
7. カスタマイズ可能なアクションボタンとカメラコントロールの追加は、ユーザーインターフェースの革新を示している。
8. これらの機能は、iPhoneの操作性を大幅に向上させる可能性がある。
9. カメラ技術:
10. 48メガピクセルフュージョンカメラの採用は、写真撮影の質を大きく向上させる。
11. マクロ撮影対応と空間キャプチャー機能の追加は、iPhoneのカメラ機能をより多目的なものにしている。
12. パフォーマンス:
13. A18チップの搭載は、より高度な処理能力と効率性を示唆している。
14. バッテリー寿命の大幅な向上は、日常的な使用においてユーザーに大きなメリットをもたらす。
これらの改良点は、iPhone 16がハードウェアとソフトウェアの両面で大きく進化したことを示している。特に、Apple Intelligenceとの統合がどのような新しい体験をもたらすかが注目ポイントとなる。
5. iPhone 16 Pro
Joss氏の発表は、iPhone 16 Proがプロフェッショナル向けモデルとしてさらなる進化を遂げたことを示している:
1. ディスプレイ:
2. より大きなディスプレイサイズは、生産性向上やコンテンツ消費体験の改善につながる。
3. 素材:
4. グレード5チタニウムの使用は、耐久性と軽量性の両立を示す。
5. 4つの新しい仕上げは、より高級感のある外観を提供。
6. パフォーマンス:
7. A18 Proチップの採用は、より高度な処理能力を示唆。特にAI処理や複雑なタスクの実行において大きな進歩が期待される。
8. カメラシステム:
9. 3つの新しいカメラの導入は、写真撮影能力の大幅な向上を示す。
10. 48メガピクセルフュージョンカメラと48メガピクセル超広角カメラの組み合わせは、より詳細で高品質な画像キャプチャを可能にする。
11. 5倍光学ズームのテレフォトカメラは、より遠距離からの撮影能力を向上させる。
12. ビデオ機能:
13. 4K 120fpsビデオ撮影対応は、プロフェッショナルレベルの動画制作を可能にする。
14. スタジオ品質のマイク4基搭載と空間オーディオキャプチャー機能は、音声録音の品質を大幅に向上させる。
15. オーディオ編集:
16. 新しいオーディオミックス機能は、高度な音声編集を可能にし、iPhone 16 Proを音楽制作や動画編集のツールとしても使えることを示唆している。
これらの機能は、iPhone 16 Proがプロフェッショナルユーザーや高度な機能を求めるユーザーにとって、より魅力的な選択肢となることを示している。特に、カメラとオーディオ機能の進化は、クリエイティブプロフェッショナルにとって大きな意味を持つ。
6. 価格と発売日
各製品の価格設定は以下の通りです:
– Apple Watch Series 10: 399ドルから
– Apple Watch Ultra 2: 799ドルから
– AirPods 4: 129ドルから
– AirPods 4(アクティブノイズキャンセリング搭載): 179ドル
– AirPods Max: 549ドル(変更なし)
– iPhone 16: 価格は発表されていません
– iPhone 16 Pro: 999ドルから
これらの価格設定は、各製品の位置づけを反映しています:
– Apple Watch Series 10とUltra 2の400ドルの価格差は、Ultra 2の高度な機能と耐久性を反映しています。
– AirPodsの価格帯(129ドルから549ドル)は、異なるニーズと予算に対応しています。
– iPhone 16 Proの999ドルからという価格は、その高度な機能とプロフェッショナル向けの位置づけを示しています。
全モデルは9月15日(金)より予約開始、9月20日(水)より発売となります。この発売日程は、年末商戦に向けた戦略的なタイミングと言えるでしょう。
なお、iPhone 16の価格が発表されていない点は注目に値します。これは、発表会後に価格を公開する戦略か、あるいは価格設定に関する最終決定が発表会時点でまだなされていなかった可能性があります。
7. 閉会の辞
Tim Cook CEOの閉会の辞は、今回発表された製品群が単なる技術的進歩ではなく、ユーザーの生活に実質的な影響を与えるものであることを強調している。Apple Intelligenceの統合や健康機能の強化など、Appleが技術を通じて人々の生活をより豊かにするという長期的なビジョンを持っていることが伺える。
今回の発表会は、Appleが単なるテクノロジーカンパニーではなく、ユーザーの生活全体を考慮したソリューションプロバイダーとしての立場を強化していることを示している。特に、健康管理や生産性向上、創造性の支援など、多岐にわたる分野でAppleの製品がより深く統合されていく方向性が見て取れる。
今後は、これらの新製品がどのように市場に受け入れられ、実際のユーザー体験がどのようなものになるかが注目される。特に、Apple Intelligenceの実用性や、AirPods Pro 2の健康機能の効果などは、長期的な評価が必要となるだろう。
90分のイベントの内容がこの長さにまとまる。しっかりとポイントを押さえていることがわかるのではないだろうか。
単純作業をAIにまかせよう
もちろん、このように出力された文章をそのまま原稿に使うことはできない。原稿執筆にAIを活用する場合は、全体のストーリーの骨子を作り、それをプロンプトの中に加えた上で、文章を書き出すことを依頼する。また、文字数も指定した上で、全体のバランスを指示することもある。例えば、背景としての価格に関する情報や、市場環境に関しての情報をより多く書いてほしい場合は、そのように指示をしておく。
何度か繰り返した上で、納得の良いバランスになってきた段階で、出力された文章に対して、より深みのあるストーリーや情報を加え、場合によっては論旨展開を逆転させたり、別の事例などを書き加えることによって、深みを出していく。
そして導入部によりエモーショナルなストーリーを加える事はもちろん、最終的な結論に関しても”自分の意見”に書き換えて程度に手を入れて最終原稿とする。
「原稿を書くことは自分の仕事ではない」という声が聞こえてきそうだ。確かに、筆者のような使い方をする人は、決して多数派ではないだろう。
しかし、似たような使い方は世の中にありふれているのではないだろうか。
たとえば営業戦略会議の中で、顧客のニーズや要望について議論しているとしよう。AIはそのテーマを自動的に抽出しカテゴリー分類してくれる。もし価格や納期に関するキーになる議論があれば、それも重要度の高い項目としてマークし、チェックボックスまで自動的に準備してくれる。
複数の話題が交錯する場合でも問題ない。話題の違いが識別され、それぞれに構造化してミーティング内容をまとめてくれるからだ。
AIの良いところは、入力する情報に決まった形式がないことだ。ある意味、雑多な情報を大量に与えることにより、人間はすぐには結びつけることができなかったとしても、AIがそれらを結びつけ、より確からしい結論として示してくれる。
示された回答が、本当に正しいかどうかは、人間自身が判断すべきことだが、そこまでの整理をしてくれることで、人間自身の誤りを減らすことが可能だと、この1年以上AIを活用してきて感じる部分である。
断片からアイデアを導き出す
もっとクリエイティブな使い方はできないだろうか。
クリエイティビティーを発揮するのは、あくまでも人間(利用者)である。AIが創造をするわけではない。しかし創造の手伝いはできる。
AIは、雑多な正規化されていない情報を読み込み、それらを結びつけて、最終的な結論を導き出すことに長けている。
そこで筆者は記事のアイデアをまだストーリーとしてまとまっていない段階に、細かく録音しておき、それらの音声データを全てアップロードした上で、全体をつなげた記事のストーリーを出力させることがある。
それが断片的なアイデアであったとしても、自動的にカテゴリー分けしてストーリー要素をまとめ、頭の中では散在していたアイデアを構造化してくれる。この作業によって、記事の骨格が見えてくることもある。かつては編集者や友人との会話の中で導き出していたようなアイデアを、AIから得ることができるのだ。
「添付した複数の情報を参照した上で、次の骨子ですべての情報を網羅したストーリーを再構築してほしい」といったプロンプトを書き、ストーリー展開のインデックスを指定する。これによって得られたアウトプットをそのままで使えるわけではないが、原稿や企画書の元となる文章を自動的に生成してくれる。
音声データでなくても構わないが、私の場合は場所を問わず、録音デバイスに向かって、喋り続けている。
しゃべったタイミングによって表現の揺れもあれば、アイデアのブレもある。しかし、そうしたブレもAIはダメ出しをすることはない。ブレを吸収した上で、それらしいものに仕立てあげてくれる。
誤解して欲しくないのは、文字認識にしろ、こうしたアイデアの再構築にしろ、AIは必ずしも正しい答えを出しているわけではない、ということ。納得がいかないアウトプットになることもある。
しかし、それも含めた上で自分自身へのアドバイスだと捉えるならば、これほど有益なものはないと筆者は感じている。
「やるべきこと」「やりたいこと」を見つめ直そう
音声録音から文字起こし、要約までが自動化されることで、作業時間が大幅に短縮される。聞き取りミスなどによる表現の揺れも、長時間の録音の中であれば吸収できるので、後処理も効率化される。自動的にキーワードが抽出されて情報検索を助ける上、情報を記録することにエネルギーを割く必要もない。
AIを使いこなせば、そうした作業にエネルギーを使うのではなく、より創造的な思考プロセスに集中できる。録音するだけで要約や分析が行われるため、絶対的な時間も大幅に短縮できるのだ。
本来すべき事は何であるのか。あなた自身の能力を活かす上で最も重要な事は何なのか。AIは、単純に便利なツールであるだけでなく、あなたの「やるべきこと」「やりたいこと」を見つめ直す機会を与えてくれるのである。