AIチャットボットを過小評価している可能性

AIチャットボットを過小評価している可能性

2007年の春、私はスティーブ・ジョブズに指名され、iPhoneのレビューを依頼された4人のジャーナリストの1人だった。これはおそらく、テクノロジーの歴史の中で最も期待されていた製品だった。一体どんな製品になるのだろうか?デバイスの転換点となるのだろうか?今、自分のレビューを振り返ってみると、恥ずかしいことではなかったと言えることに安堵している。このデバイスの世代的な重要性を認識していたからだ。しかし、iPhoneをあれだけ称賛したにもかかわらず、ハードウェア、OS、アプリの爆発的な融合や、私たちの注意力に催眠効果をもたらすといった、その驚くべき副次効果を予測できなかった。(確かに、Appleに「外部の開発者にデバイスの新しい用途を生み出させる」よう促した。)また、UberやTikTokのようなサービスの台頭を期待すべきだと示唆したり、家族での夕食がディスプレイ中心の共同作業に変わるなどと予測したりしたわけでもない。もちろん、私の主な仕事は、当時の携帯電話としては超高額だった500ドルを払って、このクソみたいな機種を買うべきかどうかを人々が決めるのを助けることでした。しかし、今レビューを読むと、なぜ私がAT&TのネットワークやウェブブラウザがFlashコンテンツを処理できないことについて文句を言ったのか不思議に思う人もいるかもしれません。それはまるで、3階建ての津波が押し寄せようとしている時に、どんなサンダルを履くべきかで口論するようなものです。

大規模言語モデルチャットボットやAI画像ジェネレーターといった最近のAIアプリを人々が体験している様子を読むと、自分の先見の明のなさを痛感します。人々が、驚くほど高性能なAIシステムの突如として現れた一連の出来事の影響に取り憑かれるのは当然のことですが、科学者たちは、これらの急速な進歩は実際には数十年もかけて実現されてきたとしばしば指摘しています。しかし、2007年に初めてiPhoneに触れた時と同じように、MicrosoftのBingチャット、OpenAIのChatGPT、AnthropicのClaude、GoogleのBardといった製品の現行バージョンに過度に注目すると、AIが浸透した未来の潜在的な軌跡を予測できなくなる危険性があります。

この誤りは、最近人気を博している新しいメディアジャンル、「プロンプト・アンド・プロンプン」に明確に見られます。その手法は、かつては人間に限られていたタスクに挑戦し、発明者による警告を無視して、それを極端にまで押し進めていくことです。偉大なスポーツジャーナリスト、レッド・スミスはかつて、コラムを書くのは簡単だ、ただ静脈を開いて血を流すだけだ、と言いました。しかし、評論家志望者たちは今や、血を流さないバージョンを推奨しています。「ブラウザを開いてプロンプトを開くだけ」です。(注:このニュースレターは、静脈を開くという昔ながらの方法で作成されました。)

通常、「プロンプト&プロンプン」コラムでは、こうした非常に初期のシステムの一つに実際に触れ、これまで人間の領域に限られていたものをどれだけうまく代替できるかを検証します。典型的な例としては、 ニューヨーク・タイムズ紙の記者がChatGPTを使って1週間、仕事上の連絡すべてに返信しました。 ウォール・ストリート・ジャーナル紙の製品レビュアーは、AIを使って自分の声(なんと、私たちが最初にやったんです!)と外見を複製し、アルゴリズムで作られたドッペルゲンガーが人々を騙して本物と間違えさせるかどうかを検証することにしました。同様の例は数多くあります。

こうしたスタントを仕掛ける人々は、概して二つの結論に至ります。一つは、これらのモデルは素晴らしいものの、人間の能力には到底及ばないということです。メールは職場のニュアンスを捉えきれていません。クローンは不気味の谷に足を踏み入れているようなものです。そして何より、これらのテキストジェネレーターは事実を尋ねられると事実を捏造してしまいます。これは「幻覚」と呼ばれる現象であり、現在AIの悩みの種となっています。そして、今日のモデルの出力には魂の抜けた質がしばしば見られるのは明白な事実です。 

ある意味、恐ろしい。ロボット工学者ハンス・モラベックが言うように、未来の世界は欠陥だらけの「マインド・チルドレン」によって支配されるのだろうか?しかし、別の意味では、その欠点は慰めにもなる。確かに、AIは今や多くの低レベルなタスクをこなせるようになり、ディズニーランド旅行のプランやグルテンフリーのディナーパーティーのメニューを提案する能力は他に類を見ない。しかし、ボットは常に私たちの修正や文章の修正を必要とするだろう、というのが現状だ。

しかし、今週Googleが発表したAIアップデートの集中砲火を含め、これらの初期バージョンの技術に基づいて決定的な結論を導き出すのは愚かなことです。皆さん、これは幻想です。今日のチャットボットは、オリンピックレベルの進歩へと向かう道のりの、ほんの小さな一歩を踏み出したに過ぎません。非営利研究機関アレンAI研究所の元CEO、オーレン・エツィオーニ氏は今週、チャットボットは既に進化していると語りました。この傾向を牽引している要因の一つは、何百万人ものユーザー(良い記事になるような突飛なことをシステムにさせようとする記者も含む)の存在です。彼らは改善が必要な点を指摘しています。最適化を専門とするコンピューター科学者たちは、欠陥の解決に懸命に取り組んできたのです。

「幻覚はすでに大幅に減少しています」とエツィオーニ氏は言う。次の進化の波は、科学者たちがこれらのアルゴリズム型スーパー脳の質と能力をいかに向上させるかを見つけ出すにつれて訪れるだろう。「これらの生成技術の理解と構築のサイクルはまだ初期段階にあるため、近い将来、息を呑むような革新が続くと期待しています」と彼は言う。

10年後、大規模な言語モデルにビジネスコミュニケーションを任せるのは、今のベータ版を使うのとは全く違うものになるでしょう。検索、大学のエッセイ執筆、政治広告キャンペーンの実施でも同じことが言えます。言うまでもなく、ネットワークコメディの大量制作もその一つです。脚本家たちが今ストライキを起こしているのも、まさにそのためです。全米脚本家組合は、GPT-4では今 のところ『ヤング・シェルドン』の許容できるバージョンを制作できないことを理解していますが、GPT-19ならそのシリーズを面白くできるかもしれません。

これは必ずしも人類の破滅を意味するものではありません。過去の技術革新と同様に、単調な作業を自動化し、最も繊細な創造を人間に委ねるコラボレーションこそが、真の理想形となるかもしれません。技術が進歩するにつれ、私たちの新しい時代は副操縦士と自動操縦士の境界線が曖昧になるだろう。私の推測では、時間の経過とともに、ますます多くの活動が自動操縦の側に移行するだろう。2023年頃のAIは、1950年代初頭のテレビのように見えるようになるのもそう遠くないだろう。あるいは、App Storeが登場してから1年後にリリースされたiPhoneのような姿になるだろう。

エツィオーニとの電話を切る前に、AIを映画として想像してみてほしいと頼んだ。その映画では、私たちは物語のどのあたりまで進んでいるのだろうか?彼は少し考えてから答えたが、返ってきた声にはほとんど疑いがなかった。「予告編を見たばかりです」と彼は言った。「映画はまだ始まってもいないんです」

画像にはラベル、テキスト、シンボル、記号が含まれている可能性があります

タイムトラベル

iPhoneをテストしてから、ほぼ15年になります。2007年6月に Newsweek誌にレビューが掲載されました。とても気に入りました!

AppleはすでにiPhoneの最初のバージョンの改善に尽力しています。iPhoneの価値を高める最善の方法は、外部の開発者に新しい用途の開発を促すことだと思います。Appleは、新デバイス向けのWebベースのアプリケーションを歓迎すると表明しています。しかし、Google Mapsプログラムが示すように、iPhone用に開発された独立したクライアントアプリケーションは目覚ましい成果をもたらす可能性があり、Appleは今後もこうしたアプリケーションの開発を継続していくべきでしょう。

結論:ある意味、iPhoneはすでに大きな足跡を残しています。iPhoneを一度も買わなかった人でさえ、その進歩の恩恵を受けるでしょう。競合他社は既にAppleの成功を警鐘と捉え、自社製品を改良しています。しかし、数々の長所を持つiPhoneですが、依然としてリスクを伴う事業です。なぜなら、その驚きのインパクトにもかかわらず、何百万人もの人々が携帯電話の相場価格よりも数百ドル高い金額を支払う覚悟があるかどうか、そして場合によっては、現在の携帯電話契約を解約するためにさらに高い金額を支払う覚悟があるかどうかが、まだ証明されていないからです。また、誇大宣伝にうんざりした人々からの反発も考えられます。しかし、iPhoneについて話をした際、ジョブズ氏は過大な期待は気にしておらず、2008年に1000万台を販売するという自身の予測を達成できるかどうかについても、全く心配していないと述べました。「期待をはるかに上回る販売台数を達成できると考えています」

iPhoneを買うために列に並んでいる人たちは皆、たとえ友人を驚かせる喜びだけでも、その投資に見合う価値があると確信するだろう。iPhoneの機能と、それらが一体となって提供する統一された体験を高く評価するだろう。しかし将来、iPhoneがより多くのアプリケーションを搭載し、より高性能になり、価格も下がった時、購入者はさらなる価値を見出すだろう。だから、賢明な消費者はその日を待つのも当然だろう。しかしその間、地下鉄で隣に座っている人や、ホールフーズ・マーケットの列で前に並んでいる人が、ついに人間に優しいパームトップ・コミュニケーションとコンピューティングの夢を実現したスマートフォンを楽しんでいるのを、彼らはただ羨望の眼差しで眺めるしかない。

画像にはシンボルが含まれている可能性があります

一つだけ聞いてください

クリスは、「なぜメディアや AI 批評家は、大規模な言語モデルや AI 全般を作成することで生じる甚大な環境コストをもっと指摘しないのでしょうか?」と疑問を投げかけます。

こんにちは、クリス。新しいタイプのAIモデルは膨大な計算量を必要とし、それは膨大なエネルギー消費を意味することは間違いありません。このテーマに関する報道はありますが、ほとんどの記事が環境への影響ではなく技術面に焦点を当てているというのは、おっしゃる通りです。ビットコインのマイニングや飛行機の操縦に比べれば、LLMの消費エネルギーはそれほど大きくないからかもしれません。例えばある調査では、Googleが2019年にこれらのモデルのトレーニングに消費したエネルギーは、総消費量の0.005%未満だったと試算されています。これは、1つのモデルのトレーニングに消費された電力が、約100世帯分の電力供給に相当します。別の調査では、1つの大きなLLMモデルのトレーニングで626,155ポンドのCO2排出量が得られたと試算されていますこれは、自動車5台が生涯で排出する量とほぼ同等です。トレーニング済みのLLMを実行すると、消費エネルギーははるかに少なくなりますが、もちろん、何百万ものユーザーがクエリを発行すれば、サーバーは負荷がかかります。

AIが消費するエネルギーの総量を計算すると、その数字はさらに大きくなり、私たちが日常的に電力を大量に消費するアプリケーションを使用するようになると、さらに増加するでしょう。現在、Googleのデータセンターのエネルギーの推定15%はAI活動によるもので、これはアトランタ市の年間電力消費量に相当します。この状況をある程度緩和しているのは、GoogleやMicrosoftなどの大企業がデータセンターのエネルギー消費を最小限に抑えるために多大な努力を払っているという事実です。Googleは2030年までにすべての施設とデータセンターをカーボンニュートラルにすることを目指しています。しかし、ChatGPT、Bard、Bingは数百万人のユーザーとチャットするだけで合計で何トンもの電力を消費しており、これは避けられません。とはいえ、AIの究極の評価基準は、私たちの働き方、学び方、そして娯楽への影響によって決まると私は考えています。

ご質問は[email protected]までお送りください。件名に「ASK LEVY」とご記入ください。

AIチャットボットを過小評価しているかもしれない

終末クロニクル

テキサス州は、急成長を遂げているクリーンエネルギー事業を潰そうとしている。願わくば、AR-15ではなく、もっと早くに。

画像にはラベル、テキスト、シンボル、記号が含まれている可能性があります

最後になりましたが、重要なことです

生成型 AI の将来に関するバラ色の見方の 1 つは、幻覚を防ぐために作成者によって制限されているため、ボットが退屈になる可能性があるというものです。 

GoogleがI/Oカンファレンスで発表した内容をすべてご紹介します。予想通り、AI関連の発表が目白押しです。

リアリティ番組は新しいプロザックなのか? まあ、WIREDのライターにとっては救世主だったが。

海からプラスチックをすくい上げるのは良いアイデアのように思えます。しかし、一部の海洋生物はそれに異論を唱えるかもしれません。

画像にはロゴ、シンボル、商標、テキスト、ラベルが含まれている場合があります