Apple Intelligenceは何億台ものiPhoneでは動作しないだろうが、もしかしたら動作するかもしれない

Apple Intelligenceは何億台ものiPhoneでは動作しないだろうが、もしかしたら動作するかもしれない

古いiPhoneならAppleのAIに対応できるかもしれないのに、なぜ900ドルもする古いモデルでは対応できないのでしょうか?その理由はこうです。

カラフルな人工脳を表示するiPhone

写真イラスト: キャメロン・ゲッティ、ゲッティイメージズ

WIREDに掲載されているすべての製品は、編集者が独自に選定したものです。ただし、小売店やリンクを経由した製品購入から報酬を受け取る場合があります。詳細はこちらをご覧ください。

Appleが次世代を発表しました。iPhone、Mac、iPadの使用体験は、人工知能(AI)によって導かれ、AIで満たされるでしょう。Appleはこれをもちろん「Apple Intelligence」と呼んでいます。今年後半に登場予定です。そう、私たちは新たな「AI」と対峙することになるのです。

Siri をより賢くしたり、メールやエッセイを書き換えたり、これまでに見たことのない絵文字を作成したり、ラフスケッチを当たり障りのない AI アートに変換したりする方法について、あなたはたくさん聞いたことがあるかもしれません。

まさに未来のビジョンと言えるでしょう。画期的ではないものの、Appleらしい洗練された外観のおかげで、これまでで最も使いやすく、直感的で、そして便利な生成AIの実装の一つと言えるでしょう

しかし、私たちのほとんどにとっての切迫した要因は、招待されていないということであり、iPhone は Apple のデバイスの中でその影響が最も大きいのです。

Apple Intelligenceを使用するには、iPhone 15 ProまたはiPhone 15 Pro Maxが必要です。通常のiPhone 15では対応していません。つまり、発売から1年未満のモバイルは、少なくともこの意味では時代遅れとみなされます。Macユーザーは、Apple Silicon搭載のコンピューター、つまり2020年以降に発売されたモデルが必要です。

立ち入り禁止区域

より皮肉な見方をすれば、これらの除外期間は、携帯電話やノートパソコンの平均的な買い替えサイクルと結びついていると言えるでしょう。毎年携帯電話を買い替える人は普通だと見なされるかもしれませんが、毎年ノートパソコンを買い替える人は、おそらく愚か者か、盗難に遭いやすいか、あるいは単に不器用な人でしょう。

現実ははるかに複雑です。Apple Intelligenceの少なくとも一部の部分に必要な計算は、平均的なiPhoneやMacのタスクとは全く異なります。

そして、これまでのところ、生成AIやチャットボットに手を出した平均的な人にとっては、このすべてが分かりにくくなっていました。なぜなら、私たち全員がこの形式に慣れ親しんできた方法のせいで。ChatGPT、Midjourney、あるいはAdobe PhotoshopのGenerative Fill機能を使うときでさえ、自分のコンピューターは実際の作業をほとんど行っていないからです。

これはリモートクラウドサーバー上で行われ、必要な計算が行われた後、最終結果がスマートフォンやノートパソコンに送信されます。この意味で、これまでの生成AIは、SiriやAlexaのようなデジタルアシスタントのようなものでした。時には素晴らしいことをしてくれることもありますが、実際にデバイス上で行われていることはほとんどありません。

Apple Intelligence は、少なくとも部分的には、この状況を変えようと試みるだろう。

Appleのお馴染みのプライバシー戦略

なぜでしょうか?「自分の生活の詳細をすべて誰かのAIクラウドに保管・分析してもらうために、わざわざ引き渡さなければならないべきではないのです」と、Appleのソフトウェアエンジニアリング担当上級副社長クレイグ・フェデリギ氏は、新機能の発表時に述べました。

「パーソナルインテリジェンスシステムの基盤は、デバイス上での処理です。iPhone、iPad、Mac、そしてアプリ全体に深く統合することで、個人情報を収集することなく、個人データを認識できます。」

デバイス上でのAI処理はプライバシー保護を目的とした、Appleの典型的な戦略です。しかし、この動きはAppleが初めてではありません。Microsoftが初めてです。同社のCopilot+規格は同様のコンセプトですが、あくまでノートパソコン向けに設計されています。Copilot+ノートパソコンは、デバイス上でのAI処理を可能にするために設計された専用のAIハードウェアを搭載しています。両社は、ChatGPTの開発元であるOpenAIが開発した、同じコア人工知能に大きく依存しています。

すると、まったく当然の疑問が湧いてくる。一体なぜ、900 ドルもする iPhone 15 ではこんなことができないのだろうか?

神経思考

NPUとは、今注目を集めている技術で、従来の「非AI」ハードウェアと、私たちの財布が震えるほど待ち望んでいるであろう新しいハードウェアを区別するものです。「ニューラル・プロセッシング・ユニット(Neural Processing Unit)」の略です。

最新のスマートフォンやタブレットには、CPU(中央処理装置)とGPU(グラフィック処理装置)に加えて、これらのいずれかが搭載されています。GPUは膨大な処理を同時に実行することに特化しており、スマートフォンやノートパソコンでは、最小限の電力で処理を実行することが重要です。

生成 AI がインターネットや社会全体に、控えめに言っても「もの」と呼べるものを撒き散らしたように、そのものの作成にも幅広く浅い種類の作業が必要です。

もう少し技術的な話に移りたい方のために説明すると、NPUは行列操作に優れています。これは、チャットボットLLMやその他の生成AIを支える中核的な作業形態です。いずれの場合も、AIはプロンプトから開始し、行列操作を通じて徐々に最終結果(画像や散文など)へと近づいていきます。

NPUを超えて

事件は解決?今や私たちはNPUの世界に生きているのでしょうか?確かにそうですが、少なくとも2017年からはそうでした。Appleは2017年にApple ANE(Apple Neural Engine)を導入し、iPhone 8、iPhone 8 Plus、iPhone Xに搭載されています。これがNPUです。

AIが今日のように流行語になる何年も前、当時はそれが必要だった。なぜなら、Appleは実際に何年も前からiOSでAIと機械学習の形式を使用してきたからだ。

Appleの「インテリジェンス」もそれほど大きな違いはないのかもしれない。ただ、機能が強化されているだけかもしれない。そしてソフトウェア業界では、こうした新しい「AI」機能の一部が、新しいハードウェアの裏で人為的に制限され、有料化されていることが既に証明されている。

オンラインで「Albacore」という名で活動する趣味のソフトウェア歴史家が、MicrosoftのCopilot+の機能の一部を、理論上は動作しないはずのハードウェア、つまり安価なSamsung Galaxy Book2 Goノートパソコンで動作させることに成功しました。価格はCopilot+ノートパソコンの5分の1から4分の1です。

「Recall を動作させるのは、まあまあ大変だったと思います。私は10年近く Windows のビットをリバースエンジニアリングしてきたので、チェック項目や制限事項を追跡するのは、私にとってはほぼ天性のことです」とアルバコア氏は WIRED に語った。

どのように動作するのでしょうか?「機能を保護するものを追跡し、実際の要件に関わらず常に正常に動作するようにチェックを変更する計画を立て、それを便利なインストーラーにラップします。その後、いくつかのテストとエッジケースの調査を経て、アプリは完成しました」とAlbacore氏は言います。

これを自分で動作させる方法については、Tom's Hardware の記事をお読みください。

「Recall は、古くて性能の低いハードウェアでも問題なく動作すると思います。遅延が感じられるのは、タイムライン全体の検索時だけです」と Albacore 氏は言います。

Recallは、Microsoftの新しいAI機能の中で最も物議を醸し、注目を集めている機能です。新バージョンのSiriと同様に、過去の行動、閲覧履歴、メールにアクセスすることで、Windowsのユニバーサル検索を全知全能のPAに近いものにします。

Samsung Galaxy Book2 Go でうまく動作しない部分は、ペイント アプリの Cocreator です。これは、Apple Intelligence の多くの画像生成機能に相当する Microsoft の生成機能です。

「画像生成プロセスが起動して大量のリソースを消費しているのが分かりますが、残念ながら最終的にはクラッシュしてしまいます。おそらく、同じくらい古いチップでもRAMをもっと多く搭載していればもっと良い結果が得られるかもしれませんが、今はそれが手元にありません」とアルバコア氏は言う。

記憶を作る

RAM:最近のiPhoneは、Apple IntelligenceをサポートするMacBookと同等のAIと機械学習のパワーを備えているにもかかわらず、Apple Intelligenceをサポートしていないのは、これが原因かもしれません。Geekbenchベンチマークツールによると、iPhone 14はM1 MacBookよりも強力なNPU AIチップセットを搭載しています。

しかし、これらの古いスマートフォンのRAMは6GBしかありません。Apple Intelligenceのゲストリストに掲載されているiPhoneはすべて8GBのRAMを搭載しています。

なぜRAMが重要なのでしょうか?AIモデルをクラウドではなくローカルで実行する場合、RAMまたはグラフィックカードに相当するvRAMに保存する必要があります。最速のSSDドライブでさえ、この処理には到底不十分です。

PlayStation 5の5,000MB/秒のSSDと、ゲーム開発者がストレージからビジュアルアセットをリアルタイムでストリーミングできるという点が大きな注目を集めました。一般的なPCのDDR5 RAMの帯域幅は最大64GB/秒ですが、機械学習とAI向けに開発されたNVIDIAの最速のグラフィックカードであるH200は、4.8TB/秒の帯域幅を誇ります。これはPS5のSSDの転送速度の約1,000倍に相当します。

Nvidia H200とその前身モデルは、iPhone 16のオフラインAI機能への期待を再び現実のものとする便利な背景情報も提供している。これらのグラフィックカードは、ChatGPTやStable Diffusionといった、私たちが普段何気なく使っているようなリクエストに必要なクラウドAIコンピューティングを実行するサーバーを支えている。1枚あたり最大141GBのvRAMを搭載し、1枚あたり数万ドルもする。最新のGPT-4バックエンドインテリジェンスを搭載するには、これらのカードを複数枚用意する必要がある。合計で数百GBのvRAMが必要となるのだ。

ここでは消費者向けテクノロジーとは全く関係ありません。

消費者向けグレードの Nvidia RTX ゲーミング カードでも、この新しい AI 向けに作られたとされるハードウェアよりも、ほとんどの AI タスクにはるかに適しています。

「GeForce RTX GPUは、最高のAI体験を求めるAI PCユーザーに最適です」と、NVIDIAのPC AI担当ディレクター、ジェシー・クレイトン氏は述べています。「GeForce RTX GPUは、最大1,300TOPSという最速のAIパフォーマンスと、最も成熟したAIソフトウェアスタックを提供し、500以上のAI対応アプリケーションとゲームを高速化します。」

参考までに、Microsoft Copilot+ PC のベンチマークはわずか 45 TOPS (1 秒あたり数兆回の演算) でした。

地球へ戻る

iPhone 15 Pro Maxは2~4GBのRAMを搭載でき、NPUの性能は35TOPSです。Apple Intelligenceがオフラインで利用できる機能は、小規模で比較的シンプルなAIモデルに基づくものになるでしょう。

Apple の Web サイトによれば、写真の共有提案、思い出、シーン認識は、Siri の提案、音声認識、文字起こしと同様に「デバイス上」で行われるとのことです。

少し論理的に考えれば、人々を興奮させ、子供たちがかつて夢見ていた仕事をすべて奪うために準備されたすべての生成AIは、iPhone 15 Pro Maxでローカルに実行できないことがわかります。あるいは、iPhone 16 Pro Maxでも同じです。

そして、残っている機能は、他のスマートフォンにすでに搭載されている機能や、Albacore が NPU フリーの控えめなハードウェアで動作させることに成功した機能に非常によく似ているように見えます。

次の疑問は、iPhone 16がApple Intelligenceの機能をフルに搭載するかどうか、それとも次世代でもProシリーズのアップセルとして使用され続けるかどうかだ。

最初のApple Intelligence機能は、今年後半にiPhone 16と同時に9月にリリースされる予定のiOS 18の一般公開で利用可能になる予定だ。その時にわかるだろう。