大規模言語モデル(略して「AI」と呼ばれることが多い)がコンピューティングの未来であるかどうか、正直なところ私には確信が持てません。しかし、今後数年間、人々がこのテクノロジーをチャットボットで利用するようになるとも思えません。
開発者 Joseph Humfrey によるインディー Mac アプリケーションである Substage は、潜在的な代替手段、つまり今すぐに役立つ可能性を示すシンプルなアプリです。
このアプリケーションはすべてのFinderウィンドウの下にフローティング表示されるため、macOSでファイルを閲覧しているときだけ表示されます。英語の文章を入力すると、ファイル名の変更、変換、圧縮などの操作が行えます。このアプリケーションは大規模言語モデルを使用して、ターミナルで実行できるようなコマンドを作成します。そして、そのコマンドを表示し、実際に実行するかどうかを尋ねます。

サブステージの動作。
ジャスティン・ポット提供数日間、このアプリをいろいろ試してみました。動画をハイライトして、音声だけを残してMP3に変換するように指示したら、うまくいきました。写真がいっぱい詰まったフォルダを開いて、すべての写真をPNGに変換するように指示したら、これもうまくいきました。個人的な日記を保存しているフォルダを開いて、パンケーキについて言及しているすべてのエントリをzipファイルにまとめるように指示したら、1つのファイル(どうやら137件)ができました。
これは少し魔法のように感じるかもしれませんが、注意点があります。アプリケーションを効果的に使用するには、コマンド ラインで何ができて、何ができないかについて基本的な理解が必要です。
「強力なツールをより使いやすくし、コマンドラインのパワーを非技術系ユーザーに届けることが目標でした」とハンフリー氏は語る。「しかし、私が気づいたのは、コマンドラインの真価が発揮されるのは、技術系ではないユーザー、つまり何ができるか大まかにしか理解していないものの、スピードアップを重視するユーザーだということでした。」
この記事を読んでいるあなたは、おそらくそうでしょう。もしかしたら、ちょっとしたGoogle検索やオンラインドキュメントの閲覧後に、コマンドラインを使って何かを実行することもあるかもしれません。Substageを使えば、そんな手間はかかりません。必要なコマンドを入力するだけで、そのコマンドがあれば、おそらくすぐに実行できます。

生成されたコマンドを実行する前に、コマンド ラインに関する経験を積んでおくことをお勧めします。
ジャスティン・ポット提供どれもリスクがないわけではありません。大規模な言語モデルは間違いを起こす可能性があるため、アプリケーションは実行前にコマンドを表示します。これは、コマンドラインの経験がないユーザーにこのアプリケーションを推奨しにくい理由の一つです。生成されたコマンドによってファイルが削除されるなど、深刻な事態が発生する可能性がありますが、私はそのような問題に遭遇しませんでした。実行する際にコマンドを再確認し、開始前にファイルをバックアップしておくことをお勧めします。
他にもいくつか制限があります。ChatGPTやより高度なモデルとは異なり、Substageのボットにはメモリ機能がないため、現在生成中のコマンド内で以前のコマンドを参照することはできません。また、動画や写真の内容も認識できないため、「猫の写真をすべて新しいフォルダに保存する」といった操作もできません。
一方、ハンフリー氏は、このアプリケーションの最も好きな用途はメディア変換だと述べています。
「After Effectsの使い方は知っていますが、『この16:9の動画を16:10にトリミングして』と言えば済む方がずっと簡単です」と彼は述べ、このアプリケーションはマニュアルを暗記する必要もなく、ffmpegの柔軟性を提供していると付け加えた。これは魅力的なユースケースであり、大規模言語モデルが成熟するにつれて、より多くのアプリケーションで活用されるようになるだろうと想像している。
Substageは2週間のトライアルを提供しています。その後は月額4ドルでご利用いただけます。また、ローカルマシンで独自の大規模言語モデルを実行している場合、または常用しているAIモデルのAPIキーを既にお持ちの場合は、30ドルの1回限りの料金でご利用いただけます。