WIREDに掲載されているすべての製品は、編集者が独自に選定したものです。ただし、小売店やリンクを経由した製品購入から報酬を受け取る場合があります。詳細はこちらをご覧ください。
先日の金曜日、午後3時13分発のサンノゼ発の電車の中で、私は眉をひそめながらMacBookにかがみ込んでいた。数百マイル北にあるオレゴン州にあるGoogleデータセンターで、仮想コンピューターが起動した。間もなく、Linuxコマンドラインの黒い画面が目に飛び込んできた。これが私の新しいAIアートスタジオだった。
数時間のグーグル検索、コマンドの誤入力、そして悪態のつぶやきの後、私は不気味な肖像画を次々と作り上げていた。
コンピューターの扱いは「得意」と思われているかもしれませんが、コーディングは得意ではありません。Codecademyの初心者向けオンラインJavaScriptコースを落第してしまったのです。ビジュアルアートは好きですが、自分で創作する才能はあまりありませんでした。AIアートの世界へ足を踏み入れたのは、コマンドラインの基本的な知識と、最近19歳のロビー・バラットとの出会いがきっかけでした。
バラット氏もプログラミングの正式な資格は持っていませんが、優れたAIアーティストとして活躍し、GitHubでコードやアイデアを共有しています。WIRED 12月号で独学のAIエキスパートについて執筆する中でバラット氏と話をした際に、パリのアート集団「Obvious」が彼のレシピとコードを使って作品を制作し、クリスティーズで43万2500ドルで落札されたことを知り、私も試してみることにしました。
バラット氏は、人工ニューラルネットワークを用いてアート作品を制作しています。これは、自動運転車や自動がん検出といったプロジェクトを可能にし、近年のAIブームの火付け役となった数学の網です。ニューラルネットワークは、写真などの大量のサンプルデータを処理することで、有用または芸術的な動作を学習することができます。バラット氏は、巨大な美術百科事典であるWikiArtから収集した画像を使って画像生成ネットワークを学習するためのコードと手順を提供してくれたことで、私の探求を可能にし、クリスティーズでのObviousへの高額な報酬も実現してくれました。
ニューラルネットワークの学習は、膨大な計算量を必要とすることで有名です。そのため、グラフィックチップメーカーのNVIDIAの株価は過去5年間で10倍以上に上昇し、Googleは機械学習向けに独自のチップの設計を開始しました。私はグラフィックプロセッサも、購入するための2,000ドルの余裕もありませんでした。そこで、Googleがクラウドコンピューティングサービスの新規ユーザーに提供する300ドルのクレジットを使って、グラフィックプロセッサを搭載した仮想コンピューターを起動しました。機械学習ソフトウェアがあらかじめ設定されているものを選びました。バラットのプロジェクトは1年以上前のものなので、FacebookやIBMなどの企業の研究者が使用しているTorchという機械学習ツールもインストールする必要がありましたが、その後、新しいパッケージに取って代わられました。

何千もの絵画を研究したニューラル ネットワークによって作成された肖像画のグリッド。
トム・シモナイト最初の実験は、バラットが1世紀以上の美術史における数千枚の肖像画で訓練したニューラルネットワークを使った。補助ソフトウェアが動くようになると、数十文字を入力するだけで奇妙な肖像画のグリッドが吐き出されるようになった。中には、Obviousが50万ドル近くで販売した肖像画に似たものもあった。バラットのネットワークは元々小さな画像しか生成しない。私はLet's Enhanceという機械学習ベースのサービスを使って、自分の肖像画の1つを拡大してみた。バラットによると、Obviousの社員の1人が、このサービスをワークフローの一部として使っていると教えてくれたそうだ。

肖像画を拡大しようとすると、さらなる歪みが生じます。
トム・シモナイト次に、バラットの学習済み肖像画生成器が他にどのようなトリックをするのかを調べるために、ドキュメントを詳しく調べました。この記事の冒頭にある画像は、より大きな画像を生成するように指示することで作成しました。歪んだ頭部と人物の塊は、ニューラルネットワークが特定のサイズの構造を生成するように学習し、学習したよりも大きな空間を埋めようとした結果です。
勇気をもらった私は、再びバラットの指示に従い、独自の画像生成ニューラルネットワークの学習に取り掛かりました。彼がWikiArtから画像を取得するために開発した「スクレーパー」は、都市景観や点描画など、様々なスタイルやジャンルの画像を収集するように指示できます。バラットは肖像画、ヌード、風景画などを扱っていました。私は海洋画をターゲットにし、スクリプトを使って2,000枚強の画像を収集しました。そして、画像編集ツールを使って収集枚数を倍増させ、それらの画像の鏡像を作成しました。このトリックが機能するのは、ニューラルネットワークの欠点を突いているからです。ニューラルネットワークは、2枚の写真が鏡像であるように、人間には明らかな視覚的な類似性を、本来は認識できないのです。

海の景色を使ってニューラル ネットワークをトレーニングした結果の一部。
トム・シモナイトネットワークを学習させることで、機械学習に関する記事を書く中で耳にしてきた不満を改めて認識することができました。例えば、特定のデータセットで特定のネットワークに良い結果をもたらすための適切な設定を見つけるには、運と技術の要素が絡んでくるということです。Googleがそのプロセスを自動化しようとしている理由の一つはここにあります。私は、バラット氏やAIアーティストのマリオ・クリンゲマン氏が実践していると教えてくれた試行錯誤に似た手法、しかしそれよりもはるかに知識の少ない手法で試行錯誤を重ねました。ネットワークを小さな違いで何度も学習させ、最も有望な結果へと近づけようと試みたのです。
NVIDIAのグラフィックチップが1つしか使えないため、ニューラルネットワークの学習には毎回何時間もかかっていました。テクノロジー企業がチームの実験を加速させるためにハードウェアに多額の投資をし、独自のAIチップを開発している理由を改めて思い知らされました。Instagramの写真数十億枚を使って画像認識アルゴリズムを学習させたFacebookのプロジェクトでは、3週間以上もの間、336個のグラフィックプロセッサを占有しました。
私自身の実験はわずか数日間で終わりました。しかし、斑点状のグリッチを「描画」するだけの駄作をいくつか試した後、見慣れた海や幽霊のような帆船までも生成できるネットワークを訓練しました。さらに良いものに近づけそうな気がしたので、マラソントレーニングセッションを準備しました。ところが、うっかりバーチャルスタジオの機能を停止させてしまいました。
次なる傑作ニューラルネットワークの学習が終わるのを待っている間、アーティストのAlex Champandardが、機械学習を使って画像を拡大するコードを公開しているGitHubページを見つけました。それを動作させようとしたところ、仮想マシンのGPUをサポートするのに必要なソフトウェア基盤の一部を壊してしまいました。締め切りが迫っていたため、すべてをゼロから再インストールする時間はありませんでした。
バラットと話したとき、彼は私の雑多なアートプロジェクトを励ましてくれた。自分のコードとチュートリアルで、そういった探求ができるようになることを期待している、と言ってくれたのだ。「僕の目標は、みんなが君みたいにこれを使って遊んで、そしてもっと色々なことをできるようになることだったんだ」と彼は言った。さらに、自分のポートレートネットワークをコンフォートゾーンから押し出すことで生まれた奇妙なアサンブラージュも気に入っていると付け加えた。彼自身もあまり試したことがなかったが。「あれを40万ドルで売ったらどうだい」と冗談を言った。
WIREDのその他の素晴らしい記事
- この化学物質は非常に高温なので、神経終末を死滅させます。いいですね!
- ツイートを削除しようと思っているのですね。削除すべきでしょうか?
- ハッキングされた米国の電力網を再起動するヘイルメリー計画
- ラテン系のTwitterは存在するのか?
- 父は自分が「標的にされる人間」だと言う。もしかしたら私たちみんなそうかもしれない
- もっと知りたいですか?毎日のニュースレターに登録して、最新の素晴らしい記事を見逃さないでください。