久々に登場の大美です。たてヨコラムの進行を裏でず〜〜〜〜っとやっておりましたが、自分でコラムを書くのはなんと1年3ヶ月ぶり!いやぁ、久しぶりすぎて何を書いたらいいのかわからないのが現状ですが、最近巷を賑わしているAIの進化についてご紹介したいと思います。
※このコラムに掲載されている画像、イラストは全てAIによる画像生成です。
AI画伯の進化が止まらない!
AI=人工知能(Artificial Intelligence)。一昔前はまだまだ遠い未来の技術だと思っていましたが、今やもうすっかり日常生活にも取り込まれています。
例えば…
・喋れば調べてくれるSiri、Googleスマートスピーカー、AmazonのアレクサにLINE CLOVAなどの音声コンシェルジュ
・天気予報やPM2.5分布状況をネットから自動的に取得して運転方法を最適化するエアコン
・服の汚れや水の硬度・水温を見極めて調整しながら衣服を綺麗に仕上げる洗濯機
・床の広さや材質、汚れている部分を記憶して効率よく掃除を行いバッテリーが少なくなると自動的に充電するロボット掃除機
などなど…ほんと、増えましたね。
そして今、話題になっているのが画像生成AI、いわゆるAI画伯。
AIがついに、お絵描きというクリエイティブな世界に進出してきました。オーダーされた文章や画像を理解した上で、これまでに学んだ膨大な画像と画像に紐付けされたキーワードなどの知識(記憶?記録?)とを照らし合わせた上で、オーダーに基づいた画像を自動的に生成するというAIです、しかも1〜2分程度で!
いやぁ、すごい!そして、こわいww
AI画伯って、誰?
さてそんなAI画伯ですが、有名なシステムとしてOpenAIが開発した「DALL-E2(ダリ・ツー)」、Googleが開発した「Imagen(イマジェン)」を皮切りに、元NASAの技術者などが作り「神絵が1分で描ける!」と話題になった「Midjourney(ミッドジャーニー)」、そして、恐るべしクオリティとちょっとスペックの高い自宅PCにインストールすれば無料で画像生成し放題(しかもオープンソース!)な「Stable Diffusion(ステーブルディフュージョン)」が登場しました。
実は、こうしたAIの開発と運用には、とてつもない計算パワー=資金が必要だったことと、フェイクニュースなどに悪用される恐れがあったり(実際、画像生成AIが作った静岡の水害写真(フェイク)が拡散されました)で、利用制限(という名の自主規制)を設けられていました。しかしその壁がついに崩され、画像生成に始まり、音声生成、動画、3D、言語、そしてプログラミングコードの作成もAIが対応していくというロードマップが公開されています(詳しくは『画像生成AI「Stable Diffusion」開発元に聞く、AIビジネスの“新時代”』 をお読みください)。
いやぁ、すごい!そして、こわいww(本日2回目)
どうやってお絵描きしてもらうの?
さて、いろんなAI画伯が登場していますが、これまでに学んだ膨大な数の写真やイラスト、絵画(学習モデルと呼びます)とその絵の作り方・特徴・分析の仕方により、微妙に絵のタッチが変わります。そう、まるで人間の絵描きさんのように!
というわけで、同じフレーズで一発描きしていただいた絵を比較してみましょう。
今回お願いしたAI画伯は、MidjourneyセンセイとStable Diffusionセンセイ、そしてキャラるセンセイの3人(?)です。
※ちなみにキャラるセンセイはStable Diffusionをベースに日本語と日本風の絵のタッチを中心に学習させた画伯とのことです。
はい、まずはこちらのフレーズ。
「葛飾北斎が描いた東京タワー(Tokyo Tower drawn by Katsushika Hokusai)」
なるほど〜こういう感じになるんですねぇ。いやぁ興味深い。
こうすれば浮世絵ぽいでしょ、こういう色のトーンやタッチが北斎ぽいんじゃない?というAIの提案が見て取れます。
あ、一部(いや大多数)のAI画伯は英語しか受け付けてもらえませんので、日本語で考えた文章をGoogle翻訳で英語に変換しております。
さてお次はちょっと長めのシチュエーション。
「田んぼの中の一本道を自転車に乗って走り去る日本の女子高生を手塚治虫が描いた絵(A picture by Osamu Tezuka of a Japanese high school girl riding a bicycle down a single road in a rice field.)」
うーん、なるほど。手塚治虫先生は降臨していただけなかったようですね。世界的に有名なマンガの神様と思っていましたが、学習した画像が少なかったからでしょうか(田中圭一先生なら降臨してくれた?www)。もしかすると尾田栄一郎先生とか鳥山明先生とか藤子不二雄先生なら降臨しやすいのかもしれません、著作が多数ネットに転がってますからね。
しかし、面白いですねぇ。比較するといろいろAI画伯のクセが見えてきます。
ちなみに、一度描いてもらった絵をもう一度書き直しさせたり、ちがうバリエーションで展開させたり、さらにはフレーズや語句を調整したりカスタマイズして自分のイメージ通りの絵に仕立てることができます。
こうしてできたフレーズは、プロンプト=呪文と呼ばれています。そしてAI画伯にうまくオーダーして自分のイメージ通りの絵を描かせることができる人は「上級魔術師」と呼ばれています(詳しくは 魔術として理解するお絵描きAI講座 をお読みください)。
※この呪文をうまく使えるようにする技術が早速、プロンプトエンジニアリングと呼ばれるジャンルとして確立されました。
いやぁ、すごい!そして、こわいww
メチャメチャ進化中+メチャメチャカンタンに!
さてこのAI画伯。これまでは一般人が使いこなすには、ちょっとハードルが高かったです。
AI画伯の召喚に高スペックPC(高性能グラボ搭載)が必要で仮想環境の構築+システムインストールが必要だったり、呪文詠唱にはDiscordでボットにオーダーしなくちゃいけなかったり…。
ところが!
ついに、誰もがカンタンにAI画伯召喚ができるようになりました!そう、AI画伯が私たち一般市民のもとに歩み寄ってくれたのです!
つまり、画像生成エンジン(AIの中核となる部分ですね)を活用して、好みのスタイルの絵を、使っているサービス上で生成できるように「調教」「召喚」されたサービスがリリースされました。
そんな雲の上の存在が歩み寄ってくれてきたサービスと、そのサービスが生成した画像サンプルをご紹介します。
オーダーした呪文は「葛飾北斎が描いた、夕焼けに染まる東京タワー」です。
[ご注意]サービスによっては1日の生成画像数に制限があります。画像生成のために広告動画の視聴が必要になったりもします。
まずは、みんな大好きLINEで使える「お絵描きばりぐっどくん」。
→LINEアカウント
そしてアプリでオーダーできる「AI Picasso」
→iOSアプリダウンロード
→Google Playアプリダウンロード
日本語の指示に特化して、Twitterで画像生成をオーダーできる「りんな@AI画家」(キャラる)
→Twitterアカウント(該当ツイート)
そしてそして!多種多様なテンプレートでチラシからポストカードから動画まで作成できる「Canva」にも、AI画伯が導入されました!
→Canvaアプリダウンロード
いやぁ、すごい!そして、こわいww(本日…何回目?)
思った通りの絵を描いてもらうコツ。キモは国語力
さてこのAI画伯。お分かりのとおり、コンピューターのシステムです。
うまくイメージ通りに描いてもらうには、かなりのコツがいります。こんな感じの絵を描いて!とイメージしたものをいかに具現化できるか、具体例をあげて説明できるか、さらに確実に伝わるように言語化できるかがキモと思います。
つまりは「国語力」が必要になるのではないでしょうか(できれば英語力も欲しいところ)。
リアルのお絵描き師に対人でオーダーを伝えるのとは異なり、相手は感情を(今は)持たないコンピューター。
論理的に、具体的に、具現化したイメージを言語として文章として伝えることができることこそが、必要なスキルになりそうです。
ヤバい、理系出身なので国語力ないんだよぉ、どうしよ(泣)。
国語力・表現力・伝達力こそ、これからの時代に必要なスキル!
先ほど紹介したインタビュー記事「画像生成AI「Stable Diffusion」開発元に聞く、AIビジネスの“新時代” 」にも書かれていますが、AIによる画像生成は実はファーストステップ。次は音声、そして動画、3Dモデル、そして言語へとAIはますます進化しながら身の回りに浸透してきます。
そんなさまざまなAIをシチュエーションに応じて使いこなす時代が、遠からず到来します。そんな時に必要なのは、やはり国語力であり、表現力であり、伝達力と言えそうです。
イメージしたもの、表現したいものを正確に伝えるための国語力と表現力、そして伝達力。これら、今までの対人コミュニケーションでも重要とされてきた(でも実はちょっと疎かにされつつある)スキルが、将来AIを使役するための必須能力となりそうです。
私たちがAIに使われるのではなく、AIをうまく使って生産性を高め、自分たちの生活を豊かによりするために、国語力とコミュニケーション力をアップさせていく必要があるでしょう。
でも!
自分がイメージしたものを具現化するためには、そのイメージがどういうモノであるかをキチンと把握することが必要。
つまり、さまざまな写真や絵画・イラストを見たり、音楽を聴き、映画を見、会話をし、食べ、飲み、旅に出る…コンピュータには(今は)できない人間らしい活動を通じてセンスを磨くことも必要と思います。
多彩な体験を通じて蓄積したセンスと、それらを具現化して伝えられる力。遊びの経験とコミュニケーション力を通して、AIをうまく使いこなす「上級魔術師」を目指しましょう!
それでは最後に、バルス!(そっち?ww)
まだまだこの程度の絵しか描けないのがAIの限界なのか…。
まだまだこの程度の絵しか描かせられないのが私の限界なのか…。