【what is this】最新のDeep Learningで作られたFake(偽物)DeepFakesは、ポジティブ、ネガティブの両面を持ちます。以下のチュートリアルは、「Artificial Intelligence with MIT App Inventor」の第9弾(beginner level)です。簡単なスマホアプリ作成「Make Your Own Fake Voice!」から始めて、現代のDeepFakesの利用や問題点を議論し、社会に与える影響と将来の姿を考えさせます。主に生徒向けに作られたものですが、一般の大人にも有用な情報が含まれているかと思います。
■簡単なFake Voiceアプリの作成■
第一ステップでは、MIT App Inventorを利用した簡単なFake Voiceアプリを作成します。音声認識と音声合成を使いますが、本当の”DeepFakes”ではありません。音声合成の際に、音のpitchとrateを適宜変更するという単純なものです。出来上がったアプリのブロック図は、図1のとおりです。こんな簡単なものですが、それでもFake Voiceの体験ができます。
例えば、図1のスマホ画面にある「方丈記」の一節「ゆく河の流れは絶えずして、... 」をこのアプリが読み上げます。その際、デフォルトの音声合成よりも、pitchとrateをかなり低くした方が、この随筆にマッチしていて、趣があります。これは、Fake Voiceのポジティブな応用と考えたい。
一方、例えば、「おれだけど。ちょっと風邪引いてさあ。声が変なんだけど。実わあ...電車の中に鞄を…」をこのアプリで(低pitch、低rateに設定して)電話をかけるとすれば、これは悪用でしょう。
■最新AIによるDeepFakesを概観する■
第二ステップでは、最新のDeepFakesはどのように作成され、利用されているかを、ビデオで学びます。適用分野として、音声、音楽、映像、画像、テキスト、などの生成がありますが、ここでは、音声を中心に以下の6件を取り上げてみます。
(1)合成された故ケネディ大統領の声で幻の演説を聴く
故ケネディ大統領は、凶弾に倒れる前に、ある演説の原稿を用意していました。実現されなかったその演説を、大統領自身だと思えるような声で実現させたプロジェクトがあります。彼が実際に行った831件の演説の録音を元に、AIと音響工学を駆使して、特有の間合いや強調のしかた、それにボストンアクセントも反映させた、彼らしい音声を合成したのです。下記のビデオでそれを聴いてみましたが、なかなかの出来栄えだと思います。“In a world of complex and continuing problems, … America’s leadership must be guided …”
●President Kennedy Deepfaked
https://www.youtube.com/watch?v=wZF59wIIBLI
(2)月面着陸に関する「別のバージョンの歴史」
1969年、米国は人類初の月面着陸に成功しました。しかし、その任務は非常に危険だったので、悲惨な結果になった場合を想定した大統領談話原稿が用意されていました。もちろん、月面着陸はうまくいき、そのスピーチは行われませんでした。しかし、2020年に、MITのチームは、当時のニクソン大統領が沈痛な面持ちでそのスピーチを行う、ディープフェイクビデオを作成しました。これにより、「別のバージョンの歴史」を体験できることを示しました。これがどんなん意味を持ち、どんな影響を与えるかは議論があるところでしょう。
●Moon Disaster
https://moondisaster.org/film
(3)音声データバンクが声を失った人々を救う
スコットランドのSpeakUnique社は、病気(運動ニューロン疾患)で発声できなくなった人のために、その人らしい声でテキストを読み上げることができるFake voiceを設計製作しています。蓄積された膨大な音声サンプルを利用し、きめ細かく、好みや特性を考慮した調整を行い、個人向けのユニークな高品質音声を作ってくれます。AndroidやiOS向けのアプリとしても、それを提供しています。
●Voice Banking Helps People with Motor Neuron Diseases
https://vimeo.com/403687789
(4)人に代わって美容院やレストランを予約
米国でも、小規模な店の約60%はネット予約システムを持たずに、電話受付けしているそうです。Googleでは、DeepFake voice(Google Duplex Assistant利用)が美容院やレストランへ予約電話をかけてくれるサービスを始めるとのことです。
以下のデモビデオでは、客に代わって電話したDeepFake Voiceが、店側の人間から混雑状況を知らされて、最初の希望時間を変更して予約を取っていました!人が発する自然言語をも理解していたのですから、誰しも驚きます。店員は、人間が電話してきたと思っているようでした。(個人向けには需要はなさそうですが、社用で定常的に顧客接待で会食予約する場合などは、人間のコスト削減に繋がるかも。)
●Haircut appointment or Restaurant reservation
https://youtu.be/D5VN56jQMWM
(5)銀行強盗(詐欺)に使われた例
英国のあるエネルギー会社の従業員は、会社のCEOから、遠く離れた会社に243,000ドルを送るようにという電話を受けました。その従業員は、CEOの声だと信じて、送金してしまいました。その声はFake voiceでした!下記のこのビデオは、このような事件がどのようにして起こるかを説明しています。
●Fake Voices Pull a Bank Heist
https://www.youtube.com/watch?v=EGEID-_XWCM
(6)金融犯罪、金融危機を引き起こす可能性
以下の短いビデオは、将来、(音声だけでなく、ビデオやドキュメントを巧みに偽造した)ディープフェイクが起こす金融犯罪、さらには金融危機の可能性について、イラストを用いて分かりやすく説明しています。
●Could AI-Powered Videos Cause an Economic Collapse?
https://youtu.be/YE0i7IpqVfk
■DeepFakesの適用分野や社会へのインパクトについて考察■
最後の第三ステップでは、ここまでの情報にもとづき、各グループ毎に、DeepFakesの適用分野や将来の可能性について議論させます。さらに、全体会合で、他のグループの見解も聞き、さらに議論を深めるようにしています。指導者に対して、図2のような指針が示されています。(ここでは省略しましたが、もう少し詳しくブレークダウンした指針もこのカリキュラムユニットの資料に含まれています。)
0 件のコメント:
コメントを投稿