
5月の記事で、AI(人工知能(ちのう))の発達と詐欺(さぎ)メールの増加(ぞうか)について書かせてもらいましたが、グーグルが5月20日に最新の動画生成AI「Veo 3」と生成AI映画(えいが)作成ツール「Flow」を発表しました。
Veo 3は動画の開始場面を任意(にんい)の(自分で選んだ)画像(がぞう)に指定できるなど動画生成の能力(のうりょく)そのものも高いのですが、登場人物をしゃべらせたり、環(かん)境(きょう)音や効果(こうか)音を自動で入れてくれたりする点で、他の動画生成AIと段違(だんちが)いの性能(せいのう)を見せています。
環境音というのは、主な音声とは別の周囲の音のことです。例えば街中のインタビュー動画を考えてみましょう。インタビュアーとインタビューを受ける人の声とは別に、行きかう人々の話し声や車の走行音など、本編には関係ないけど自然な雰囲気(ふんいき)をかもし出す音が自動で入ってくるのです。海辺で主人公が話す後ろで聞こえてくる波の音や浜辺(はまべ)を渡(わた)る風の音を想像(そうぞう)してみてください。
そして登場人物がしゃべる音と唇(くちびる)の動きが同期(リップシンクといいます)しているから驚(おどろ)きです。登場人物にしゃべらせるだけならkling2.0という動画生成AIが先行しているかもしれませんが、自然な雰囲気という点では、Veo 3が優(すぐ)れていると思います。
このコラムでわざわざ紹介(しょうかい)した理由ですが、これらを使ったフェイクニュースが流行(りゅうこう)するのではないかと心配しているからです。政治家(せいじか)の発言が偽造(ぎぞう)されたり、ありもしないニュースのニセ動画が作成されたりするかもしれません。真実を見極(みきわ)める力が大事な時代です。
(ITサポートさが・陣内誠)