loading...

電通報ビジネスにもっとアイデアを。

AI実況はスポーツ観戦をどう変える? 「Voice Watch」

2023/11/29

観客席の前を爆音とともにレーシングカーが次々に走り抜けていく。その様子をAIがリアルタイムで観客席にいる視覚障がい者に実況する。現在の順位からレース展開の予測まで、プロのアナウンサーと比べても遜色ない実況に、視覚障がい者はモータースポーツのおもしろさを体感する。

NY ADC賞のAI部門で部門最高賞を受賞し、今年度のグッドデザイン・ベスト100にも選ばれたリアルタイムスポーツ実況生成AI「Voice Watch」が、視覚障がい者のスポーツ観戦に新たな道を開こうとしています。そこにはどのようなアイデアとテクノロジーの融合があるのか?プロジェクトリーダーである、クリエーティブディレクターの志村和広氏に聞きました。

Voice Watch

スポーツ観戦における情報格差を解消する

──リアルタイムスポーツ実況生成AI「Voice Watch」は、どのような経緯から生まれたのでしょうか?

志村:始まりは、ウェブ上で偶然見かけたトヨタ・モビリティ基金の公募です。「障がいのある方が、心からレースを楽しむためには?」という課題でした。当時は育休中で、冷静に頭をもう一回リセットして、これからはもう少し社会のためになる仕事をしたいと考えていたところだったので、おもしろいかもしれないと思い、チームを組んでエントリーしました。

最初にしたことは、障がい者の方の生の声を聞くことでした。電通グループの企業で働く視覚障がい者のメンバーを何人か紹介してもらい、直接話を聞きました。話を聞く前までは、「モータースポーツの会場に行くための移動をどう実現するか?」「会場内での移動をいかにスムーズにするか?」といったことを課題解決の着眼点として想定していたのですが、実際に視覚障がい者の方の話を聞いてみると、解決すべきことはもっと他にもあることに気づかされました。彼らが口々に訴えたのは、「そもそも会場に行っても、目の前で何が起こっているのかよくわからない」「一緒に行っている友達や家族にレースの状況をいちいち説明してもらうのも申し訳ない」「みんなが盛り上がっていても、自分たちはそれに乗れないから行く気がしない」といった声でした。

つまり、目の前のレースを見ることができない視覚障がい者と健常者の間には、同じ会場にいながら情報格差がある。それが心理的ハードルになって、会場に観戦に行くことを躊躇(ちゅうちょ)させている。解決すべきはレース会場で起きているこの情報格差だと気づき、この問題をなんとかしたいと考えました。スポーツ観戦の熱狂から視覚障がい者を取り残さず、健常者と視覚障がい者が一緒になって観戦を楽しむことができる社会をつくる、ということを目標にアイデアを考え、公募にエントリーし、生まれたのがリアルタイムスポーツ実況生成AI 「Voice Watch」です。

物体認識・兆し発見・発話フレーム、3つのAIが連携

──「Voice Watch」は、どのようにしてリアルタイムでスポーツ実況を生成しているのでしょうか?

志村:「Voice Watch」は、全体としては1つの大きなAIシステムですが、細かく見ると3つのAIから構成されています。

「Voice Watch」 システム画面
「Voice Watch」 システム画面

1つ目は、レーシングカーをとらえる固定カメラの映像から物体認識を行うAIです。これは、いわば視覚障がい者の方の目の代わりです。レーシングカーをトラッキングすることで、「今通り過ぎたのはどのチームか」「誰と誰が競り合っているか」といった、目の前で繰り広げられるレースを描写します。

2つ目は、ラップタイムや順位などリアルタイムで供給される膨大な走行データの解析から、レース展開に変化が起こる“兆し”を発見するAIです。「次の1周で2位が先頭をとらえて一気に抜きそうだ」「徐々に差が縮まって3位から2位に順位を上げそうだ」など、この先のレース展開を予測します。

3つ目は、実況アナウンサーの過去のレース実況を学習することにより、プロの実況ノウハウを抽出した、独自の発話フレームAIです。このAIは、先の2つのAIとそれぞれ連携していて、目の前の状況や今後の展開予測を交えた実況を生成します。プロアナウンサーの実況を学習しているので、AI実況の語り口もアナウンサーが話しているように自然で臨場感のあるものになっています。

もちろん、せっかく会場で観戦しているのですから、実況だけでなく、迫力のあるエンジン音も楽しんでほしい。だから、実況音声のボリュームと会場音の取り込みのバランスにも気を配り、工夫しています。

──スポーツの実況というと、テレビやラジオの中継など、会場に行けない人々に向けられたものという印象がありますが、「Voice Watch」は会場にいる人に向けられている点で「逆転の発想」とも言えますね。

志村:野球でもサッカーでも、スタンドで観戦しているときに実況を聞く必要がないのは、視覚情報により、何が起こっているかわかるからです。実は「Voice Watch」の開発にあたり、視覚障がい者の方が観客席で実際どんなふうに感じているのかを理解するために、私をはじめスタッフがアイマスクをしてサーキットの音を聞いてみたんです。もうめちゃめちゃ怖いというか、不気味な感じでした。爆音が予測不能なタイミングで耳に飛び込んできて、とても不快に感じるんです。ところが、同じ状況で「Voice Watch」の実況とともにサーキットの音を聞いてみると、それまで不快だった爆音に少しずつ興奮を覚えるようになっていきました。人間の脳は本当におもしろいなと思います。実況とともにその爆音を聞くと、頭の中に景色が想像できるなどして、それまで不快だった爆音を興奮に変換できるみたいなのです。

──「Voice Watch」を実際のレースで視覚障がい者の方に使っていただいたそうですね。反応はいかがでしたか?

志村:「スーパー耐久」という日本最大の耐久レースで、実際に視覚障がい者の方に使っていただきました。多くの方から「レースを楽しむことができた」「『Voice Watch』があればスポーツ観戦に足を運んでみたい」との評価をいただきました。それまでモータースポーツ観戦に行ったことがない人が会場に足を運び、観戦を楽しむ初めての体験を創出できたことは、私たちにとっても、とても感慨深いことでした。

また、会場にいた視覚障がい者ではない方々からも「自分たちが使っても、レース展開がわかりやすくて、おもしろい。観戦が楽しくなった」との感想をいただきました。「Voice Watch」は、視覚障がい者向けに作ったものですが、結果として、健常者の方が使っても新しい観戦体験として楽しめることは、ちょっとした発見でした。

日本最大の耐久レース「スーパー耐久」のAI実況を生成
日本最大の耐久レース「スーパー耐久」のAI実況を生成

熱量はあるけれど実況がないスポーツに

──「Voice Watch」を他のスポーツにも広げていく考えはありますか?

志村:現在、いろいろ検討を進めています。「スーパー耐久」で「Voice Watch」を使っていただいた視覚障がい者の方に、次はどんなスポーツに導入してほしいか質問してみたんです。おそらく野球やサッカーといったメジャースポーツが挙がるだろうなと思っていたら、意外なことに多くの方が「子どもの運動会」と答えたんです。「子どもの運動会に行っても、そこで何が起きているかわからない」「うちの子が今どういう状況か、周りのお父さん・お母さんに聞いてみたくても、みんな自分の子どもの応援に夢中で、とてもじゃないけど聞ける雰囲気じゃない」といった経験を多くの方がしていたんです。視覚障がいの方にとっては、運動会観戦は大きなハードルだったのです。

そこで、実際に運動会で、徒競走のリアルタイム実況を実施してみました。その結果、「Voice Watch」で自分の子どもが走る実況を聞くことで、視覚障がいのあるお父さんに、お子さんの運動会をこれまで以上に楽しんでいただけました。

子どもの運動会で小学生50m走のAI実況を生成
子どもの運動会で小学生50メートル走のAI実況を生成

子どもの運動会もそうですが、熱量はあるけれど、そこにコストの関係上、人間の実況が入っていけていないスポーツというのが世の中にはたくさんあって、そこに「Voice Watch」が役立つ可能性を感じた瞬間でした。

──「Voice Watch」は視覚障がい者向けに開発されましたが、そうでない人にも広げていける可能性はあるのでしょうか?

志村:運動会で自分の子どもが走る様子を実況することが可能なように、AIは特定の選手にフォーカスした実況を生成することができます。私たちは、これを「推し実況」と呼んでいて、「Voice Watch」の可能性を大きく広げてくれるものと考えています。

例えば、「スーパー耐久」でトヨタチームを応援したい人のために、トヨタチームのレーシングカーにフォーカスした実況を生成することができます。つまり、万人向けではなく、特定のファン層のためのパーソナルな実況を生成することができるのです。

また、実況する言語も切り替えられるので、例えば、海外からも観戦客がやって来るような国際大会で、それぞれの国の言語で、それぞれの国の選手の「推し実況」を生成することもできるでしょう。

私たち開発チームは、当初は「人間の実況にどこまで近づけるか」ということを目標に掲げてきたのですが、現在は、AI実況は人間の実況にはない魅力があることがわかってきました。今後はこうした「Voice Watch」の可能性の追求を通して、新たな観戦体験の創造を目指していきたいと思っています。


AIはアイデアを実現するための手段にすぎない

──志村さんは、良質なマグロをAIで見極めることで話題になった「TUNA SCOPE」の開発にも携わっていらっしゃいました。「TUNA SCOPE」と「Voice Watch」の間で共通の開発思想やテクノロジーはあるのでしょうか?

志村: 「TUNA SCOPE」にしても、「Voice Watch」にしても、新しくて、世のためになって、ワクワクするものを作っていくんだという思想のもとで開発している点で、考え方は一貫しています。

──どちらもAIというテクノロジーが起点になっています。AIという技術を使って新しいことを始めるというのが出発点ですか?

志村:そう思われがちですが、実はちょっと違うんです。「AIというテクノロジーを使って何か新しいものを作れないか」ということが起点になっているのではなく、「世の中にはこんな課題がある、これをどうにかアイデアで解決できないだろうか」ということが起点になっているんです。世の中の課題を解決したり、人をワクワクさせるアイデアを実現するために、AIが必要だった、という順番なのです。

私たち広告会社の仕事のベースは、技術発想というよりは、クリエイティビティとテクノロジーを掛け合せて、まだこの世にない新しい体験を作り、人や社会の課題を解決する、ということが軸になっています。

AIの技術ありきで何か新しいものを作ろうとすると、同じような考えを持っている人は世界中にたくさんいるわけで、その結果、できるものが同じようなものになってしまうんです。私たちの発想の順番というのは、まずアイデアがあって、その実現にAIが必要ならばAIを使う、というスタンスなんです。出発点が違うから、他にはない新しいタイプのAIをつくり続けることができるのではないかと思います。

世の中の新しい課題を発見し、驚くような方法で解決し続け、よりよい未来をつくっていく。それが電通の強みであり、私たちの仕事の醍醐味です。

 

Voice Watch Webサイト : https://voicewatch-project.com/


【スタッフリスト】
クリエーティブディレクター :志村和広(電通/Future Creative Center)
アートディレクター :田中せり(電通/Future Creative Center)
プランナー :富田奨 (電通/Future Creative Center)
プランナー :関遼(電通/Future Creative Center)
ビジネスプロデューサー: 児玉匡史(電通)
データサイエンティスト :鈴木初実 (電通デジタル)
データサイエンティスト :植村智明 (電通デジタル)
データサイエンティスト: Samaneh Arzpeima (電通デジタル)
プロデューサー :道瀬裕介 (電通ライブ)
プロデューサー :下道大樹 (電通ライブ)
プロデューサー :石井正哉 (電通ライブ)
ディレクター :加藤友之 (電通ライブ)

 

Twitter