loading...

電通報ビジネスにもっとアイデアを。

frogが手掛けるデザインとイノベーションの現在・未来No.47

未来の音声ブランディング~AIエージェントがブランドの将来にもたらすものとは?~

2025/10/17

この記事は、frogが運営するデザインジャーナル「Design Mind」に掲載されたコンテンツを、電通BXクリエイティブセンター岡田憲明氏の監修でお届けします。
frog01

 

「ねえSiri、お話を聞かせてくれる?」

昨晩、筆者の子供たちが寝る前にお話を読み聞かせてくれたのは、Apple社の音声アシスタント「Siri」です。実際のところ、程よく短い話で内容も面白く、なかなかのものでした。子どもたちもとても楽しんだようで、もう一つ聞かせてとせがみました。するとSiriは、今度は猫の話をしました。子どもたちは人の話にじっと聞き入るタイプです。これはおそらく、筆者がたびたび寝る前の読み聞かせをしていることと関係があるのでしょう。そのためもあってか、ある残念な事実にも気づいてしまいました。二つ目の話が終わったとき、Siriの声がとても平板で単調なことに気づいてハッとしたのです。

筆者がSiriの話にどうも感情移入できなかったのは、それが理由だと思います。その後、子どもたちが夢の世界に入ってしまった後、声のトーンの大切さについて考え始めました。心のつながりを感じられるかどうかは、話の内容そのものよりも、むしろどんな風に話すかが大きくかかわります。

声のトーンは、ずっと以前からブランド表現の重要な一要素でした。生成AIがバラバラなツールから、リアルタイムで会話ができるマルチモーダル(※1)なインターフェースへと進化していく中で、その重要性はさらに増していくでしょう。声のトーンこそ、サウンドロゴやブランドのテーマ曲の先にある、未来の音声ブランディングの鍵なのです。

※1 マルチモーダル=テキスト、動画、音声など複数の種類の情報(モード)を組み合わせて、処理する技術・手法。

 

会話型インターフェースが主流の新たな世界におけるAIエージェント

ダイナミックな双方向体験をリアルタイムで提供する生成AIの出現を機に、ブランド各社は従来の顧客エンゲージメントツールから脱却しようとしています。生成型検索エンジンが登場したことで、いまや人々の注目はブランドのウェブサイトから離れつつあり、時代は検索エンジン最適化(SEO)から、生成検索最適化(GEO)に移ろうとしています。

数々のアプリはやがて、ユーザーの代わりにすべてのアプリとやりとりをしてくれるAIエージェント(自律的にタスクを実行し、状況に応じて判断・行動できるAIシステム)に取って代わられるでしょう。そのうちに、いくつものプラットフォームやチャネルを別々に操作する必要はなくなります。

AIエージェントがそうしたバラバラの要素を一つにまとめてくれるようになるからです。AIエージェントが見えないアシスタントとして働き、さまざまなチャネルやプラットフォームにまたがる無数のタスクをまとめてスムーズに対応してくれる――。そんな未来へ飛び込むのは、難しいことではありません。ただ、そのような未来には身体的な体験がさらに重要になることは間違いないのですが、その点についてはまた別の機会にお話ししましょう。

私たちはやがて、日々の煩雑な事務手続きから解放されることになるでしょう。ルームランナーでエクササイズしながら、週末の小旅行のプランを立てるのもお手のもの。朝食で摂り過ぎたカロリーを燃やし終える前に、AIエージェントが行き先を選び、移動手段やホテルを手配して、あなたの好みに合った本を注文し、レストランの予約までしてくれます。ついでにエクササイズも代わりにやってくれれば、なおいいのですが。

とはいえ、もしルームランナーで走っているときに足をねんざしたら、AIエージェントに足首用サポーターの注文も頼むことができます。さらに、そうした事務作業だけではなく、精神的なサポートが欲しいときにも、AIアシスタントが心のこもった人間らしい声のトーンで応えてくれるでしょう。寝る前の読み聞かせをするSiriの単調な声とは違って、未来の生成AIの音声は温かく情緒的なものになるのです。


「やあAIエージェント、僕が今日どんな気分かわかる?」

2024年のTEDトークで、Microsoft AIのCEOのムスタファ・スレイマンは、生成AIは単なるツールやプラットフォームをはるかに上回るものとみなすことが必要だという話をしました。生成AIを新しい「デジタル種」ととらえようと呼びかけたのです。そして、この考え方を踏まえて、生成AIは敬意をもって扱い、時間をかけて育てていく必要があるものだと示唆しました。

「私たちはAIを構築するに当たって、良いもの、私たちが愛するもの、人類の優れた特性、つまり共感や優しさ、好奇心、創造性といったものをすべて反映させることができるし、そうしなければなりません。」(ムスタファ・スレイマン)

この論理に従えば、 AIエージェントがただの音声以上のものになり得る理由が見えてきます。 自然言語へのシフトによって、顧客との間でより親密なやりとりができるようになるのは明らかです。AIエージェントはユーザーの嗜好や習慣を学習することで、その時々の状況や感情をいっそう理解できるようになるでしょう。誤解のないように言えば、感情を理解する能力は、一般的な知性とは別のものであるため、AIエージェントに命が宿るとか、何らかの形で意識を持つと言いたいわけではありません。AIエージェントが素晴らしく賢いデジタルエコシステムになることに変わりはありませんが、ユーザーについての知識が蓄積されていくにつれて、そのユーザーにとって親密さを感じられる音声の作り方を学習していくということです。

また、音声が関係するのはそうしたやりとりの一方だけにとどまりません。AIエージェントはユーザーの声も聴いています。つまり、プロンプトに応じた声のトーンで、ユーザーの知りたいことを伝えることができるわけです。

例えば、今日の午後にゴルフができるか、天気予報を尋ねるとします。晴れる場合は熱のこもった声で、雨風が強いなら残念そうな声で答えてくれるでしょう。もう一歩先に進めば、ユーザーの家族一人ひとりに合わせてやりとりの仕方を変えることもできるようになるはずです。冒頭にあげた、子どもたちに猫のお話を聞かせてくれた話に戻れば、猫のキャラクターを演じるときはもっと楽しげな声のトーンを選ぶだろうと想像できます。

「やがて、あらゆることが会話的インターフェースを通じてできるようになるでしょう」(ムスタファ・スレイマン)

音声は非常に大きな影響力を持つため、視覚や触覚、嗅覚など、聴覚以外の感覚にも幅広くアプローチしていくための入口になり得ます。インターネットへの接続が当たり前になる新しい世界では、AIエージェントが私たちの想像を超えていくかもしれません。AIエージェントは、単に予約をしたり、商品やサービスを注文したりするツールをはるかに超える存在になる可能性を秘めています。

最近は、孤独を感じ、それに関連する健康問題を抱える人が急激に増えていると警鐘を鳴らす声が聞かれます。AIエージェントの普及に伴ってそうした人々の数が減ったとしても、驚くには当たらないでしょう。しかし、ブランドの役割に関して言えば、孤独感はなくならないかもしれません。例えば、ユーザーのAIエージェントがブランドのAIエージェントとだけやりとりしているとすれば、ユーザー本人とブランドとの結びつきはないも同然ではないでしょうか?

現在のブランドの立ち位置とは

「ブランド(brand)」という言葉には「燃える(burn)」という意味があり、元々は所有者を示すために家畜に焼き印を押すことを指していました。やがて時を経て、製造元や原産地を示すために商品に付けられる印を指すのに使われるようになりました。現在では、ブランドという言葉は組織の存在感を示すための重要な要素となっています。しかし、AIエージェントが導く新しい世界では、ブランドの役割は先細りしていく危険があります。

AIエージェントを自社開発するにせよ、他社のエージェントを最適化するにせよ、ブランド各社にとっては、できる限りほかとの区別がつきやすい独自の音声レイヤーを制作することが不可欠になるでしょう。これは何層にも重なったバースデーケーキのようなものと考えることができます。

一番上の層はロウソクとトッピング(ブランドレイヤー)。その次の層はアイシング(状況や顧客一人ひとりの嗜好に合わせて構築する感情レイヤー)。そしてケーキの残りの部分がLLM(大規模言語モデル)レイヤーで、音声を作動させる原動力となります。

こうしたことをすべて考え合わせると、一つの疑問が浮かびます。ブランドをありのままに表す音声を、どのようにして決めればいいのでしょうか?

「ブランドは、その使命や価値観、ターゲット層に適合した独自の音声(ボイス)を決める必要があります。ブランドボイスは、そのブランドの個性とアイデンティティ、そしてコミュニケーション目標に最もよく適合したトーンとスタイルを反映したものでなければなりません。また、すべてのチャネルやプラットフォームを通じて、一貫して識別可能で記憶に残る印象を顧客に残すものでなければなりません」

上の一節は生成AIによって作成されたものです。間違ってはいませんが、あまりクリエイティブな文章とは言えません。ブランドの音声レイヤーをどうやって決めるかという問いへの答えは、おそらくすでに既存のブランド表現の中にあるはずですが、ブランドガイドラインからブランド化された音声へと軸足を移すに当たっては、それは出発点にすぎません。

そのブランドのストーリーを語り、そのストーリーがこんな風に聞こえてほしいという理想に合わせてクリエイティブに語られるように(さらに言えば、著名人の声の使用許諾を得るのに巨額の支出をしなくて済むように)する必要があります。匿名化した個人情報や、抽出・分析した公共データ、リサーチの結果、さらには創作データといった各種のデータが、ブランドボイスを制作するための秘密兵器となります。

例えば、有名な創業者のいる消費財ブランドなら、ブランドの個性をよくとらえたさまざまなフレーズに加えて、創業者の思想や録音物を元にしてブランドボイスを構築するという方法があります。世界的なスポーツ用品ブランドなら、一つのボイスに絞るのではなく、特に影響力のあるアンバサダーやキャンペーンの音声を活用して、競技別に複数のボイスを用意するといいでしょう。金融サービスブランドなら、地域ごとの特徴やニーズに合うように気を配りながら、顧客サービス部門のスタッフの声を録音して使うのも一案です。

遠くからこだまする未来のサウンドをとらえる

世界の中でも先見の明に優れた組織、特に特徴の強いブランドを持っている場合は、すでに独自のブランドボイスと新たな時代の会話的インターフェースを模索し始めています。そうして探し出す「ブランドの声」は、顧客体験(CX)戦略のほかの部分と同じように、戦略的に妥当で、明確に識別でき、ブランドの個性を際立たせるものでなければなりません。ただし、CX戦略の他の部分とは異なり、ブランドボイスはブランドポートフォリオの中で最も感情訴求力の高いアセットであり、大切に保護し、育てる必要があります。次に筆者の娘たちに読み聞かせをしてもらうときには、そんな風にして育てられた声で、心に響く楽しい猫の物語を聞かせてくれることを願いたいものです。

Twitter