frogが手掛けるデザインとイノベーションの現在・未来No.45
エッジ環境での生成AIの活用
2025/05/08
この記事は、frogが運営するデザインジャーナル「Design Mind」に掲載されたコンテンツを、電通BXクリエーティブセンター、岡田憲明氏の監修でお届けします。

未来のIoT(モノのインターネット)を比較的少ないコストで実現するために、生成AIはその重点を「エッジ」の方へ移しつつあります。
「エッジ」とは、デジタル世界と物理世界が交差する場所のこと。私たちが使っている携帯電話やノートパソコン、そして物理世界をデジタル化し、変容させるセンサーやロボットアクチュエータなどのコネクテッドデバイスを指します。
本記事では、エッジAIが生成AIの次の最前線になる理由をひもときながら、「エッジ環境での生成AIの活用法」を探ります。
<目次>
▼「エッジ」こそが生成AIの次の最前線に
▼コスト面で見ると、エッジプロセッサ上の小規模モデルが有利に
▼生成AIがエッジ特有の価値を生かしたIoTの新たな時代を開く
▼エッジで得られる独自のトレーニングデータの有用性が高まる
▼これからは分野の壁を越えたアプローチとチームが求められる
「エッジ」こそが生成AIの次の最前線に
生成AIの活用とそこに寄せられる期待は、過去1年の間に飛躍的に高まりました。これは業界を問わずさまざまな企業や製品、そしてその顧客に、これまでの常識を覆す根本的な変化がもたらされようとしているからです。
関連市場は今後10年間に年平均成長率42%のペースで成長し、1.3兆ドル規模に達すると予想されています。
これまでのところ生成AIの利用は主に「大規模言語モデル(LLM)」を活用して、有用なテキスト、画像、音声、そして現在では動画コンテンツを、ウェブ上の大衆市場向けアプリケーション用のプロンプト(指示)に基づいて生成するユースケースが中心となっています。
クエリ(データベースへの命令のためのキーワード)に基づく情報検索から、プロンプトに応じた有用なコンテンツの生成へのシフトという図式は、今後数年の間、ビジネス機会と大変革の重要な部分を占めていくことになるでしょう。
この市場の次のステップを予測するのは、初めて電球が灯ったのを見ただけで電力のユースケースを考え出すようなもので、かなりのアイデアの飛躍が必要です。とはいえ、「エッジ」が生成AIの次の最前線となろうとしていることは、今、明らかになりつつある一つの傾向となっています。
コスト面で見ると、エッジプロセッサ上の小規模モデルが有利に
多くのアプリケーションにおいて、エッジプロセッサ上で実行される小規模モデルがコスト面では有利となります。
AIモデルはますます高度化しています。大衆市場向け生成AI分野をリードしようと競い合う大手テクノロジー企業は、競争を勝ち抜くにはこれまで以上に大量のトレーニングデータを使い、強力なAIを開発することが絶対条件だと見ています。
わずか数年の間に、各モデル(GPT、Gemini、Mistral、Llamaなど)が依存するパラメータの数は1000倍以上増加し、大規模マルチタスク言語理解(MMLU)ベンチマーク(AIモデルの知識を測るための、高卒資格認定試験と同類の尺度)のスコアは3倍に上昇しました。
このような現状には納得できます。この種のAIモデルは、食材をもとにしたレシピの提案から1枚の写真をもとにしたプロ仕様の顔写真の生成まで、あらゆる要求に対応できる必要があります。大衆市場でのリーダーシップを確保したいという意欲は、こうした商用アプリケーションのコスト最適化も後押ししています。この傾向は今後も続いていくでしょう。
このようにますます性能を増す高度なAIモデルはクエリを実行するごとに数セントかかる場合があり、そのコストはプロンプトとアウトプットの規模と性質によって異なります。このため計算能力の激しい拡大競争も起きており、AI技術の先端を走るNVIDIA(エヌビディア/半導体メーカー)の株価は一時、最高水準まで上昇しました。
とはいえ、ほとんどの企業やアプリケーションには、このような最上位モデルは必要ありません。アプリケーションが特定用途に特化されるようになれば、役に立つ応答を生成するのに必要な情報の範囲やモデルの高度化の程度は減っていきます。
また、モデルの性能は急速に進歩しており、Gemini Nanoなどの「小型」モデルでも、GPT-3などの2年足らず前の「大規模」言語モデルと同等のMMLUスコアに達しつつあります。
具体的に言えば、効果的な顧客サポート用チャットボットをつくるには、会話言語の理解と、特定製品の関連文書、そしてできれば問い合わせ電話のトランスクリプトがあれば事足ります。詩や音楽の知識や画像などは要らないのです。そうなると、モデルにかかる負荷は大幅に少なくなります。
現在では、Edge Impulseのようなツールのおかげで、開発者はGPT-4oなどの大規模モデルを容易に活用して桁違いに小さいカスタムモデルに学習させ 、遅延がはるかに少ないエッジデバイスプロセッサ上で狭い範囲の機能を実行させることが可能になっています。
それと同時に、MicrosoftのAIツールCopilotのようなサービスのプラットフォームサブスクリプション料金や、カスタムモデルアプリケーションのクエリ1件当たりコストの動向が、効率のいい適度なサイズのモデルの構築へと向かう流れを強力に後押ししています。
ユーザーのノートパソコンやスマートフォン、コネクテッドデバイスなどのエッジハードウエア上で生成AIを実行する場合、ローカルの処理能力やメモリが限られていても、AIモデルに満足のいくパフォーマンスを発揮させるという大きな課題を解決できさえすれば、クエリは実質的に無料になります。
以上のような要因が重なれば、特定の事業分野や製品に特化されたアプリケーションで、比較的小規模な言語モデルで生成AIを活用する事例がエッジでもクラウドでも次々と出てくるでしょう。
下の図は運用コストとモデルの規模の相関図です。「トークン」とは単語や文字の断片を表し、クエリのコストは処理されるトークンの数によって決まります。つまり、プロンプトやアウトプットが大きいほど必要なトークンの数が増え、全体のコストも増えることになります。「LLMアクティブパラメータ」とは、処理中に使用される大規模言語モデル内の内部変数の数です。パラメータ数が多いほどモデルは大きく高性能ですが、必要なリソースも多くなります。
生成AIがエッジ特有の価値を生かしたIoTの新たな時代を開く
実体のあるアナログな生き物である私たち人間は、物理世界で生を送りながら、幸福感を味わったり実用性を感じたりします。エッジに大きな影響力があるのは、これが理由です。エッジは私たちにとって、タッチスクリーンや音声アシスタント、AR(拡張現実)ヘッドセットを通じてつながるデジタル世界への双方向の窓であり、データによって可能になるアクションや実用性が最終的に形になっていく経路です。航空券を買ったり搭乗チェックインをしたりするのはスマホでできるとしても、実際に飛行機に乗って、現実の目的地まで飛ぶことができてこそ実益があるわけです。
エッジ処理やエッジAIは新しい概念ではありません。エッジ処理は、クラウドへの接続やクラウド処理に信頼性に欠ける、速度が遅い、高額すぎる、リスクが高すぎるといった問題がある場合に、デバイス上での実行を可能にする技術です。自動運転車が障害物を避ける、外科手術支援ロボットが触覚フィードバックを用いて精密な切開を行う、センサーが遠隔地の工場での生産工程をリアルタイムで制御するなど、エッジ処理とAIによって実現している価値あるユースケースはすでに数多くあります。
エッジでの生成AIの活用は、こうした実用性の新たな領域を切り開いていくでしょう。生成AIは今や、結果一覧を表示するだけの検索エンジンから、ユーザー一人一人に適したコンテンツを生成するチャットボットへのパラダイムシフトをけん引しています。それと同じように、エッジでの生成AI活用では、物理世界のリアルタイムの文脈にデジタル世界の知識をプラスした情報に基づいて、それぞれのユーザーに合わせた予測、提案、コンテンツを生成することが中心になっていくと予想されます。
これはまさに、誰もがIoTに期待していた「価値のレベルアップ」を意味します。これまでのIoTは、数値化と接続性という目新しい機能を実用的と装うばかりで、それ以上の説得力のある価値をユーザーにもたらしてこなかったことを考えれば、重要な一歩です。
その可能性は無限ですし、期待は膨らむばかりです。すでに実用化されている事例も多く、そうした事例は概して2種類に分類できます。一つは、これまでにないユーザーインターフェースや体験を実現する製品やサービス、もう一つは、実際にアクションを起こす製品やサービスです。
<ユーザーインターフェースと体験>
-
Appleの昨年の発表によれば、同社はiOS 18、iPadOS 18、macOS SequoiaにチャットGPTを統合する見込みです。この統合は、コンテンツ制作のあらゆる領域でユーザーのプライバシーにメリットがあるとうたっています。
-
旅行を楽しむ人にとっては、エッジでの生成AI活用によって音声認識や背景ノイズの除去、リアルタイムでの現地語への翻訳ができ、言葉の壁を越えてスムーズな会話ができるようになります。Samsungの最新スマートフォン「Galaxy S24」がこの機能を搭載しています。
-
産業施設では、エッジでの生成AI活用により、マシンビジョンを用いてリアルタイムのカメラ映像のテキストおよび音声ベースのクエリが可能になり、従業員が適切な安全装備を着用しているかを検査するなど、複雑な事象を精度よく監視できるようになります。NVIDIAがすでにこのユースケースを実証しています。
-
消費者の間では、Apple Vision ProやLimitless Pendant、rabbit r1、Humane Ai Pin、AIスマートグラスBrilliant Labs Frameなどのデジタルアシスタントや拡張現実デバイスの実用性が、エッジでの生成AI活用によって大幅に高まることが考えられます。ユーザーの指示に周辺の状況も加味して提案や背景情報を生成でき、しかも遅延時間が少ないため、イライラすることもありません。QualcommがAndroidスマートフォン上で実行する大規模マルチモーダルモデルをすでに実証しています。
-
Googleは先頃、eコマースプラットフォームShopify向けにAndroidに搭載されたエッジでの生成AI機能を実証しました。それによって小売業者は、eコマースサイトに掲載する商品画像の修正や準備に、エッジでの生成AIを活用することができます。
-
医療機関では、エッジでの生成AI活用により、治療チームからの音声入力や医療研修データに加えて、患者から取得したマルチモーダル生体信号センサーのデータをもとに、リアルタイムで、しかも患者のデータをクラウドに転送することなく安全に、医療上の提案を生成することができます。
<エッジでのアクション>
-
ロボット工学の分野では、エッジでの生成AI活用により、反復的作業の自動化の範囲をはるかに超えた、「推論」を伴う音声コマンドの処理が可能になり、ロボットがより役に立つアシスタントとしてシームレスに動作できるようになります。 ヒューマノイド(人型)ロボット開発のスタートアップ企業Figureは先頃、まさにこの機能を実現するため、チャットGPTとの提携を活用してこの性能を実証。「何か食べるものをもらえる?」といった間接的なプロンプトをロボットが受け取り、視野内にある使える物をもとに推論を行うことができます。この生成AIインターフェースをエッジでロボットに内蔵することで、遅延時間が短縮され、運用コストも抑えられます。
-
自動運転車に関しては、エッジでの生成AI活用により、周囲の状況を検知するLiDARシステムやカメラなどのセンサーデータをインプットして、他の物体の動きについての予測を生成することで、走行を改善することができます。以前のマシンビジョンシステムも歩行者を検知することはできましたが、生成AIなら、歩行者がこれから横断歩道を渡ると予測することができます。この処理は、車載エッジシステムで瞬時に行われねばなりません。
エッジで得られる独自のトレーニングデータの有用性が高まる
ほとんどのAIアプリケーションの開発において、モデル開発が占める割合は、すでにデータの収集や処理はもとより、テストや最適化と比べても低くなっています。オープンソースのソリューション(MetaのLlamaなど)を含めた簡単に入手できるモデルの性能が高まるにつれて、AI開発の重点はますますモデル開発からその他の取り組みへと移っていくと予想されます。
特定の業務に特化したアプリケーションを考えると、主な課題はデータ収集、タグ付け、クリーニング、メンテナンスといった分野です。
業務特化型アプリケーションの多くは、デジタル領域のみにすでに存在するデータ(社内のディレクトリにある全文書に基づく社内ナレッジ管理など)を活用することはできると考えられます。その一方で、接続されたセンサーやデバイス経由で物理世界にあるデータにアクセスし、それをデジタル化することが、現在のAI開発競争において他社と差をつけたいと考える企業にとっては重要な機会になります。
プライバシーに関する問題と制約も、重要な推進要因になるでしょう。キャップジェミニの調査機関「キャップジェミニ・リサーチ・インスティテュート」によれば、コネクテッド製品の購入を決めるとき、消費者の75%は信用を重要な要素と考えます。したがって各企業は、プライバシーとセキュリティを考慮するだけでなく、顧客が自分のデータを見返りに提供してもよいと思えるだけの価値を提供することを迫られます。自分の情報を提供したくなければ、簡単にクッキーを無効化できます。一方、それらがもたらす価値に引かれてコネクテッド製品を自宅や職場に導入した人にとっては、その製品を手放すのはクッキーの無効化よりはるかに難しいのです。
これからは分野の壁を越えたアプローチとチームが求められる
クラウド型LLMのコスト圧力と計算資源不足に加えて、エッジでの生成AIとデータ収集によって価値の高いユースケースが実現する可能性を考えれば、2024年以降にはこのエッジでの生成AI活用という分野が急成長することが期待されます。
このような傾向が続く中で、企業はいかにこの波に乗るかを考えなければなりません。この分野はまだ萌芽(ほうが)期にあるため、しっかりとした戦略を立てるには、分野の壁を越えたアプローチとチームが必要です。リソースの制約があるエッジプロセッサ上でのモデルの構築と運用が可能かどうかを評価できるエンジニア、この可能性を実現する新たな技術とそれがユーザーにもたらす価値を理解しているユーザー体験・戦略チーム、そして投資利益率(ROI)を確保するための妥協点とメリットを計算できるビジネスアナリストが、力を合わせて取り組むことが求められるでしょう。