現在、業界で一般的にAIエージェントの定義は、環境を感知し、それに応じた行動をする知能システムを指します。センサーを通じて環境情報を取得し、処理を経てアクチュエーターによって環境に影響を与えるものです(Stuart Russell & Peter Norvig, 2020)。私たちは、AIエージェントはLLM、RAG、記憶、タスク計画、ツール使用能力を集約したアシスタントであると考えています。単純な情報提供だけでなく、計画、タスクの分解、そして実際に実行する能力も備えています。
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
AIエージェントはWeb3とAIの統合の重要な推進力になることができるか
AIエージェントはWeb3+AIの救いの手となるか?
AIエージェントプロジェクトは、Web2の起業において人気で成熟したタイプが主に企業向けサービスであるのに対し、Web3分野ではモデル訓練やプラットフォーム統合型プロジェクトがエコシステム構築における重要な役割から主流となっています。
現在のWeb3のAIエージェントプロジェクトは数が少なく8%を占めていますが、それらのAI分野における時価総額の割合はなんと23%に達しており、強力な市場競争力を示しています。技術の成熟と市場の認知度の向上に伴い、将来的には10億ドルを超える評価を受けるプロジェクトが複数現れると予測しています。
Web3プロジェクトにとって、非AIコアのアプリケーション製品にAI技術を導入することは戦略的な優位性となる可能性があります。AIエージェントプロジェクトの組み合わせ方は、全エコシステムの構築とトークンエコノミーモデルの設計に重点を置き、分散化とネットワーク効果を促進する必要があります。
AIの波:プロジェクトの次々と登場と評価の上昇の現状
ChatGPTが2022年11月に登場して以来、わずか2ヶ月で1億人以上のユーザーを惹きつけ、2024年5月にはChatGPTの月収が驚異の2030万ドルに達しました。また、OpenAIはChatGPTをリリースした後、迅速にGPT-4やGP4-4oなどのバージョンを発表しました。このような急成長の中で、従来のテクノロジー企業はLLMなどの最先端AIモデルの重要性に気づき、自社のAIモデルやアプリケーションを次々と発表しています。例えば、Googleは大規模言語モデルPaLM2を発表し、MetaはLlama3をリリースし、中国の企業は文心一言や智谱清言などの大規模モデルを発表しました。明らかに、AI分野はもはや競争の激しい場所となっています。
各大科技巨头の競争はビジネスアプリケーションの発展を促進するだけでなく、オープンソースAI研究の調査統計からもわかるように、2024年のAI Indexレポートでは、GitHub上のAI関連プロジェクトの数が2011年の845から2023年には約180万に急増し、特にGPTが発表された2023年にはプロジェクト数が前年同期比で59.3%増加しており、これは世界の開発者コミュニティのAI研究への熱意を反映しています。
AI技術への熱意は投資市場に直接反映されており、AI投資市場は強力な成長を示しており、2024年第2四半期には爆発的な成長を遂げると予想されています。世界中で16件の1.5億ドルを超えるAI関連投資があり、これは第1四半期の2倍に達します。AIスタートアップの資金調達総額は240億ドルに急増し、前年同期比で倍増しています。その中で、マスク氏のxAIは60億ドルを調達し、評価額は240億ドルに達し、OpenAIに次いで評価額が2番目に高いAIスタートアップとなりました。
AI技術の急速な発展は、かつてない速度でテクノロジー分野の地図を再構築しています。テクノロジーの巨人たち間の激しい競争から、オープンソースコミュニティプロジェクトの盛り上がり、さらには資本市場のAIコンセプトへの熱烈な支持まで、プロジェクトは次々と登場し、投資額は新たな高値を記録し、評価額もそれに伴って上昇しています。全体的に見て、AI市場は高速成長の黄金時代にあり、大型言語モデルと検索強化生成技術は言語処理分野で重要な進展を遂げました。それにもかかわらず、これらのモデルは技術的優位性を実際の製品に転換する際に、モデル出力の不確実性、生成される不正確な情報の幻覚リスク、モデルの透明性の問題などの課題に直面しています。これらの問題は、信頼性が非常に重要なアプリケーションシナリオにおいて特に重要です。
この背景の中で、私たちはAIエージェントの研究を始めました。なぜなら、AIエージェントは実際の問題解決と環境との相互作用の包括性を強調するからです。この転換は、AI技術が純粋な言語モデルから実際の問題を理解し、学び、解決できる知的システムへと進化することを示しています。したがって、私たちはAIエージェントの発展に希望を見出し、これはAI技術と実際の問題解決の間のギャップを徐々に埋めているのです。AI技術の進化は生産力の構造を絶えず再構築し、一方でWeb3技術はデジタル経済の生産関係を再構築しています。AIの三大要素:データ、モデル、計算能力がWeb3の非中央集権、トークン経済、スマートコントラクトなどの核心理念と融合することで、一連の革新的なアプリケーションが生まれることを予見しています。この潜在能力に満ちた交差領域において、私たちはAIエージェントが自律的にタスクを実行する能力を持ち、大規模なアプリケーションを実現する巨大な潜在能力を示していると考えています。
これにより、私たちはWeb3におけるAIエージェントの多様な応用を深く研究し始めました。Web3のインフラストラクチャー、中間層、アプリケーションレベル、データおよびモデル市場など、さまざまな視点から、最も有望なプロジェクトタイプやアプリケーションシーンを特定し評価することを目指しています。AIとWeb3の深い統合を理解するために。
! AIエージェントはWeb3+AIの命の恩人になれるか?
概念の明確化:AIエージェントの紹介と分類の概要
基本的な紹介
AIエージェントを紹介する前に、読者がその定義とモデル自体の違いをよりよく理解できるように、実際のシーンを通じて例を示します。旅行を計画していると仮定しましょう。従来の大型言語モデルは目的地情報や旅行の提案を提供します。検索強化生成技術は、より豊富で具体的な目的地の内容を提供できます。一方、AIエージェントはアイアンマン映画のジャービスのように、ニーズを理解し、一言でフライトやホテルを自動的に検索し、予約操作を実行し、スケジュールをカレンダーに追加することができます。
現在、業界で一般的にAIエージェントの定義は、環境を感知し、それに応じた行動をする知能システムを指します。センサーを通じて環境情報を取得し、処理を経てアクチュエーターによって環境に影響を与えるものです(Stuart Russell & Peter Norvig, 2020)。私たちは、AIエージェントはLLM、RAG、記憶、タスク計画、ツール使用能力を集約したアシスタントであると考えています。単純な情報提供だけでなく、計画、タスクの分解、そして実際に実行する能力も備えています。
この定義と特性に基づいて、AIエージェントはすでに私たちの生活に溶け込んでおり、さまざまなシーンで応用されています。例えば、AlphaGo、Siri、テスラのL5レベル以上の自動運転などは、AIエージェントの例と見なすことができます。これらのシステムの共通の特徴は、外部のユーザー入力を感知し、それに基づいて現実の環境に影響を及ぼす適切な応答を行うことができる点です。
ChatGPTを例に概念を明確にするために、TransformerがAIモデルを構成する技術アーキテクチャであることを明確に指摘する必要があります。そして、GPTはこのアーキテクチャに基づいて発展したモデルシリーズであり、GPT-1、GPT-4、GPT-4oはそれぞれ異なる発展段階のモデルバージョンを示しています。ChatGPはGPTモデルから進化したAIエージェントです。
カテゴリ概要
現在、AIエージェント市場は統一された分類基準を形成していません。我々は、Web2およびWeb3市場の204のAIエージェントプロジェクトにラベルを付ける方法を通じて、各プロジェクトに対応する顕著なラベルに基づいて、一次分類と二次分類に分けました。一次分類は基盤構築、コンテンツ生成、ユーザーインタラクションの3つのカテゴリに分かれ、さらに実際のユースケースに基づいて細分化されます。
基盤インフラタイプ:このタイプは、エージェント分野のより基盤的な内容を構築することに焦点を当てており、プラットフォーム、モデル、データ、開発ツール、および比較的成熟した基盤アプリケーションのB2Bサービスを含みます。
開発ツール類:開発者にAIエージェントを構築するための補助ツールとフレームワークを提供します。
データ処理クラス:異なる形式のデータを処理および分析し、主に意思決定を支援し、トレーニングのための情報源を提供します。
モデル訓練カテゴリ:AIに対するモデル訓練サービスを提供し、推論、モデルの構築、設定などを含みます
B2Bサービス:主に企業ユーザーを対象とし、企業向けサービス、垂直型、オートメーションソリューションを提供します。
プラットフォーム集合型:さまざまなAIエージェントサービスとツールを統合したプラットフォーム。
インタラクティブ型:コンテンツ生成型と似ていますが、持続的な双方向のインタラクションが違いです。インタラクティブ型エージェントは、ユーザーのニーズを受け入れ理解するだけでなく、自然言語処理(NLP)などの技術を通じてフィードバックを提供し、ユーザーとの双方向のインタラクションを実現します。
感情的なサポート:感情的な支援と伴走を提供するAIエージェント。
GPTタイプ:GPT(生成的事前学習トランスフォーマー)モデルに基づくAIエージェント。
検索タイプ:検索機能に重点を置き、より正確な情報検索を提供するエージェント。
コンテンツ生成型:このタイプのプロジェクトは、ユーザーの指示に基づいてさまざまな形式のコンテンツを生成するために、大規模モデル技術を利用してコンテンツの創造に焦点を当てています。テキスト生成、画像生成、動画生成、音声生成の4つに分類されます。
! AIエージェントはWeb3+AIの命の恩人になれるか?
Web2 AI Agentの開発状況の分析
私たちの統計によると、Web2の従来のインターネットにおけるAIエージェントの開発は、明らかなセクター集中の傾向を示しています。具体的には、約3分の2のプロジェクトがインフラストラクチャ関連に集中しており、その中でも主にB2Bサービスと開発ツールが多いです。この現象についてもいくつかの分析を行いました。
技術成熟度の影響:インフラプロジェクトが主導的な地位を占める理由は、まずその技術成熟度にあります。これらのプロジェクトは通常、時間によって検証された技術やフレームワークの上に構築されているため、開発の難易度やリスクが低減されます。AI分野における「シャベル」に相当し、AIエージェントの開発と応用に確固たる基盤を提供します。
市場の需要の推進:もう一つの重要な要因は市場の需要です。消費者市場に比べて、企業市場はAI技術に対する需要がより切実であり、特に運営効率の向上やコスト削減のソリューションを求めています。同時に、開発者にとって企業からのキャッシュフローは比較的安定しており、後続のプロジェクトの開発に有利です。
アプリケーションシーンの制限:同時に、コンテンツ生成型AIのB2B市場でのアプリケーションシーンは相対的に限られていることに注意しました。その出力の不安定性のため、企業は生産性を安定的に向上させることができるアプリケーションを好む傾向があります。これにより、コンテンツ生成型AIはプロジェクトライブラリに占める割合が小さくなっています。
このトレンドは、技術の成熟度、市場の需要、および応用シナリオの実際の考慮を反映しています。AI技術の進歩と市場の需要がさらに明確になるにつれて、この構造が調整される可能性があると予想していますが、インフラストラクチャ関連は依然としてAIエージェントの発展における堅固な基盤となるでしょう。
Web2のAIエージェントリーダーシッププロジェクト分析
私たちは現在のWeb2市場におけるAIエージェントプロジェクトについて深く掘り下げ、Character AI、Perplexity AI、Midjourneyの3つのプロジェクトを例に分析を行います。
キャラクターAI:
製品紹介:Character.AIは、人工知能に基づく対話システムとバーチャルキャラクター作成ツールを提供します。そのプラットフォームでは、ユーザーがバーチャルキャラクターを作成、トレーニングし、対話することができ、これらのキャラクターは自然言語で会話をし、特定のタスクを実行することができます。
データ分析:Character.AIの5月の訪問者数は2.77億で、プラットフォームには350万以上のデイリーアクティブユーザーがいます。そのほとんどは18歳から34歳の間にあり、若年層のユーザー層の特徴を示しています。Character AIは資本市場で素晴らしいパフォーマンスを発揮し、1.5億ドルの資金調達を完了し、評価額は10億ドルに達しました。a16zがリード投資しています。
技術分析:Character AIは、グーグルの親会社であるAlphabetと、その大規模言語モデルを非独占的に使用するためのライセンス契約を締結しました。これは、Character AIが独自開発した技術を採用していることを示しています。注目すべきは、会社の創業者であるNoam ShazeerとDaniel De Freitasが、グーグルの対話型言語モデルLlamaの開発に関与していたことです。
パープレキシティAI:
製品紹介:Perplexityはインターネットから情報を収集し、詳細な回答を提供することができます。情報の信頼性と正確性を確保するために引用や参考リンクを通じて、ユーザーに教育し、質問やキーワード検索を促すことで、ユーザーの多様なクエリニーズに応えます。
データ分析:Perplexityの月間アクティブユーザー数は1000万人に達し、2月にはモバイルおよびデスクトップアプリケーションのアクセス数が8.6%の増加を達成し、約5000万人のユーザーを引き付けました。資本市場では、Perplexity AIが最近6270万ドルの資金調達を発表し、評価額は10.4億ドルに達しました。リード投資家はDaniel Grossで、参加者にはStan DruckenmillerとNVIDIAが含まれています。
テクニカル分析:Perplexityが使用する主要なモデルは、ファインチューニングされたGPT-3.5と、オープンソースの大規模モデルをファインチューニングした2つの大型モデル:pplx-7b-onlineとpplx-70b-onlineです。これらのモデルは、専門的な学術研究や垂直分野のクエリに適しており、情報の真実性と信頼性を確保します。
ミッドジャーニー:
製品紹介:ユーザーはPromptsを使用してMidjourneyでさまざまなスタイルやテーマの画像を作成でき、写実的なものから抽象的なものまで幅広い創作ニーズをカバーしています。プラットフォームは画像の混合と編集も提供しており、ユーザーは画像の重ね合わせやスタイルの移行を行うことができます。プラットフォームのリアルタイム生成機能により、ユーザーは数十秒から数分以内に生成されることが保証されています。