Liệu AI Agent có thể trở thành cứu cánh cho Web3+AI?
Dự án AI Agent trong khởi nghiệp Web2 chủ yếu là loại dịch vụ cho doanh nghiệp, trong khi trong lĩnh vực Web3, các dự án đào tạo mô hình và tập hợp nền tảng trở thành xu hướng chính do vai trò then chốt của chúng trong việc xây dựng hệ sinh thái.
Hiện tại, số lượng dự án AI Agent trong Web3 không nhiều, chiếm 8%, nhưng tỷ lệ vốn hóa thị trường của chúng trong lĩnh vực AI lên tới 23%, do đó thể hiện sức cạnh tranh mạnh mẽ trên thị trường. Chúng tôi dự đoán rằng với sự trưởng thành của công nghệ và sự tăng cường mức độ công nhận của thị trường, trong tương lai sẽ xuất hiện nhiều dự án có định giá vượt quá 1 tỷ USD.
Đối với các dự án Web3, việc áp dụng công nghệ AI vào các sản phẩm không phải lõi AI có thể trở thành lợi thế chiến lược. Đối với các dự án AI Agent, cách kết hợp nên chú trọng vào việc xây dựng hệ sinh thái toàn diện và thiết kế mô hình kinh tế token, nhằm thúc đẩy sự phi tập trung và hiệu ứng mạng.
Cuộc cách mạng AI: Tình trạng ra mắt dự án và tăng giá trị
Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, chỉ trong vòng hai tháng, nó đã thu hút hơn 100 triệu người dùng. Đến tháng 5 năm 2024, doanh thu hàng tháng của ChatGPT đã đạt mức 20,3 triệu USD đáng kinh ngạc. Sau khi phát hành ChatGPT, OpenAI cũng nhanh chóng cho ra mắt các phiên bản cải tiến như GPT-4, GP4-4o. Với tốc độ phát triển nhanh chóng như vậy, các ông lớn công nghệ truyền thống nhận ra tầm quan trọng của ứng dụng các mô hình AI tiên tiến như LLM, và đều đã cho ra mắt mô hình và ứng dụng AI của riêng mình. Ví dụ, Google đã phát hành mô hình ngôn ngữ lớn PaLM2, Meta đã giới thiệu Llama3, trong khi các công ty Trung Quốc đã cho ra mắt các mô hình lớn như Wenxin Yiyan và Zhipu Qingyan. Rõ ràng, lĩnh vực AI đã trở thành một chiến trường không thể thiếu.
Cuộc đua giữa các ông lớn công nghệ không chỉ thúc đẩy sự phát triển của các ứng dụng thương mại, mà từ các khảo sát thống kê trong nghiên cứu AI mã nguồn mở, báo cáo AI Index năm 2024 cho thấy số lượng các dự án liên quan đến AI trên GitHub đã tăng vọt từ 845 dự án vào năm 2011 lên khoảng 1,8 triệu vào năm 2023, đặc biệt là sau khi GPT được phát hành vào năm 2023, số lượng dự án đã tăng 59,3% so với cùng kỳ năm trước, phản ánh sự nhiệt tình của cộng đồng các nhà phát triển toàn cầu đối với nghiên cứu AI.
Sự đam mê đối với công nghệ AI đã phản ánh trực tiếp trong thị trường đầu tư, thị trường đầu tư AI đang thể hiện sự tăng trưởng mạnh mẽ, với sự bùng nổ trong quý 2 năm 2024. Trên toàn cầu có tổng cộng 16 khoản đầu tư liên quan đến AI vượt quá 150 triệu USD, gấp đôi so với quý 1. Tổng số vốn huy động của các công ty khởi nghiệp AI đã tăng vọt lên 24 tỷ USD, tăng trưởng hơn một lần so với năm trước. Trong đó, xAI của Musk đã huy động được 6 tỷ USD, với giá trị 240 tỷ USD, trở thành công ty khởi nghiệp AI có giá trị cao thứ hai chỉ sau OpenAI.
Sự phát triển nhanh chóng của công nghệ AI đang định hình lại bức tranh của lĩnh vực công nghệ với một tốc độ chưa từng có. Từ cuộc cạnh tranh khốc liệt giữa các gã khổng lồ công nghệ, đến sự phát triển mạnh mẽ của các dự án cộng đồng mã nguồn mở, cho đến sự cuồng nhiệt của thị trường vốn đối với khái niệm AI. Các dự án liên tục xuất hiện, số tiền đầu tư đạt mức cao kỷ lục, và định giá cũng theo đó mà tăng vọt. Tổng thể mà nói, thị trường AI hiện đang ở trong một thời kỳ vàng son phát triển nhanh chóng, với các mô hình ngôn ngữ lớn và công nghệ tạo sinh tăng cường tìm kiếm đã đạt được những bước tiến quan trọng trong lĩnh vực xử lý ngôn ngữ. Tuy nhiên, những mô hình này vẫn phải đối mặt với những thách thức khi chuyển đổi lợi thế công nghệ thành sản phẩm thực tế, chẳng hạn như sự không chắc chắn trong đầu ra của mô hình, rủi ro của việc tạo ra thông tin không chính xác, và vấn đề minh bạch của mô hình. Những vấn đề này trở nên đặc biệt quan trọng trong các tình huống ứng dụng yêu cầu độ tin cậy rất cao.
Trong bối cảnh này, chúng tôi bắt đầu nghiên cứu về AI Agent, vì AI Agent nhấn mạnh tính toàn diện trong việc giải quyết các vấn đề thực tiễn và tương tác với môi trường. Sự chuyển mình này đánh dấu sự tiến hóa của công nghệ AI từ những mô hình ngôn ngữ thuần túy sang các hệ thống thông minh có khả năng thực sự hiểu, học hỏi và giải quyết các vấn đề trong thực tế. Vì vậy, chúng tôi nhìn thấy hy vọng từ sự phát triển của AI Agent, khi nó dần thu hẹp khoảng cách giữa công nghệ AI và việc giải quyết các vấn đề thực tiễn. Sự tiến hóa của công nghệ AI liên tục định hình lại cấu trúc năng suất, trong khi công nghệ Web3 đang tái cấu trúc các mối quan hệ sản xuất trong nền kinh tế số. Khi ba yếu tố chính của AI: dữ liệu, mô hình và sức mạnh tính toán, hòa quyện với các khái niệm cốt lõi của Web3 như phi tập trung, kinh tế mã thông báo và hợp đồng thông minh, chúng tôi dự đoán sẽ tạo ra một loạt các ứng dụng đổi mới. Trong lĩnh vực giao thoa đầy tiềm năng này, chúng tôi tin rằng, AI Agent với khả năng thực hiện nhiệm vụ một cách tự động, đã thể hiện tiềm năng to lớn trong việc áp dụng quy mô lớn.
Để làm được điều này, chúng tôi bắt đầu nghiên cứu sâu về các ứng dụng đa dạng của AI Agent trong Web3, từ cơ sở hạ tầng Web3, middleware, đến các cấp độ ứng dụng, cũng như thị trường dữ liệu và mô hình, nhằm xác định và đánh giá các loại dự án và bối cảnh ứng dụng tiềm năng nhất, để hiểu sâu hơn về sự kết hợp chặt chẽ giữa AI và Web3.
Làm rõ khái niệm: Giới thiệu và phân loại AI Agent
Giới thiệu cơ bản
Trước khi giới thiệu AI Agent, để giúp độc giả hiểu rõ hơn về sự khác biệt giữa định nghĩa và mô hình của nó, chúng ta sẽ đưa ra một ví dụ thông qua một kịch bản thực tế: giả sử bạn đang lên kế hoạch cho một chuyến đi. Các mô hình ngôn ngữ lớn truyền thống cung cấp thông tin về điểm đến và gợi ý du lịch. Kỹ thuật tạo sinh nâng cao thông qua truy vấn có thể cung cấp nội dung điểm đến phong phú và cụ thể hơn. Còn AI Agent giống như Jarvis trong bộ phim Người Sắt, có thể hiểu nhu cầu và chủ động tìm kiếm chuyến bay và khách sạn dựa trên một câu nói của bạn, thực hiện các thao tác đặt chỗ và thêm lịch trình vào lịch.
Hiện nay, định nghĩa phổ biến về AI Agent trong ngành là hệ thống thông minh có khả năng cảm nhận môi trường và thực hiện hành động tương ứng, thông qua cảm biến để thu thập thông tin môi trường, sau đó xử lý và sử dụng bộ thực thi để tác động đến môi trường (Stuart Russell & Peter Norvig, 2020). Chúng tôi cho rằng, AI Agent là một trợ lý kết hợp các khả năng của LLM, RAG, trí nhớ, lập kế hoạch nhiệm vụ và khả năng sử dụng công cụ. Nó không chỉ cung cấp thông tin đơn thuần mà còn có thể lập kế hoạch, phân tích nhiệm vụ và thực hiện một cách thực sự.
Theo định nghĩa và đặc điểm này, chúng ta có thể nhận thấy AI Agent đã sớm hòa nhập vào cuộc sống của chúng ta, được ứng dụng trong nhiều tình huống khác nhau, chẳng hạn như AlphaGo, Siri, và hệ thống lái tự động cấp độ L5 trở lên của Tesla đều có thể được coi là ví dụ về AI Agent. Những hệ thống này có điểm chung là đều có khả năng cảm nhận thông tin đầu vào từ người dùng bên ngoài và từ đó tạo ra ảnh hưởng tương ứng đến môi trường thực tế.
Lấy ChatGPT làm ví dụ để làm rõ khái niệm, chúng ta cần chỉ ra rằng Transformer là kiến trúc kỹ thuật cấu thành mô hình AI, GPT là chuỗi mô hình phát triển dựa trên kiến trúc này, trong khi GPT-1, GPT-4, GPT-4o lần lượt đại diện cho các phiên bản của mô hình ở các giai đoạn phát triển khác nhau. ChatGPT thì T là AI Agent tiến hóa dựa trên mô hình GPT.
Phân loại tổng quan
Hiện tại, thị trường AI Agent chưa hình thành được tiêu chuẩn phân loại thống nhất, chúng tôi đã phân loại 204 dự án AI Agent trong thị trường Web2+Web3 bằng cách gán nhãn cho từng dự án dựa trên những nhãn nổi bật của chúng, và chia thành phân loại cấp một và cấp hai. Trong đó, phân loại cấp một bao gồm ba loại: cơ sở hạ tầng, tạo nội dung, tương tác người dùng, sau đó được phân loại chi tiết theo các trường hợp sử dụng thực tế của chúng:
Cơ sở hạ tầng: Loại này tập trung vào việc xây dựng các nội dung cơ bản hơn trong lĩnh vực Agent, bao gồm nền tảng, mô hình, dữ liệu, công cụ phát triển, cũng như các dịch vụ B2B đã trưởng thành và ứng dụng cơ bản hơn.
Công cụ phát triển: Cung cấp cho các nhà phát triển các công cụ và khung hỗ trợ để xây dựng AI Agent.
Lớp xử lý dữ liệu: Xử lý và phân tích dữ liệu ở các định dạng khác nhau, chủ yếu được sử dụng để hỗ trợ ra quyết định, cung cấp nguồn cho việc đào tạo.
Lớp huấn luyện mô hình: Cung cấp dịch vụ huấn luyện mô hình cho AI, bao gồm suy diễn, xây dựng mô hình, thiết lập, v.v.
Dịch vụ B端: Chủ yếu hướng đến người dùng doanh nghiệp, cung cấp các giải pháp dịch vụ doanh nghiệp, chuyên biệt và tự động hóa.
Nền tảng tập hợp: Nền tảng tích hợp nhiều dịch vụ và công cụ AI Agent.
Loại tương tác: Tương tự như loại tạo nội dung, sự khác biệt nằm ở việc tương tác hai chiều liên tục. Agent loại tương tác không chỉ tiếp nhận và hiểu nhu cầu của người dùng mà còn cung cấp phản hồi thông qua các công nghệ như xử lý ngôn ngữ tự nhiên (NLP), thực hiện tương tác hai chiều với người dùng.
Loại hình đồng hành cảm xúc: Cung cấp hỗ trợ cảm xúc và đồng hành từ AI Agent.
Loại GPT: AI Agent dựa trên mô hình GPT (Transformer tiền huấn luyện sinh).
Tìm kiếm: Tập trung vào chức năng tìm kiếm, cung cấp các Agent chủ yếu để truy xuất thông tin chính xác hơn.
Nội dung tạo ra: Các dự án loại này tập trung vào việc tạo ra nội dung, sử dụng công nghệ mô hình lớn để tạo ra nhiều hình thức nội dung khác nhau dựa trên chỉ dẫn của người dùng, được chia thành bốn loại: tạo văn bản, tạo hình ảnh, tạo video và tạo âm thanh.
Phân tích tình trạng phát triển của tác nhân AI Web2
Theo thống kê của chúng tôi, sự phát triển của AI Agent trong Internet truyền thống Web2 thể hiện rõ ràng xu hướng tập trung theo lĩnh vực. Cụ thể, khoảng hai phần ba các dự án tập trung vào lĩnh vực cơ sở hạ tầng, trong đó chủ yếu là các dịch vụ B2B và công cụ phát triển, chúng tôi cũng đã thực hiện một số phân tích về hiện tượng này.
Ảnh hưởng của độ trưởng thành công nghệ: Các dự án hạ tầng chiếm ưu thế trước tiên nhờ vào độ trưởng thành công nghệ của chúng. Những dự án này thường được xây dựng trên các công nghệ và khung đã được kiểm nghiệm qua thời gian, từ đó giảm bớt độ khó và rủi ro trong phát triển. Tương đương với "cái xẻng" trong lĩnh vực AI, cung cấp nền tảng vững chắc cho việc phát triển và ứng dụng AI Agent.
Sự thúc đẩy của nhu cầu thị trường: Một yếu tố quan trọng khác là nhu cầu thị trường. So với thị trường tiêu dùng, nhu cầu về công nghệ AI từ thị trường doanh nghiệp cấp thiết hơn, đặc biệt trong việc tìm kiếm các giải pháp nâng cao hiệu quả hoạt động và giảm chi phí. Đồng thời, đối với các nhà phát triển, dòng tiền từ doanh nghiệp tương đối ổn định, có lợi cho việc phát triển các dự án tiếp theo.
Giới hạn của các trường hợp ứng dụng: Đồng thời, chúng tôi nhận thấy rằng các ứng dụng AI tạo nội dung trên thị trường B2B có trường hợp ứng dụng tương đối hạn chế. Do tính không ổn định của sản phẩm, các doanh nghiệp có xu hướng ưa chuộng những ứng dụng có khả năng nâng cao năng suất ổn định. Điều này dẫn đến tỷ lệ của AI tạo nội dung trong kho dự án tương đối nhỏ.
Xu hướng này phản ánh sự trưởng thành của công nghệ, nhu cầu thị trường và các yếu tố thực tế của các tình huống ứng dụng. Với sự tiến bộ không ngừng của công nghệ AI và nhu cầu thị trường ngày càng rõ ràng, chúng tôi dự đoán rằng cấu trúc này có thể sẽ có sự điều chỉnh, nhưng các loại hạ tầng vẫn sẽ là nền tảng vững chắc cho sự phát triển của AI Agent.
Phân tích dự án dẫn đầu Web2 của AI Agent
Chúng tôi sẽ đi sâu vào một số dự án AI Agent hiện tại trên thị trường Web2 và phân tích chúng, với ba dự án Character AI, Perplexity AI, Midjourney làm ví dụ.
Character AI:
Giới thiệu sản phẩm: Character.AI cung cấp hệ thống đối thoại dựa trên trí tuệ nhân tạo và công cụ tạo nhân vật ảo. Nền tảng của họ cho phép người dùng tạo, đào tạo và tương tác với các nhân vật ảo, những nhân vật có khả năng đối thoại bằng ngôn ngữ tự nhiên và thực hiện các nhiệm vụ cụ thể.
Phân tích dữ liệu: Character.AI có lượng truy cập 277 triệu vào tháng 5, nền tảng này có hơn 3,5 triệu người dùng hoạt động hàng ngày, trong đó phần lớn người dùng độ tuổi từ 18 đến 34, cho thấy đặc điểm của nhóm người dùng trẻ. Character AI đã thể hiện xuất sắc trên thị trường vốn, hoàn thành việc huy động 150 triệu USD, với định giá đạt 1 tỷ USD do a16z dẫn dắt.
Phân tích kỹ thuật: Character AI đã ký thỏa thuận cấp phép không độc quyền với công ty mẹ của Google là Alphabet để sử dụng mô hình ngôn ngữ lớn của mình, điều này cho thấy Character AI sử dụng công nghệ tự phát triển. Đáng chú ý, các nhà sáng lập của công ty là Noam Shazeer và Daniel De Freitas đã tham gia phát triển mô hình ngôn ngữ đối thoại Llama của Google.
Perplexity AI:
Giới thiệu sản phẩm: Perplexity có khả năng thu thập và cung cấp câu trả lời chi tiết từ Internet. Thông qua việc trích dẫn và liên kết tham khảo, nó đảm bảo tính đáng tin cậy và độ chính xác của thông tin, đồng thời giáo dục và hướng dẫn người dùng thực hiện các câu hỏi tiếp theo và tìm kiếm từ khóa, đáp ứng nhu cầu truy vấn đa dạng của người dùng.
Phân tích dữ liệu: Số lượng người dùng hoạt động hàng tháng của Perplexity đã đạt 10 triệu, với lượng truy cập trên ứng dụng di động và máy tính để bàn tăng 8,6% trong tháng Hai, thu hút khoảng 50 triệu người dùng. Trên thị trường vốn, Perplexity AI gần đây đã công bố đã nhận được 62,7 triệu USD tài trợ, với định giá đạt 1,04 tỷ USD, do Daniel Gross dẫn dắt, với sự tham gia của Stan Druckenmiller và NVIDIA.
Phân tích kỹ thuật: Mô hình chính mà Perplexity sử dụng là GPT-3.5 đã được tinh chỉnh, cùng với hai mô hình lớn được tinh chỉnh từ mô hình lớn mã nguồn mở: pplx-7b-online và pplx-70b-online. Mô hình phù hợp cho nghiên cứu học thuật chuyên nghiệp và
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
7 thích
Phần thưởng
7
6
Chia sẻ
Bình luận
0/400
OPsychology
· 3giờ trước
Vỏ ngoài dát vàng nhưng bên trong rỗng tuếch
Xem bản gốcTrả lời0
WalletDoomsDay
· 3giờ trước
Cả hai đều là bong bóng.
Xem bản gốcTrả lời0
TokenSherpa
· 3giờ trước
Thị trường thật sự hấp dẫn
Xem bản gốcTrả lời0
CoinBasedThinking
· 3giờ trước
Nhìn tốt để tiếp tục pump
Xem bản gốcTrả lời0
GasFeeCrier
· 4giờ trước
Ví tiền cháy quá nhanh
Xem bản gốcTrả lời0
AllInDaddy
· 4giờ trước
Làm công không bằng Giao dịch tiền điện tử kiếm tiền.
Sự trỗi dậy của dự án Web3 AI Agent, vốn hóa thị trường chiếm 23%, dự kiến định giá một tỷ đô la trong tương lai.
Liệu AI Agent có thể trở thành cứu cánh cho Web3+AI?
Dự án AI Agent trong khởi nghiệp Web2 chủ yếu là loại dịch vụ cho doanh nghiệp, trong khi trong lĩnh vực Web3, các dự án đào tạo mô hình và tập hợp nền tảng trở thành xu hướng chính do vai trò then chốt của chúng trong việc xây dựng hệ sinh thái.
Hiện tại, số lượng dự án AI Agent trong Web3 không nhiều, chiếm 8%, nhưng tỷ lệ vốn hóa thị trường của chúng trong lĩnh vực AI lên tới 23%, do đó thể hiện sức cạnh tranh mạnh mẽ trên thị trường. Chúng tôi dự đoán rằng với sự trưởng thành của công nghệ và sự tăng cường mức độ công nhận của thị trường, trong tương lai sẽ xuất hiện nhiều dự án có định giá vượt quá 1 tỷ USD.
Đối với các dự án Web3, việc áp dụng công nghệ AI vào các sản phẩm không phải lõi AI có thể trở thành lợi thế chiến lược. Đối với các dự án AI Agent, cách kết hợp nên chú trọng vào việc xây dựng hệ sinh thái toàn diện và thiết kế mô hình kinh tế token, nhằm thúc đẩy sự phi tập trung và hiệu ứng mạng.
Cuộc cách mạng AI: Tình trạng ra mắt dự án và tăng giá trị
Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, chỉ trong vòng hai tháng, nó đã thu hút hơn 100 triệu người dùng. Đến tháng 5 năm 2024, doanh thu hàng tháng của ChatGPT đã đạt mức 20,3 triệu USD đáng kinh ngạc. Sau khi phát hành ChatGPT, OpenAI cũng nhanh chóng cho ra mắt các phiên bản cải tiến như GPT-4, GP4-4o. Với tốc độ phát triển nhanh chóng như vậy, các ông lớn công nghệ truyền thống nhận ra tầm quan trọng của ứng dụng các mô hình AI tiên tiến như LLM, và đều đã cho ra mắt mô hình và ứng dụng AI của riêng mình. Ví dụ, Google đã phát hành mô hình ngôn ngữ lớn PaLM2, Meta đã giới thiệu Llama3, trong khi các công ty Trung Quốc đã cho ra mắt các mô hình lớn như Wenxin Yiyan và Zhipu Qingyan. Rõ ràng, lĩnh vực AI đã trở thành một chiến trường không thể thiếu.
Cuộc đua giữa các ông lớn công nghệ không chỉ thúc đẩy sự phát triển của các ứng dụng thương mại, mà từ các khảo sát thống kê trong nghiên cứu AI mã nguồn mở, báo cáo AI Index năm 2024 cho thấy số lượng các dự án liên quan đến AI trên GitHub đã tăng vọt từ 845 dự án vào năm 2011 lên khoảng 1,8 triệu vào năm 2023, đặc biệt là sau khi GPT được phát hành vào năm 2023, số lượng dự án đã tăng 59,3% so với cùng kỳ năm trước, phản ánh sự nhiệt tình của cộng đồng các nhà phát triển toàn cầu đối với nghiên cứu AI.
Sự đam mê đối với công nghệ AI đã phản ánh trực tiếp trong thị trường đầu tư, thị trường đầu tư AI đang thể hiện sự tăng trưởng mạnh mẽ, với sự bùng nổ trong quý 2 năm 2024. Trên toàn cầu có tổng cộng 16 khoản đầu tư liên quan đến AI vượt quá 150 triệu USD, gấp đôi so với quý 1. Tổng số vốn huy động của các công ty khởi nghiệp AI đã tăng vọt lên 24 tỷ USD, tăng trưởng hơn một lần so với năm trước. Trong đó, xAI của Musk đã huy động được 6 tỷ USD, với giá trị 240 tỷ USD, trở thành công ty khởi nghiệp AI có giá trị cao thứ hai chỉ sau OpenAI.
Sự phát triển nhanh chóng của công nghệ AI đang định hình lại bức tranh của lĩnh vực công nghệ với một tốc độ chưa từng có. Từ cuộc cạnh tranh khốc liệt giữa các gã khổng lồ công nghệ, đến sự phát triển mạnh mẽ của các dự án cộng đồng mã nguồn mở, cho đến sự cuồng nhiệt của thị trường vốn đối với khái niệm AI. Các dự án liên tục xuất hiện, số tiền đầu tư đạt mức cao kỷ lục, và định giá cũng theo đó mà tăng vọt. Tổng thể mà nói, thị trường AI hiện đang ở trong một thời kỳ vàng son phát triển nhanh chóng, với các mô hình ngôn ngữ lớn và công nghệ tạo sinh tăng cường tìm kiếm đã đạt được những bước tiến quan trọng trong lĩnh vực xử lý ngôn ngữ. Tuy nhiên, những mô hình này vẫn phải đối mặt với những thách thức khi chuyển đổi lợi thế công nghệ thành sản phẩm thực tế, chẳng hạn như sự không chắc chắn trong đầu ra của mô hình, rủi ro của việc tạo ra thông tin không chính xác, và vấn đề minh bạch của mô hình. Những vấn đề này trở nên đặc biệt quan trọng trong các tình huống ứng dụng yêu cầu độ tin cậy rất cao.
Trong bối cảnh này, chúng tôi bắt đầu nghiên cứu về AI Agent, vì AI Agent nhấn mạnh tính toàn diện trong việc giải quyết các vấn đề thực tiễn và tương tác với môi trường. Sự chuyển mình này đánh dấu sự tiến hóa của công nghệ AI từ những mô hình ngôn ngữ thuần túy sang các hệ thống thông minh có khả năng thực sự hiểu, học hỏi và giải quyết các vấn đề trong thực tế. Vì vậy, chúng tôi nhìn thấy hy vọng từ sự phát triển của AI Agent, khi nó dần thu hẹp khoảng cách giữa công nghệ AI và việc giải quyết các vấn đề thực tiễn. Sự tiến hóa của công nghệ AI liên tục định hình lại cấu trúc năng suất, trong khi công nghệ Web3 đang tái cấu trúc các mối quan hệ sản xuất trong nền kinh tế số. Khi ba yếu tố chính của AI: dữ liệu, mô hình và sức mạnh tính toán, hòa quyện với các khái niệm cốt lõi của Web3 như phi tập trung, kinh tế mã thông báo và hợp đồng thông minh, chúng tôi dự đoán sẽ tạo ra một loạt các ứng dụng đổi mới. Trong lĩnh vực giao thoa đầy tiềm năng này, chúng tôi tin rằng, AI Agent với khả năng thực hiện nhiệm vụ một cách tự động, đã thể hiện tiềm năng to lớn trong việc áp dụng quy mô lớn.
Để làm được điều này, chúng tôi bắt đầu nghiên cứu sâu về các ứng dụng đa dạng của AI Agent trong Web3, từ cơ sở hạ tầng Web3, middleware, đến các cấp độ ứng dụng, cũng như thị trường dữ liệu và mô hình, nhằm xác định và đánh giá các loại dự án và bối cảnh ứng dụng tiềm năng nhất, để hiểu sâu hơn về sự kết hợp chặt chẽ giữa AI và Web3.
Làm rõ khái niệm: Giới thiệu và phân loại AI Agent
Giới thiệu cơ bản
Trước khi giới thiệu AI Agent, để giúp độc giả hiểu rõ hơn về sự khác biệt giữa định nghĩa và mô hình của nó, chúng ta sẽ đưa ra một ví dụ thông qua một kịch bản thực tế: giả sử bạn đang lên kế hoạch cho một chuyến đi. Các mô hình ngôn ngữ lớn truyền thống cung cấp thông tin về điểm đến và gợi ý du lịch. Kỹ thuật tạo sinh nâng cao thông qua truy vấn có thể cung cấp nội dung điểm đến phong phú và cụ thể hơn. Còn AI Agent giống như Jarvis trong bộ phim Người Sắt, có thể hiểu nhu cầu và chủ động tìm kiếm chuyến bay và khách sạn dựa trên một câu nói của bạn, thực hiện các thao tác đặt chỗ và thêm lịch trình vào lịch.
Hiện nay, định nghĩa phổ biến về AI Agent trong ngành là hệ thống thông minh có khả năng cảm nhận môi trường và thực hiện hành động tương ứng, thông qua cảm biến để thu thập thông tin môi trường, sau đó xử lý và sử dụng bộ thực thi để tác động đến môi trường (Stuart Russell & Peter Norvig, 2020). Chúng tôi cho rằng, AI Agent là một trợ lý kết hợp các khả năng của LLM, RAG, trí nhớ, lập kế hoạch nhiệm vụ và khả năng sử dụng công cụ. Nó không chỉ cung cấp thông tin đơn thuần mà còn có thể lập kế hoạch, phân tích nhiệm vụ và thực hiện một cách thực sự.
Theo định nghĩa và đặc điểm này, chúng ta có thể nhận thấy AI Agent đã sớm hòa nhập vào cuộc sống của chúng ta, được ứng dụng trong nhiều tình huống khác nhau, chẳng hạn như AlphaGo, Siri, và hệ thống lái tự động cấp độ L5 trở lên của Tesla đều có thể được coi là ví dụ về AI Agent. Những hệ thống này có điểm chung là đều có khả năng cảm nhận thông tin đầu vào từ người dùng bên ngoài và từ đó tạo ra ảnh hưởng tương ứng đến môi trường thực tế.
Lấy ChatGPT làm ví dụ để làm rõ khái niệm, chúng ta cần chỉ ra rằng Transformer là kiến trúc kỹ thuật cấu thành mô hình AI, GPT là chuỗi mô hình phát triển dựa trên kiến trúc này, trong khi GPT-1, GPT-4, GPT-4o lần lượt đại diện cho các phiên bản của mô hình ở các giai đoạn phát triển khác nhau. ChatGPT thì T là AI Agent tiến hóa dựa trên mô hình GPT.
Phân loại tổng quan
Hiện tại, thị trường AI Agent chưa hình thành được tiêu chuẩn phân loại thống nhất, chúng tôi đã phân loại 204 dự án AI Agent trong thị trường Web2+Web3 bằng cách gán nhãn cho từng dự án dựa trên những nhãn nổi bật của chúng, và chia thành phân loại cấp một và cấp hai. Trong đó, phân loại cấp một bao gồm ba loại: cơ sở hạ tầng, tạo nội dung, tương tác người dùng, sau đó được phân loại chi tiết theo các trường hợp sử dụng thực tế của chúng:
Cơ sở hạ tầng: Loại này tập trung vào việc xây dựng các nội dung cơ bản hơn trong lĩnh vực Agent, bao gồm nền tảng, mô hình, dữ liệu, công cụ phát triển, cũng như các dịch vụ B2B đã trưởng thành và ứng dụng cơ bản hơn.
Công cụ phát triển: Cung cấp cho các nhà phát triển các công cụ và khung hỗ trợ để xây dựng AI Agent.
Lớp xử lý dữ liệu: Xử lý và phân tích dữ liệu ở các định dạng khác nhau, chủ yếu được sử dụng để hỗ trợ ra quyết định, cung cấp nguồn cho việc đào tạo.
Lớp huấn luyện mô hình: Cung cấp dịch vụ huấn luyện mô hình cho AI, bao gồm suy diễn, xây dựng mô hình, thiết lập, v.v.
Dịch vụ B端: Chủ yếu hướng đến người dùng doanh nghiệp, cung cấp các giải pháp dịch vụ doanh nghiệp, chuyên biệt và tự động hóa.
Nền tảng tập hợp: Nền tảng tích hợp nhiều dịch vụ và công cụ AI Agent.
Loại tương tác: Tương tự như loại tạo nội dung, sự khác biệt nằm ở việc tương tác hai chiều liên tục. Agent loại tương tác không chỉ tiếp nhận và hiểu nhu cầu của người dùng mà còn cung cấp phản hồi thông qua các công nghệ như xử lý ngôn ngữ tự nhiên (NLP), thực hiện tương tác hai chiều với người dùng.
Loại hình đồng hành cảm xúc: Cung cấp hỗ trợ cảm xúc và đồng hành từ AI Agent.
Loại GPT: AI Agent dựa trên mô hình GPT (Transformer tiền huấn luyện sinh).
Tìm kiếm: Tập trung vào chức năng tìm kiếm, cung cấp các Agent chủ yếu để truy xuất thông tin chính xác hơn.
Nội dung tạo ra: Các dự án loại này tập trung vào việc tạo ra nội dung, sử dụng công nghệ mô hình lớn để tạo ra nhiều hình thức nội dung khác nhau dựa trên chỉ dẫn của người dùng, được chia thành bốn loại: tạo văn bản, tạo hình ảnh, tạo video và tạo âm thanh.
Phân tích tình trạng phát triển của tác nhân AI Web2
Theo thống kê của chúng tôi, sự phát triển của AI Agent trong Internet truyền thống Web2 thể hiện rõ ràng xu hướng tập trung theo lĩnh vực. Cụ thể, khoảng hai phần ba các dự án tập trung vào lĩnh vực cơ sở hạ tầng, trong đó chủ yếu là các dịch vụ B2B và công cụ phát triển, chúng tôi cũng đã thực hiện một số phân tích về hiện tượng này.
Ảnh hưởng của độ trưởng thành công nghệ: Các dự án hạ tầng chiếm ưu thế trước tiên nhờ vào độ trưởng thành công nghệ của chúng. Những dự án này thường được xây dựng trên các công nghệ và khung đã được kiểm nghiệm qua thời gian, từ đó giảm bớt độ khó và rủi ro trong phát triển. Tương đương với "cái xẻng" trong lĩnh vực AI, cung cấp nền tảng vững chắc cho việc phát triển và ứng dụng AI Agent.
Sự thúc đẩy của nhu cầu thị trường: Một yếu tố quan trọng khác là nhu cầu thị trường. So với thị trường tiêu dùng, nhu cầu về công nghệ AI từ thị trường doanh nghiệp cấp thiết hơn, đặc biệt trong việc tìm kiếm các giải pháp nâng cao hiệu quả hoạt động và giảm chi phí. Đồng thời, đối với các nhà phát triển, dòng tiền từ doanh nghiệp tương đối ổn định, có lợi cho việc phát triển các dự án tiếp theo.
Giới hạn của các trường hợp ứng dụng: Đồng thời, chúng tôi nhận thấy rằng các ứng dụng AI tạo nội dung trên thị trường B2B có trường hợp ứng dụng tương đối hạn chế. Do tính không ổn định của sản phẩm, các doanh nghiệp có xu hướng ưa chuộng những ứng dụng có khả năng nâng cao năng suất ổn định. Điều này dẫn đến tỷ lệ của AI tạo nội dung trong kho dự án tương đối nhỏ.
Xu hướng này phản ánh sự trưởng thành của công nghệ, nhu cầu thị trường và các yếu tố thực tế của các tình huống ứng dụng. Với sự tiến bộ không ngừng của công nghệ AI và nhu cầu thị trường ngày càng rõ ràng, chúng tôi dự đoán rằng cấu trúc này có thể sẽ có sự điều chỉnh, nhưng các loại hạ tầng vẫn sẽ là nền tảng vững chắc cho sự phát triển của AI Agent.
Phân tích dự án dẫn đầu Web2 của AI Agent
Chúng tôi sẽ đi sâu vào một số dự án AI Agent hiện tại trên thị trường Web2 và phân tích chúng, với ba dự án Character AI, Perplexity AI, Midjourney làm ví dụ.
Character AI:
Giới thiệu sản phẩm: Character.AI cung cấp hệ thống đối thoại dựa trên trí tuệ nhân tạo và công cụ tạo nhân vật ảo. Nền tảng của họ cho phép người dùng tạo, đào tạo và tương tác với các nhân vật ảo, những nhân vật có khả năng đối thoại bằng ngôn ngữ tự nhiên và thực hiện các nhiệm vụ cụ thể.
Phân tích dữ liệu: Character.AI có lượng truy cập 277 triệu vào tháng 5, nền tảng này có hơn 3,5 triệu người dùng hoạt động hàng ngày, trong đó phần lớn người dùng độ tuổi từ 18 đến 34, cho thấy đặc điểm của nhóm người dùng trẻ. Character AI đã thể hiện xuất sắc trên thị trường vốn, hoàn thành việc huy động 150 triệu USD, với định giá đạt 1 tỷ USD do a16z dẫn dắt.
Phân tích kỹ thuật: Character AI đã ký thỏa thuận cấp phép không độc quyền với công ty mẹ của Google là Alphabet để sử dụng mô hình ngôn ngữ lớn của mình, điều này cho thấy Character AI sử dụng công nghệ tự phát triển. Đáng chú ý, các nhà sáng lập của công ty là Noam Shazeer và Daniel De Freitas đã tham gia phát triển mô hình ngôn ngữ đối thoại Llama của Google.
Perplexity AI:
Giới thiệu sản phẩm: Perplexity có khả năng thu thập và cung cấp câu trả lời chi tiết từ Internet. Thông qua việc trích dẫn và liên kết tham khảo, nó đảm bảo tính đáng tin cậy và độ chính xác của thông tin, đồng thời giáo dục và hướng dẫn người dùng thực hiện các câu hỏi tiếp theo và tìm kiếm từ khóa, đáp ứng nhu cầu truy vấn đa dạng của người dùng.
Phân tích dữ liệu: Số lượng người dùng hoạt động hàng tháng của Perplexity đã đạt 10 triệu, với lượng truy cập trên ứng dụng di động và máy tính để bàn tăng 8,6% trong tháng Hai, thu hút khoảng 50 triệu người dùng. Trên thị trường vốn, Perplexity AI gần đây đã công bố đã nhận được 62,7 triệu USD tài trợ, với định giá đạt 1,04 tỷ USD, do Daniel Gross dẫn dắt, với sự tham gia của Stan Druckenmiller và NVIDIA.
Phân tích kỹ thuật: Mô hình chính mà Perplexity sử dụng là GPT-3.5 đã được tinh chỉnh, cùng với hai mô hình lớn được tinh chỉnh từ mô hình lớn mã nguồn mở: pplx-7b-online và pplx-70b-online. Mô hình phù hợp cho nghiên cứu học thuật chuyên nghiệp và