Web3 khám phá cơ hội AI stack: từ khả năng tính toán chia sẻ đến quyền riêng tư dữ liệu

AI+Web3: Tòa tháp và Quảng trường

TL;DR

  1. Dự án Web3 với khái niệm AI trở thành mục tiêu hút vốn trên thị trường sơ cấp và thứ cấp.

  2. Cơ hội của Web3 trong ngành AI thể hiện ở: sử dụng động lực phân phối để phối hợp các nguồn cung tiềm năng trong đuôi dài ------ qua dữ liệu, lưu trữ và tính toán; đồng thời, xây dựng một mô hình mã nguồn mở và thị trường phi tập trung cho AI Agent.

  3. AI trong ngành Web3 chủ yếu được sử dụng cho tài chính trên chuỗi (thanh toán tiền điện tử, giao dịch, phân tích dữ liệu) và hỗ trợ phát triển.

  4. Tính hữu dụng của AI+Web3 được thể hiện qua sự bổ sung lẫn nhau: Web3 kỳ vọng chống lại sự tập trung hóa của AI, AI kỳ vọng giúp Web3 mở rộng ra bên ngoài.

AI+Web3:Tháp và Quảng trường

Giới thiệu

Trong hai năm qua, sự phát triển của AI như được nhấn nút tăng tốc, cánh bướm do Chatgpt khuấy động không chỉ mở ra một thế giới mới của trí tuệ nhân tạo sinh tạo, mà cũng tạo ra một làn sóng mạnh mẽ ở phía bên kia của Web3.

Dưới sự hỗ trợ của khái niệm AI, việc huy động vốn trong thị trường tiền điện tử đã rõ ràng hơn so với sự chậm lại. Các phương tiện truyền thông thống kê, chỉ trong nửa đầu năm 2024, đã có tổng cộng 64 dự án Web3+AI hoàn thành việc huy động vốn, trong đó hệ điều hành dựa trên trí tuệ nhân tạo Zyber365 đã đạt được số tiền huy động cao nhất là 100 triệu USD trong vòng A.

Thị trường thứ cấp ngày càng sôi động, dữ liệu từ một trang web tổng hợp tiền điện tử cho thấy, chỉ trong hơn một năm, tổng giá trị thị trường của lĩnh vực AI đã đạt 48,5 tỷ USD, khối lượng giao dịch trong 24 giờ gần 8,6 tỷ USD; sự tiến bộ rõ rệt của công nghệ AI mang lại lợi ích rõ ràng, sau khi công ty nào đó phát hành mô hình chuyển đổi văn bản thành video Sora, giá trung bình của lĩnh vực AI đã tăng 151%; hiệu ứng AI cũng lan tỏa đến một trong những lĩnh vực thu hút tiền điện tử, Meme: MemeCoin đầu tiên với khái niệm AI Agent------GOAT đã nhanh chóng nổi tiếng và đạt được định giá 1,4 tỷ USD, thành công trong việc khơi dậy cơn sốt AI Meme.

Nghiên cứu và chủ đề về AI+Web3 cũng đang rất sôi nổi, từ AI+Depin đến AI Memecoin và hiện tại là AI Agent và AI DAO, cảm xúc FOMO đã không theo kịp tốc độ thay đổi của những câu chuyện mới.

AI+Web3, cụm thuật ngữ đầy tiền nóng, cơ hội và ảo tưởng về tương lai này, không tránh khỏi bị người ta coi như một cuộc hôn nhân sắp đặt do vốn đầu tư sắp xếp, dường như chúng ta rất khó phân biệt bên dưới chiếc áo choàng lộng lẫy này, rốt cuộc đây là sân chơi của những kẻ đầu cơ, hay là đêm trước khi bình minh bùng nổ?

Để trả lời câu hỏi này, một suy nghĩ quan trọng đối với cả hai bên là liệu có thể trở nên tốt hơn với nhau không? Liệu có thể hưởng lợi từ mô hình của đối tác không? Trong bài viết này, chúng tôi cũng cố gắng đứng trên vai những người đi trước để xem xét cấu trúc này: Web3 có thể đóng vai trò như thế nào trong từng khâu của ngăn xếp công nghệ AI, và AI có thể mang lại sức sống mới nào cho Web3?

Phần 1: Có cơ hội nào cho Web3 dưới AI Stack?

Trước khi bàn về chủ đề này, chúng ta cần hiểu về công nghệ của mô hình AI lớn:

AI+Web3: Tháp và Quảng trường

Diễn đạt toàn bộ quá trình bằng ngôn ngữ đơn giản hơn: "Mô hình lớn" giống như bộ não của con người. Ở giai đoạn đầu, bộ não này thuộc về một em bé mới sinh, cần quan sát và tiếp nhận khối lượng thông tin khổng lồ từ thế giới xung quanh để hiểu thế giới này, đây là giai đoạn "thu thập" dữ liệu; vì máy tính không có các giác quan như thị giác và thính giác của con người, trước khi huấn luyện, thông tin không gán nhãn lớn từ bên ngoài cần được "tiền xử lý" để chuyển đổi thành định dạng thông tin mà máy tính có thể hiểu và sử dụng.

Sau khi nhập dữ liệu, AI thông qua "đào tạo" đã xây dựng một mô hình có khả năng hiểu và dự đoán, có thể coi đó như quá trình trẻ sơ sinh dần hiểu và học hỏi từ thế giới xung quanh. Các tham số của mô hình giống như khả năng ngôn ngữ của trẻ sơ sinh được điều chỉnh liên tục trong quá trình học tập. Khi nội dung học tập bắt đầu được phân loại, hoặc khi giao tiếp với người khác để nhận phản hồi và điều chỉnh, mô hình sẽ bước vào giai đoạn "tinh chỉnh".

Trẻ em khi lớn lên và học nói sẽ có thể hiểu ý nghĩa và diễn đạt cảm xúc cũng như suy nghĩ của mình trong các cuộc đối thoại mới, giai đoạn này tương tự như "suy diễn" của mô hình AI lớn, mô hình có khả năng dự đoán và phân tích các đầu vào ngôn ngữ và văn bản mới. Trẻ sơ sinh sử dụng khả năng ngôn ngữ để diễn đạt cảm xúc, mô tả đồ vật và giải quyết các vấn đề khác nhau, điều này cũng tương tự như việc mô hình AI lớn áp dụng vào các nhiệm vụ cụ thể như phân loại hình ảnh, nhận diện giọng nói, sau khi hoàn thành quá trình đào tạo và đưa vào sử dụng.

AI Agent thì gần gũi hơn với hình thái tiếp theo của mô hình lớn - có khả năng thực hiện nhiệm vụ độc lập và theo đuổi các mục tiêu phức tạp, không chỉ có khả năng tư duy mà còn có khả năng ghi nhớ, lập kế hoạch, và có thể sử dụng công cụ để tương tác với thế giới.

Hiện tại, nhằm giải quyết các điểm đau của AI trong các lớp khác nhau, Web3 hiện đã hình thành một hệ sinh thái đa tầng, kết nối lẫn nhau, bao gồm tất cả các giai đoạn của quy trình mô hình AI.

Một, Tầng cơ sở: Airbnb về sức mạnh tính toán và dữ liệu

sức mạnh tính toán

Hiện tại, một trong những chi phí cao nhất của AI là sức mạnh tính toán và năng lượng cần thiết để huấn luyện mô hình và suy diễn mô hình.

Một ví dụ là, LLAMA3 của một công ty cần 16.000 H100GPU do một nhà sản xuất cung cấp (đây là một đơn vị xử lý đồ họa hàng đầu được thiết kế đặc biệt cho các khối lượng công việc trí tuệ nhân tạo và tính toán hiệu suất cao.) Mất 30 ngày để hoàn thành việc huấn luyện. Giá đơn vị của phiên bản 80GB là từ 30.000 đến 40.000 đô la Mỹ, điều này cần một khoản đầu tư phần cứng tính toán từ 400 triệu đến 700 triệu đô la Mỹ (GPU + chipset mạng), trong khi việc huấn luyện hàng tháng tiêu tốn 1,6 tỷ kilowatt giờ, chi phí năng lượng hàng tháng gần 20 triệu đô la Mỹ.

Đối với việc giải phóng sức mạnh AI, đây chính là lĩnh vực giao thoa giữa Web3 và AI từ rất sớm------DePin (Mạng hạ tầng vật lý phi tập trung) hiện tại, một trang web dữ liệu đã liệt kê hơn 1400 dự án, trong đó các dự án đại diện cho việc chia sẻ sức mạnh GPU bao gồm io.net, Aethir, Akash, Render Network, v.v.

Logic chính của nó là: nền tảng cho phép cá nhân hoặc tổ chức sở hữu tài nguyên GPU nhàn rỗi đóng góp sức mạnh tính toán của họ một cách phi tập trung mà không cần xin phép, thông qua một thị trường trực tuyến tương tự như các nền tảng gọi xe hoặc cho thuê ngắn hạn với người mua và người bán, nâng cao tỷ lệ sử dụng tài nguyên GPU chưa được khai thác. Người dùng cuối cũng do đó nhận được tài nguyên tính toán hiệu quả với chi phí thấp hơn; đồng thời, cơ chế staking cũng đảm bảo rằng nếu có vi phạm cơ chế kiểm soát chất lượng hoặc ngắt kết nối mạng, người cung cấp tài nguyên sẽ bị xử phạt tương ứng.

Đặc điểm của nó là:

  • Tập hợp tài nguyên GPU nhàn rỗi: Các nhà cung cấp chủ yếu là các trung tâm dữ liệu độc lập vừa và nhỏ từ bên thứ ba, các nhà vận hành mỏ tiền điện tử, v.v. với tài nguyên tính toán dư thừa, cơ chế đồng thuận là phần cứng khai thác PoS, như một mạng lưu trữ và một máy khai thác chuỗi công cộng chính. Hiện tại cũng có các dự án hướng tới việc khởi động các thiết bị có rào cản tham gia thấp hơn, như exolab sử dụng một số thương hiệu laptop, điện thoại di động, máy tính bảng và các thiết bị cục bộ khác để xây dựng mạng lưới tính toán cho việc suy diễn mô hình lớn.

  • Đối mặt với thị trường dài của AI tính toán sức mạnh:

a. "Về mặt công nghệ," thị trường sức mạnh tính toán phi tập trung phù hợp hơn cho các bước suy luận. Việc đào tạo phụ thuộc nhiều hơn vào khả năng xử lý dữ liệu do quy mô cụm cực lớn GPU mang lại, trong khi suy luận yêu cầu hiệu suất tính toán GPU tương đối thấp, chẳng hạn như Aethir tập trung vào công việc kết xuất độ trễ thấp và các ứng dụng suy luận AI.

b. "Về phía nhu cầu" thì các bên có sức mạnh tính toán nhỏ sẽ không tự mình huấn luyện các mô hình lớn, mà chỉ chọn tối ưu hóa và điều chỉnh xung quanh một số mô hình lớn hàng đầu, và những tình huống này tự nhiên rất phù hợp với tài nguyên tính toán nhàn rỗi phân tán.

  • Quyền sở hữu phi tập trung: Ý nghĩa công nghệ của blockchain là chủ sở hữu tài nguyên luôn giữ quyền kiểm soát tài nguyên của mình, điều chỉnh linh hoạt theo nhu cầu và đồng thời thu lợi.

Dữ liệu

Dữ liệu là nền tảng của AI. Nếu không có dữ liệu, tính toán sẽ giống như cây bèo trôi nổi, hoàn toàn vô dụng, và mối quan hệ giữa dữ liệu và mô hình giống như câu tục ngữ "Garbage in, Garbage out", số lượng dữ liệu và chất lượng đầu vào quyết định chất lượng đầu ra cuối cùng của mô hình. Đối với việc đào tạo mô hình AI hiện tại, dữ liệu quyết định khả năng ngôn ngữ, khả năng hiểu biết, thậm chí cả giá trị quan và biểu hiện nhân văn của mô hình. Hiện tại, những khó khăn trong nhu cầu dữ liệu của AI chủ yếu tập trung vào bốn khía cạnh sau:

  • Cơn khát dữ liệu: Việc huấn luyện mô hình AI phụ thuộc vào việc nhập vào một lượng lớn dữ liệu. Tài liệu công khai cho thấy, một công ty đã huấn luyện GPT-4 với số lượng tham số lên đến hàng nghìn tỷ.

  • Chất lượng dữ liệu: Với sự kết hợp của AI và các ngành, tính kịp thời của dữ liệu, sự đa dạng của dữ liệu, tính chuyên môn của dữ liệu theo lĩnh vực, và việc tiếp nhận các nguồn dữ liệu mới nổi như cảm xúc trên mạng xã hội đã đặt ra những yêu cầu mới đối với chất lượng của nó.

  • Vấn đề về quyền riêng tư và tuân thủ: Hiện nay, các quốc gia và doanh nghiệp đang dần nhận ra tầm quan trọng của các bộ dữ liệu chất lượng, và đang tiến hành hạn chế việc thu thập dữ liệu.

  • Chi phí xử lý dữ liệu cao: Khối lượng dữ liệu lớn, quy trình xử lý phức tạp. Tài liệu công khai cho thấy, hơn 30% chi phí nghiên cứu và phát triển của các công ty AI được dùng cho việc thu thập và xử lý dữ liệu cơ bản.

Hiện tại, giải pháp web3 được thể hiện ở bốn khía cạnh sau:

  1. Thu thập dữ liệu: Việc cung cấp miễn phí dữ liệu thực tế bị thu thập đang nhanh chóng cạn kiệt, chi tiêu của các công ty AI cho dữ liệu tăng lên hàng năm. Nhưng đồng thời, chi tiêu này không quay trở lại cho những người đóng góp thực sự cho dữ liệu, các nền tảng hoàn toàn hưởng lợi từ giá trị mà dữ liệu mang lại, chẳng hạn như một nền tảng mạng xã hội đạt tổng doanh thu 203 triệu USD thông qua các thỏa thuận cấp phép dữ liệu với các công ty AI.

Web3 có tầm nhìn là cho phép những người dùng thực sự đóng góp cũng tham gia vào việc tạo ra giá trị từ dữ liệu, cũng như thu thập dữ liệu cá nhân hơn và có giá trị hơn từ người dùng một cách tiết kiệm chi phí thông qua mạng lưới phân tán và cơ chế khuyến khích.

  • Grass là một lớp dữ liệu và mạng phi tập trung, người dùng có thể chạy nút Grass, đóng góp băng thông nhàn rỗi và lưu lượng trung gian để thu thập dữ liệu thời gian thực từ toàn bộ internet, và nhận phần thưởng bằng token;

  • Vana đã giới thiệu một khái niệm độc đáo về hồ chứa tính thanh khoản dữ liệu (DLP), người dùng có thể tải lên dữ liệu cá nhân của họ (như lịch sử mua sắm, thói quen duyệt web, hoạt động trên mạng xã hội, v.v.) vào DLP cụ thể và linh hoạt chọn xem có cho phép các bên thứ ba cụ thể sử dụng những dữ liệu này hay không;

  • Trong PublicAI, người dùng có thể sử dụng #AI 或#Web3 làm thẻ phân loại và @PublicAI trên một nền tảng mạng xã hội để thực hiện việc thu thập dữ liệu.

2、Xử lý dữ liệu: Trong quá trình xử lý dữ liệu của AI, do dữ liệu thu thập thường bị nhiễu và chứa lỗi, nó phải được làm sạch và chuyển đổi thành định dạng có thể sử dụng trước khi huấn luyện mô hình, liên quan đến các nhiệm vụ lặp đi lặp lại như chuẩn hóa, lọc và xử lý các giá trị thiếu. Giai đoạn này là một trong số ít các bước thủ công trong ngành AI, đã phát sinh ra ngành công nghiệp chuyên gia đánh dấu dữ liệu, khi yêu cầu chất lượng dữ liệu của mô hình tăng lên, tiêu chuẩn cho chuyên gia đánh dấu dữ liệu cũng theo đó nâng cao, và nhiệm vụ này tự nhiên phù hợp với cơ chế khuyến khích phi tập trung của Web3.

  • Hiện tại, Grass và OpenLayer đang cân nhắc việc tham gia vào khâu quan trọng này là gán nhãn dữ liệu.

  • Synesis đã đưa ra khái niệm «Train2earn», nhấn mạnh chất lượng dữ liệu, người dùng có thể nhận thưởng bằng cách cung cấp dữ liệu được gán nhãn, bình luận hoặc các hình thức đầu vào khác.

  • Dự án gán nhãn dữ liệu Sapien đã biến nhiệm vụ gán nhãn thành trò chơi, cho phép người dùng đặt cược điểm để kiếm thêm điểm.

  1. Quyền riêng tư và bảo mật dữ liệu: Cần làm rõ rằng quyền riêng tư và bảo mật dữ liệu là hai khái niệm khác nhau. Quyền riêng tư dữ liệu liên quan đến việc xử lý dữ liệu nhạy cảm, trong khi bảo mật dữ liệu bảo vệ thông tin khỏi sự truy cập, phá hủy và đánh cắp trái phép. Do đó, lợi thế công nghệ quyền riêng tư Web3 và các ứng dụng tiềm năng được thể hiện ở hai khía cạnh: (1) Huấn luyện dữ liệu nhạy cảm; (2) Hợp tác dữ liệu: Nhiều chủ sở hữu dữ liệu có thể tham gia đào tạo AI cùng nhau mà không cần chia sẻ dữ liệu gốc của họ.

Công nghệ bảo mật phổ biến hiện nay trong Web3 bao gồm:

  • Môi trường thực thi đáng tin cậy(TEE), chẳng hạn như Super Protocol;

  • Mã hóa hoàn toàn đồng hình (FHE), chẳng hạn như BasedAI, Fhenix.io hoặc Inco Network;

  • Công nghệ zero-knowledge (zk), như giao thức Reclaim sử dụng công nghệ zkTLS, tạo ra chứng minh zero-knowledge cho lưu lượng HTTPS, cho phép người dùng an toàn nhập dữ liệu hoạt động, danh tiếng và danh tính từ các trang web bên ngoài mà không cần tiết lộ thông tin nhạy cảm.

Tuy nhiên, hiện tại lĩnh vực này vẫn ở giai đoạn đầu, hầu hết các dự án vẫn đang trong quá trình khám phá, một trong những khó khăn hiện tại là chi phí tính toán quá cao, một số ví dụ là:

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 5
  • Chia sẻ
Bình luận
0/400
HashBanditvip
· 18giờ trước
trở lại thời kỳ khai thác của tôi, chúng tôi đã có sự phân quyền thực sự... không phải thứ nhảm nhí h hype AI này smh
Xem bản gốcTrả lời0
CoconutWaterBoyvip
· 18giờ trước
Có tiền cùng kiếm nhé~
Xem bản gốcTrả lời0
CryptoTherapistvip
· 19giờ trước
brb đang làm một số bài tập thở sâu để xử lý sự lo âu về việc hợp nhất ai-web3 thật lòng mà nói
Xem bản gốcTrả lời0
SleepTradervip
· 19giờ trước
Lại đang thổi phồng khái niệm nữa à, chỉ là công cụ gọi vốn mà thôi.
Xem bản gốcTrả lời0
shadowy_supercodervip
· 19giờ trước
ai kiếm tiền là xong chuyện
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)