AI та Web3: Децентралізація технологій у застосуванні та можливостях на всіх етапах штучного інтелекту

AI+Web3: Вежі та площі

ТЛ; ДОКТОР

  1. Проекти Web3 з концепцією ШІ стали привабливими для залучення капіталу на первинному та вторинному ринках.

  2. Можливості Web3 в галузі штучного інтелекту виявляються в: використанні розподілених стимулів для координації потенційних постачальників у довгому хвості — між даними, зберіганням і обчисленнями; одночасно створюючи відкриту модель та децентралізований ринок AI Agent.

  3. Основні сфери використання ШІ в індустрії Web3 - це фінанси на базі блокчейна (криптооплата, торгівля, аналіз даних) та допоміжна розробка.

  4. Корисність AI+Web3 проявляється в їхній взаємодоповнювальності: Web3 обіцяє протистояти централізації AI, а AI обіцяє допомогти Web3 вийти за межі.

! AI+Web3: Вежі та Плази

Вступ

Останні два роки розвиток ШІ виглядає так, ніби натиснули кнопку прискорення; ефект метелика, викликаний Chatgpt, не тільки відкрив новий світ генеративного штучного інтелекту, але й створив потужні хвилі у Web3.

Під впливом концепції ШІ фінансування на крипторинку, що сповільнюється, помітно зросло. Статистика показує, що лише в першій половині 2024 року 64 проекти Web3+AI завершили фінансування, а операційна система на основі штучного інтелекту Zyber365 у раунді A досягла максимального обсягу фінансування в 100 мільйонів доларів.

Ринок другого рівня стає більш процвітаючим, дані з криптоагрегаторів показують, що всього за трохи більше ніж рік загальна капіталізація сектора AI досягла 48,5 мільярдів доларів, а обсяг торгів за 24 години наближається до 8,6 мільярдів доларів; позитивні зміни, викликані прогресом у основних AI технологіях, очевидні, після випуску моделі OpenAI Sora для перетворення тексту на відео середня ціна в секторі AI зросла на 151%; ефект AI також поширився на один з секторів криптовалют, що залучають капітал, Meme: перша концепція AI Agent MemeCoin — GOAT швидко стала популярною і отримала оцінку в 1,4 мільярда доларів, успішно розпочавши бум AI Meme.

Дослідження та теми, пов'язані з AI+Web3, також набирають популярності: від AI+Depin до AI Memecoin, а тепер до поточних AI Agent та AI DAO, емоція FOMO вже не встигає за швидкістю змін у нових наративів.

AI+Web3, ця комбінація термінів, наповнена гарячими грошима, трендами та майбутніми фантазіями, неминуче сприймається як шлюб, укладений капіталом, і нам, здається, важко розрізнити, чи є це справжнім полем для спекулянтів, чи переддень вибуху світанку?

Щоб відповісти на це питання, важливо розглянути, чи стане краще для обох сторін? Чи можна отримати вигоду з моделі один одного? У цій статті ми також намагаємося спостерігати за цим контекстом, спираючись на досвід попередників: як Web3 може діяти на всіх етапах технологічного стеку AI, і що нового AI може принести Web3?

Частина 1. Які можливості має Web3 під стеком AI?

Перед тим як розпочати цю тему, нам потрібно зрозуміти технологічний стек великих моделей штучного інтелекту:

Використовуючи більш зрозумілу мову, щоб пояснити весь процес: «велика модель» схожа на людський мозок. На початковому етапі цей мозок належить новонародженій дитині, яка потребує спостереження та споживання величезної кількості інформації з навколишнього світу, щоб зрозуміти цей світ. Це етап «збору» даних; оскільки комп'ютер не має таких сенсорів, як зір і слух, на етапі навчання велика кількість не маркованої інформації ззовні повинна бути перетворена за допомогою «попередньої обробки» у формати інформації, які комп'ютер може зрозуміти та використовувати.

Після введення даних AI за допомогою «навчання» створює модель, яка має здатність розуміти і прогнозувати, що можна вважати процесом, схожим на поступове розуміння і навчання дитини зовнішньому світу; параметри моделі подібні до мовних здібностей дитини, які постійно коригуються в процесі навчання. Коли зміст навчання починає спеціалізуватися або отримує зворотний зв'язок від спілкування з людьми і коригується, відбувається етап «тонкої настройки» великої моделі.

Діти, поступово дорослішаючи і навчаючись говорити, можуть розуміти сенс у нових діалогах і виражати свої почуття та думки; цей етап подібний до «міркування» великих AI-моделей, які здатні прогнозувати та аналізувати нові мовні та текстові дані. Діти через мовні навички виражають почуття, описують об'єкти та вирішують різні проблеми, що також схоже на те, як великі AI-моделі, завершивши навчання, застосовуються на етапі міркування для виконання різних специфічних завдань, таких як класифікація зображень, розпізнавання мови тощо.

А AI Agent наближається до наступної форми великої моделі — здатної незалежно виконувати завдання та переслідувати складні цілі, яка має не лише здатність до мислення, але й може запам'ятовувати, планувати та використовувати інструменти для взаємодії зі світом.

На даний момент, з огляду на проблеми AI в різних стекових рішеннях, Web3 наразі поступово формує багаторівневу, взаємопов'язану екосистему, що охоплює всі етапи процесу моделювання AI.

! AI+Web3: Вежі та Квадрати

Один. Базовий рівень: обчислювальна потужність і дані Airbnb

Потужність

На сьогодні одним з найбільших витрат на ШІ є обчислювальні потужності та енергія, необхідні для навчання моделей та моделей висновку.

Один приклад: для навчання Meta LLAMA3 потрібно 16000 H100GPU, вироблених NVIDIA (це топовий графічний процесор, спеціально розроблений для штучного інтелекту та високопродуктивних обчислювальних навантажень). Навчання займає 30 днів. Ціна одного з них в версії 80 ГБ коливається від 30 000 до 40 000 доларів, що потребує інвестицій у обчислювальне обладнання (GPU + мережеві чіпи) у розмірі 4-7 мільярдів доларів, при цьому щомісячне навчання вимагає споживання 1,6 мільярда кіловат-годин, а витрати на енергію складають близько 20 мільйонів доларів на місяць.

Розвантаження обчислювальної потужності AI є саме тією областю, де Web3 вперше перетинається з AI — DePin (децентралізована мережа фізичної інфраструктури). Наразі статистичний сайт вже представив понад 1400 проєктів, серед яких проєкти, що представляють спільне використання GPU, включають io.net, Aethir, Akash, Render Network тощо.

Основна логіка полягає в тому, що платформа дозволяє особам або суб'єктам, які мають невикористані ресурси GPU, у децентралізований спосіб без дозволу вносити свій обчислювальний потенціал. Завдяки онлайн-ринку покупців та продавців, подібному до Uber або Airbnb, підвищується використання недооброблених ресурсів GPU, а кінцеві користувачі отримують більш ефективні обчислювальні ресурси за нижчою вартістю; одночасно механізм стейкінгу також забезпечує відповідне покарання для постачальників ресурсів у разі порушення механізму контролю якості або переривання мережі.

Його особливості полягають у:

  • Збір вільних ресурсів GPU: постачальники, в основному, це незалежні малі та середні дата-центри, оператори надмірних обчислювальних ресурсів криптодобувних майданчиків тощо, з надмірними обчислювальними ресурсами, обладнання для видобутку з механізмом консенсусу PoS, такі як FileCoin та ETH майнери. В даний час існують також проекти, які прагнуть запустити обладнання з нижчим порогом входу, такі як exolab, що використовує MacBook, iPhone, iPad та інші локальні пристрої для створення обчислювальної мережі для запуску великих моделей інференції.

  • Стосовно довгого хвоста ринку обчислювальної потужності ІШ

a. "З технічної точки зору" децентралізований ринок обчислювальної потужності більше підходить для етапів інференції. Навчання більше залежить від обробної здатності даних, яку забезпечують надвеликими кластерами GPU, тоді як для інференції вимоги до обчислювальної потужності GPU відносно нижчі, як, наприклад, Aethir, що спеціалізується на рендерингу з низькою затримкою та застосуваннях AI для інференції.

b. "З точки зору попиту" замалі споживачі обчислювальних потужностей не будуть окремо тренувати свої великі моделі, а просто виберуть оптимізацію та доопрацювання навколо кількох основних великих моделей, а ці ситуації природно підходять для розподілених неробочих ресурсів обчислювальної потужності.

  • Децентралізована власність: технологічне значення блокчейну полягає в тому, що власники ресурсів завжди зберігають контроль над своїми ресурсами, гнучко налаштовуючи їх відповідно до потреби та отримуючи прибуток.

Дані

Дані є основою штучного інтелекту. Якщо немає даних, обчислення стає безглуздим, як водяна рослина, а зв'язок між даними та моделлю подібний до приказки "Сміття на вході, сміття на виході". Кількість даних і якість введення визначають якість виходу фінальної моделі. У навчанні сучасних AI моделей дані визначають мовні можливості моделі, здатність до розуміння, а також цінності та людяність. Наразі основні труднощі в потребах даних для AI зосереджені на чотирьох аспектах:

  • Голод даних: навчання AI моделей залежить від великої кількості вхідних даних. Відкриті дані показують, що OpenAI навчала GPT-4 з параметрами на трильйонному рівні.

  • Якість даних: з поєднанням ШІ та різних галузей, своєчасність даних, різноманітність даних, професіоналізм галузевих даних, а також нові джерела даних, такі як емоції в соціальних мережах, висувають нові вимоги до їхньої якості.

  • Проблеми конфіденційності та відповідності: в даний час різні країни та компанії поступово усвідомлюють важливість якісних наборів даних і вводять обмеження на збори наборів даних.

  • Витрати на обробку даних високі: обсяги даних великі, процес обробки складний. Відкриті дані показують, що більше 30% витрат на дослідження та розробки компаній AI йдуть на первинний збір та обробку даних.

Наразі рішення web3 втілюються в чотирьох основних аспектах:

  1. Збір даних: можливість безкоштовно отримувати реальні дані з мережі швидко вичерпується, витрати компаній з розробки штучного інтелекту на дані щорічно зростають. Але водночас ці витрати не повертаються до справжніх постачальників даних, платформи повністю користуються цінністю, яку створюють дані, наприклад, Reddit отримав загалом 203 мільйони доларів доходу завдяки угодам з ліцензування даних з компаніями штучного інтелекту.

Залучення справжніх користувачів до створення вартості, яку приносить дані, а також отримання більш приватних і цінних даних від користувачів за допомогою розподіленої мережі та механізмів стимулювання, є баченням Web3.

  • Grass є децентралізованим рівнем даних і мережею, яка дозволяє користувачам, запускаючи вузли Grass, вносити свій вільний пропускну здатність та релейний трафік для збору в реальному часі даних з усього Інтернету та отримувати винагороди у токенах;

  • Vana впроваджує унікальну концепцію пули ліквідності даних (DLP), де користувачі можуть завантажувати свої приватні дані (такі як записи покупок, звички перегляду, активність у соціальних мережах тощо) у певний DLP та гнучко обирати, чи надавати ці дані для використання конкретним третім сторонам;

  • У PublicAI користувачі можуть використовувати #AI 或#Web3 як категорію, а також @PublicAI для збору даних на X.

  1. Попередня обробка даних: У процесі обробки даних AI, оскільки зібрані дані зазвичай є шумними та містять помилки, їх необхідно очистити та перетворити в придатний формат до навчання моделі, що включає стандартизацію, фільтрацію та обробку пропущених значень. Цей етап є одним з небагатьох ручних етапів в індустрії AI, що призвело до виникнення професії фахівця з маркування даних. З підвищенням вимог моделі до якості даних, поріг входу для фахівців з маркування даних також підвищується, а це завдання природно підходить для децентралізованої системи стимулів Web3.
  • Наразі Grass та OpenLayer обидва розглядають можливість приєднання до цього ключового етапу даних маркування.

  • Synesis запропонував концепцію «Train2earn», підкреслюючи якість даних; користувачі можуть отримувати винагороду за надання розмічених даних, коментарів або інших форм внеску.

  • Проект маркування даних Sapien ігрофікує завдання маркування та дозволяє користувачам ставити бали для заробітку більше балів.

  1. Приватність та безпека даних: важливо уточнити, що приватність та безпека даних є двома різними концепціями. Приватність даних стосується обробки чутливих даних, тоді як безпека даних захищає інформацію від несанкціонованого доступу, знищення та крадіжки. Таким чином, переваги технологій приватності Web3 та потенційні сценарії застосування проявляються в двох аспектах: (1) навчання на чутливих даних; (2) співпраця з даними: кілька власників даних можуть спільно брати участь у навчанні ШІ без необхідності ділитися своїми оригінальними даними.

Поточні поширені технології конфіденційності Web3 включають:

  • Довірене виконуване середовище(TEE), наприклад, Super Protocol;

  • Повна гомоморфна криптографія (FHE), наприклад, BasedAI, Fhenix.io або Inco Network;

  • Технології нульового знання (zk), такі як протокол Reclaim, використовують технологію zkTLS для генерації доказів нульового знання для HTTPS-трафіку, що дозволяє користувачам безпечно імпортувати активність, репутацію та ідентифікаційні дані з зовнішніх сайтів без розкриття чутливої інформації.

Проте, наразі ця сфера все ще перебуває на ранній стадії, більшість проектів все ще знаходяться в процесі дослідження, і однією з нинішніх проблем є занадто високі витрати на обчислення, деякі приклади:

  • zkML фрейм EZKL потребує приблизно 80 хвилин
Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • 6
  • Поділіться
Прокоментувати
0/400
HodlKumamonvip
· 9год тому
Дані говорять! Ця 40% ринкова активність вже перевищила поріг тривоги ведмедя!
Переглянути оригіналвідповісти на0
GateUser-bd883c58vip
· 9год тому
赶紧 увійти в позицію囤点 AI Токен
Переглянути оригіналвідповісти на0
GasFeeBarbecuevip
· 9год тому
Цілком зрозуміло, рано чи пізно ШІ має бути у блокчейні.
Переглянути оригіналвідповісти на0
SchroedingerAirdropvip
· 9год тому
Це все? Концепцію штучного інтелекту вже розігріли до межі.
Переглянути оригіналвідповісти на0
MidnightTradervip
· 9год тому
Ай, є сенс, але це просто концепція, після чого все закінчується.
Переглянути оригіналвідповісти на0
BearMarketSagevip
· 9год тому
Знову робиш ці дурниці
Переглянути оригіналвідповісти на0
  • Закріпити