Інтеграція штучного інтелекту та Web3: нові можливості для побудови розподіленої інфраструктури штучного інтелекту

AI+Web3: Вежі та площі

ТЛ; ДОКТОР

  1. Проекти Web3 з концепцією ШІ стали привабливими для залучення капіталу на первинних та вторинних ринках.

  2. Можливості Web3 в галузі ШІ виявляються в: використанні розподілених стимулів для координації потенційних постачальників у довгому хвості — через дані, зберігання та обчислення; одночасно створюючи відкриті моделі та децентралізований ринок для AI Agent.

  3. ШІ в індустрії Web3 в основному використовується для фінансів на ланцюгу (криптоплатежі, торгівля, аналіз даних) та допомоги в розробці.

  4. Корисність AI+Web3 проявляється у взаємодоповненні обох: Web3 має надію протистояти централізації AI, а AI має надію допомогти Web3 вийти за межі.

! AI+Web3: Вежі та Плази

Вступ

За останні два роки розвиток ШІ наче натиснули на кнопку прискорення. Хвиля, спричинена Chatgpt, не лише відкрила новий світ генеративного штучного інтелекту, але й викликала прилив у сфері Web3.

Під впливом концепції ШІ фінансування крипторинку помітно зросло. Лише за перше півріччя 2024 року 64 проекти Web3+AI завершили фінансування, серед яких операційна система на базі штучного інтелекту Zyber365 отримала максимальне фінансування в 100 мільйонів доларів на раунді A.

Ринок другого рівня став більш процвітаючим, дані з криптоагрегатора Coingecko показують, що всього за трохи більше року загальна капіталізація AI-сектора досягла 48,5 мільярда доларів, а добовий обсяг торгів наближається до 8,6 мільярда доларів. Очевидно, що позитивні новини, пов'язані з прогресом у провідних AI-технологіях, мають вагомий вплив: після випуску моделі OpenAI Sora для перетворення тексту в відео середня ціна в секторі AI зросла на 151%. Ефект AI також поширюється на один з сегментів криптовалют, що залучають капітал - Meme: перший концепт MemeCoin з AI Agent - GOAT, швидко здобув популярність і отримав оцінку в 1,4 мільярда доларів, успішно запустивши бум AI Meme.

Дослідження та теми, пов'язані з AI+Web3, також набирають популярності: від AI+Depin до AI Memecoin, а потім до поточних AI Agent та AI DAO, емоції FOMO вже не встигають за швидкістю обертання нових наративів.

AI+Web3, ця комбінація термінів, наповнена гарячими грошима, трендами та фантазіями про майбутнє, неминуче сприймається як шлюб, влаштований капіталом, і нам, здається, важко розпізнати під цим розкішним халатом, чи це арена спекулянтів, чи переддень вибуху світанку?

Щоб відповісти на це питання, одне з ключових роздумів для обох сторін: чи стане краще з присутністю один одного? Чи можна виграти від моделей один одного? У цій статті ми також намагаємося оглянути цю картину, спираючись на досягнення попередників: як Web3 може відігравати роль на всіх етапах технологічного стеку AI, і яку нову життєздатність AI може принести Web3?

Частина 1 Які можливості для Web3 під AI стеком?

Перед тим, як розпочати цю тему, нам потрібно зрозуміти технологічний стек великих моделей AI:

Використовуючи більш зрозумілу мову, щоб описати весь процес: «велика модель» подібна до людського мозку. На початковій стадії цей мозок належить немовляті, яке щойно з'явилося на світ, і потребує спостереження та поглинання величезної кількості інформації з навколишнього світу, щоб зрозуміти цей світ. Це стадія «збирання» даних. Оскільки комп'ютери не мають таких сенсорних можливостей, як у людей, на етапі навчання великі обсяги не маркованої інформації ззовні потрібно перетворити за допомогою «попередньої обробки» у формат інформації, зрозумілий і придатний для використання комп'ютером.

Після введення даних ШІ за допомогою «навчання» створює модель, яка має здатність до розуміння та прогнозування, що можна вважати процесом, у якому немовля поступово розуміє та вивчає навколишній світ; параметри моделі подібні до мовних здібностей немовляти, які постійно коригуються під час навчання. Коли вміст навчання починає розділятися на окремі предмети, або коли під час спілкування з людьми надходять відгуки та проводяться корекції, це переходить до етапу «доладжування» великої моделі.

Діти, які поступово ростуть і навчаються говорити, можуть розуміти значення і виражати свої почуття та думки в нових діалогах. Ця стадія схожа на «висновок» великої AI-моделі, яка здатна передбачати та аналізувати нові мовні та текстові входи. Діти виражають почуття, описують об'єкти та вирішують різні проблеми за допомогою мовних навичок, що також нагадує стадію висновку великої AI-моделі після завершення навчання та впровадження в різні спеціалізовані завдання, такі як класифікація зображень, розпізнавання мови тощо.

А AI Agent стає ближчим до наступної форми великої моделі — здатної самостійно виконувати завдання та переслідувати складні цілі, яка не лише має мислення, але також може пам'ятати, планувати та використовувати інструменти для взаємодії зі світом.

Зараз, враховуючи проблеми, пов'язані з AI в різних стекових рішеннях, Web3 наразі попередньо сформував багаторівневу, взаємопов'язану екосистему, що охоплює всі етапи процесу AI моделей.

! AI+Web3: Вежі та Квадрати

Один. Базовий рівень: обчислювальна потужність та дані Airbnb

Потужність

Наразі найвищою вартістю AI є обчислювальна потужність та енергія, необхідні для навчання моделей і моделювання висновків.

Один з прикладів: для навчання великої мовної моделі великої технологічної компанії потрібно 16000 високопродуктивних графічних процесорів (GPU), вироблених відомим виробником чіпів, протягом 30 днів. Ціна за одиницю версії з 80 ГБ коливається від 30 000 до 40 000 доларів США, що вимагає інвестицій у обчислювальне обладнання (GPU + мережеві чіпи) у розмірі від 400 до 700 мільйонів доларів. Крім того, щомісяця навчання споживає 1,6 мільярда кіловат-годин, а витрати на енергію складають близько 20 мільйонів доларів на місяць.

Розвантаження AI обчислювальної потужності також є однією з першочергових областей перетворення Web3 та AI — DePin (децентралізована мережа фізичної інфраструктури). Наразі сайт даних DePin Ninja вже представив понад 1400 проектів, серед яких проекти, що представляють спільний доступ до GPU обчислювальної потужності, включають io.net, Aethir, Akash, Render Network тощо.

Основна логіка полягає в тому, що платформа дозволяє особам або юридичним особам, які мають вільні ресурси GPU, без необхідності отримання дозволу вносити свій обчислювальний потенціал в децентралізованій манері. Це робиться через онлайн-ринок, подібний до платформи спільної економіки, що підвищує рівень використання недостатньо використовуваних ресурсів GPU, а кінцеві користувачі отримують більш ефективні обчислювальні ресурси за нижчою ціною. Крім того, механізм стейкінгу також забезпечує, що у випадку порушення механізму контролю якості або переривання мережі, постачальники ресурсів підлягають відповідному покаранню.

Його особливістю є:

  • Збір невикористаних ресурсів GPU: постачальники переважно складаються з незалежних середніх та малих дата-центрів, крипто-майнінгових фермерів та інших операторів надлишкових обчислювальних ресурсів, а механізм консенсусу - це PoS для майнінгового обладнання, такого як FileCoin та ETH-майнери. В даний час також є проекти, які прагнуть запустити обладнання з нижчим порогом входження, такі як exolab, що використовує MacBook, iPhone, iPad та інші локальні пристрої для створення мережі обчислювальних потужностей для інфраструктури великих моделей.

  • В умовах довгого хвоста ринку обчислювальної потужності AI:

a. «З технологічної точки зору» децентралізований ринковий потужності більше підходить для етапів висновків. Тренування більше залежить від обробної здатності даних, яку забезпечують супер великі кластерні масштаби GPU, тоді як висновки потребують відносно низької продуктивності обчислень GPU, як Aethir, що зосереджується на рендерингу з низькою затримкою та застосуваннях AI для висновків.

b. "З точки зору попиту" замовники з невеликою обчислювальною потужністю не будуть самостійно тренувати свої великі моделі, а лише виберуть оптимізацію та доопрацювання навколо кількох провідних великих моделей, і ці сценарії природно підходять для розподілених неактивних обчислювальних ресурсів.

  • Децентралізоване володіння: Технологічне значення блокчейну полягає в тому, що власники ресурсів завжди зберігають контроль над своїми ресурсами, гнучко налаштовуючи їх відповідно до потреб і отримуючи прибуток.

Дані

Дані є основою ШІ. Якщо немає даних, обчислення стає марним, як водорості на поверхні води, а зв'язок між даними та моделлю нагадує відомий вислів "Сміття на вході, сміття на виході". Кількість даних та якість їх введення визначають фінальну якість виходу моделі. Щодо навчання сучасних моделей ШІ, дані визначають мовні можливості моделі, її здатність до розуміння, навіть цінності та людські прояви. Наразі проблеми з потребою в даних для ШІ насамперед зосереджені на чотирьох аспектах:

  • Голод даних: Тренування AI моделей залежить від великої кількості даних. Відкриті дані показують, що одна відома AI компанія тренувала свій великий мовний модель з параметрами на рівні трильйонів.

  • Якість даних: з розвитком штучного інтелекту та інтеграцією в різні галузі з'являються нові вимоги до якості даних, зокрема до своєчасності даних, різноманітності даних, спеціалізації вертикальних даних та нових джерел даних, таких як емоції в соціальних медіа.

  • Питання конфіденційності та відповідності: наразі різні країни та компанії поступово звертають увагу на важливість якісних наборів даних і вводять обмеження на збір наборів даних.

  • Високі витрати на обробку даних: велика кількість даних, складний процес обробки. Згідно з відкритими даними, більше 30% витрат на дослідження та розробки в компаніях, що займаються ШІ, йдуть на збір та обробку базових даних.

Наразі рішення Web3 проявляються в таких чотирьох аспектах:

  1. Збір даних: можливість безкоштовно надати дані з реального світу швидко вичерпується, витрати компаній з виробництва штучного інтелекту на дані зростають з року в рік. Але водночас ці витрати не повертаються до справжніх постачальників даних, платформи повністю користуються створенням вартості, яке приносить дані, як, наприклад, одна соціальна платформа отримала загальний дохід у 203 мільйони доларів США шляхом підписання угод про ліцензування даних з компаніями штучного інтелекту.

Дозволити справжнім користувачам також брати участь у створенні цінності, яку приносить дані, а також отримувати більш приватні та цінні дані від користувачів за низькою вартістю через розподілену мережу та механізми заохочення - це бачення Web3.

  • Grass є децентралізованим рівнем даних та мережею, де користувачі можуть запускати вузли Grass, вносячи свій вільний пропускну здатність і ретранслюючи трафік для збору реальних даних з усього інтернету та отримувати токенні винагороди.

  • Vana впроваджує унікальну концепцію пулу ліквідності даних (DLP), де користувачі можуть завантажувати свої приватні дані (такі як історія покупок, звички перегляду, активність у соціальних мережах тощо) до конкретного DLP та гнучко обирати, чи надавати ці дані для використання конкретним третім особам.

  • У PublicAI користувачі можуть використовувати #AI或#Web3 як категорійний ярлик на певній соціальній платформі та @PublicAI для збору даних.

  1. Попередня обробка даних: під час обробки даних штучного інтелекту, оскільки зібрані дані зазвичай є шумними та містять помилки, їх необхідно очистити та перетворити в придатний формат перед навчанням моделі. Це включає в себе стандартизацію, фільтрацію та обробку відсутніх значень, що є повторюваними завданнями. Ця стадія є однією з небагатьох ручних етапів в індустрії штучного інтелекту, яка вже призвела до виникнення професії спеціаліста з маркування даних. З підвищенням вимог моделей до якості даних, поріг входження для спеціалістів з маркування даних також зростає, а це завдання природно підходить для децентралізованої системи винагород Web3.
  • Наразі Grass та OpenLayer обидва розглядають можливість приєднання до цього ключового етапу позначення даних.

  • Synesis提出 концепцію «Train2earn», підкреслюючи якість даних; користувачі можуть отримувати винагороду за надання позначених даних, коментарів або інших форм внеску.

  • Проект маркування даних Sapien перетворює завдання маркування на гру та дозволяє користувачам ставити на кон бали для заробітку більшої кількості балів.

  1. Конфіденційність даних та безпека: необхідно прояснити, що конфіденційність даних та безпека є двома різними поняттями. Конфіденційність даних стосується обробки чутливих даних, тоді як безпека даних захищає інформацію від несанкціонованого доступу, знищення та крадіжки. Відповідно, переваги технологій конфіденційності Web3 та потенційні сценарії застосування проявляються в двох аспектах: (1) навчання на чутливих даних; (2) співпраця з даними: кілька власників даних можуть спільно брати участь у навчанні ШІ, не ділячись своїми оригінальними даними.

Поточні популярні технології конфіденційності в Web3 включають:

  • Довірене виконуване середовище(TEE), наприклад, Super Protocol.

  • Повна гомоморфна криптографія (FHE), наприклад BasedAI, Fhenix.io або Inco Network.

  • Технологія нульового знання (zk), така як Reclaim Protocol, використовує технологію zkTLS, щоб генерувати доказ нульового знання для HTTPS-трафіку, дозволяючи користувачам безпечно імпортувати активності, репутацію та ідентифікаційні дані з зовнішніх сайтів, не розкриваючи чутливу інформацію.

Проте, наразі ця сфера все ще на ранній стадії, більшість проектів все ще перебувають у стадії дослідження, нинішня проблема полягає в тому, що витрати на обчислення занадто високі, деякі приклади:

  • Фреймворк zkML EZKL потребує приблизно 80 хвилин для генерації доказу моделі 1M-nanoGPT.

  • Згідно з даними Modulus Labs, витрати на zkML перевищують витрати на чисті обчислення більш ніж у 1000 разів.

  1. Зберігання даних: після отримання даних також потрібно місце для їх зберігання в ланцюзі, а також для LLM, створеного з використанням цих даних. Основною проблемою є доступність даних (DA), а до оновлення Danksharding в Ethereum його пропускна спроможність становила 0,08 МБ. Тим часом, навчання AI-моделей і реальний інференс зазвичай потребують пропускної спроможності даних від 50 до 100 ГБ на секунду. Така величина розриву робить існуючі рішення на ланцюзі нездатними впоратися з "ресурсомісткими AI-додатками".
  • 0g.AI є представником цієї категорії
Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • 4
  • Поділіться
Прокоментувати
0/400
ApeEscapeArtistvip
· 07-11 12:17
Майбутнє виглядає перспективно
Переглянути оригіналвідповісти на0
LayerZeroHerovip
· 07-11 12:05
Тільки взаємодоповнюючи один одного, можна досягти спільного успіху.
Переглянути оригіналвідповісти на0
ShadowStakervip
· 07-11 12:00
Напрямок, який варто глибше дослідити
Переглянути оригіналвідповісти на0
NotGonnaMakeItvip
· 07-11 11:58
Майбутнє вже тут
Переглянути оригіналвідповісти на0
  • Закріпити