Еволюція технології індексації даних Блокчейн: від Ноди до послуг повного ланцюга з підтримкою ШІ
1. Вступ
В останні роки децентралізовані додатки (dApp) в сфері Блокчейн бурхливо розвиваються, від ранніх фінансових, ігрових та соціальних додатків до сьогоднішнього багатогранного екосистеми мульти-ланцюгів. У цьому процесі джерела даних та способи доступу, на яких покладається dApp, також постійно еволюціонують.
У 2024 році штучний інтелект (AI) та Web3 стануть гарячими темами. AI-системи потребують величезних обсягів даних для постійного навчання та еволюції, так само як рослини потребують сонця та вологи для здорового росту. Без підтримки даними навіть найсучасніші алгоритми AI не зможуть продемонструвати свою справжню інтелектуальність та ефективність.
Ця стаття детально аналізує еволюцію індексації даних Блокчейн під кутом зору доступності даних у Блокчейн в процесі розвитку галузі. Ми також порівняємо традиційний протокол індексації даних The Graph з новими протоколами сервісу даних Блокчейн Chainbase та Space and Time, обговорюючи подібності та відмінності цих нових протоколів, що поєднують технології ШІ в сервісах даних та архітектурі продуктів.
2. Складність та простота індексації даних: від ноди Блокчейн до бази даних усієї ланцюга
2.1 Джерело даних: Блокчейн Нода
Основою Блокчейн є децентралізована мережа, що складається з безлічі Нод, кожна з яких зберігає повну копію даних Блокчейн. Проте для звичайних користувачів створення та обслуговування Ноди не є простим завданням, адже воно вимагає професійних навичок і стикається з високими витратами на апаратуру та пропускну здатність. Водночас, можливості запиту звичайних Нод обмежені, що ускладнює задоволення потреб розробників.
Щоб вирішити цю проблему, виникли постачальники нод для віддаленого процесу виклику (RPC). Ці постачальники відповідають за експлуатацію та управління нодами, надаючи користувачам доступ до даних через RPC-інтерфейси. Хоча публічні RPC-інтерфейси безкоштовні, вони мають обмеження швидкості, що може вплинути на досвід користувачів dApp. Приватні RPC-інтерфейси, хоч і мають кращу продуктивність, все ще виявляються неефективними для складних запитів і важко масштабуються через мережу. Тим не менш, стандартизовані API-інтерфейси постачальників нод знизили бар'єри для доступу користувачів до даних на блокчейні, заклавши основу для подальшої обробки даних та застосувань.
2.2 Аналіз даних: від прототипних даних до придатних даних
Блокчейн нода, що надає первинні дані, зазвичай проходить через шифрування та кодування, тому безпосереднє використання цих даних є складним для звичайних користувачів та розробників. Процес розбору даних перетворює складні прототипні дані в більш зрозумілий та зручний для роботи формат, що є ключовим етапом у всьому процесі індексації даних.
2.3 Еволюція індексаторів даних
З ростом обсягу даних Блокчейн, потреба в індексаторах стає все більш очевидною. Індексатори можуть організовувати дані з ланцюга і зберігати їх у базі даних для зручності запитів. Вони індексують дані Блокчейн і надають подібні до SQL мови запитів ( такі як GraphQL ) інтерфейс, що забезпечує доступність даних в будь-який час. Індексатори надають розробникам стандартизовану мову запитів, що значно спрощує процес отримання даних.
Різні типи індексаторів мають свої особливості:
Повний індексатор нод: безпосередньо витягує дані з повного вузла, забезпечуючи цілісність даних, але потребує великих ресурсів для зберігання та обробки.
Легкий індексатор: залежить від повних нод для отримання специфічних даних за запитом, зменшуючи вимоги до зберігання, але може збільшити час запиту.
Спеціалізований індексатор: оптимізація для певних типів даних або Блокчейн, таких як дані NFT або DeFi-транзакції.
Агент агрегованих індексів: витягує дані з кількох блокчейнів та джерел, включаючи поза ланцюгову інформацію, надає єдиний інтерфейс запиту, підходить для багатоланцюгових dApp.
Наразі, вимоги до зберігання архівних нод Ethereum в різних клієнтах коливаються від 3TB до 13.5TB, і з постійним зростанням Блокчейн ця кількість даних продовжує зростати. Перед обличчям такої величезної кількості даних, основні протоколи індексації не лише підтримують багатоланкову індексацію, але й розробили рамки для аналізу даних відповідно до потреб різних застосунків.
В порівнянні з традиційними RPC-інтерфейсами, індексатори мають значні переваги в ефективності індексації та запиту даних. Вони можуть ефективно індексувати великі обсяги даних, підтримують складні запити та фільтрацію даних, а також проводять аналіз після вилучення. Деякі індексатори також підтримують агрегацію джерел даних з кількох блокчейнів, що усуває проблему необхідності розгортання кількох API для багатоланцюгових dApp. Завдяки розподіленій роботі, індексатори забезпечують більшу безпеку та продуктивність, водночас знижуючи ризик переривань, які можуть виникнути через централізованих постачальників RPC.
2.4 Повна база даних Блокчейн: Вирівнювання за пріоритетом потоку
Зі зростанням складності вимог до застосування стандартизований формат індексації API поступово стає недостатнім для задоволення різноманітних запитів, таких як міжблокчейн-доступ або відображення даних поза ланцюгом. У сучасній архітектурі даних метод "потокового пріоритету" стає рішенням для обмежень традиційної пакетної обробки, реалізуючи обробку та аналіз даних у реальному часі.
Постачальники послуг даних Блокчейн також рухаються в напрямку створення потоків даних Блокчейн. Традиційні постачальники послуг індексування запустили продукти для отримання даних Блокчейн в реальному часі у вигляді потоків даних, такі як Substreams від The Graph і Mirror від Goldsky. Одночасно з'явилися такі послуги, як Chainbase і SubSquid, які є реальними озерами даних, що генеруються на основі Блокчейн.
Ці послуги спрямовані на вирішення потреби в реальному аналізі Блокчейн-транзакцій та наданні більш комплексних можливостей для запитів. Переглядаючи виклики даних на ланцюгу з точки зору сучасних дата-пайплайнів, ми можемо уявити світ, здатний створити адаптовані до будь-якого бізнес-випадку високопродуктивні набори даних.
3. AI + База даних? Глибоке порівняння The Graph, Chainbase, Space and Time
3.1 Граф
Мережа The Graph надає послуги індексації та запиту даних з кількох блокчейнів через децентралізовану мережу нод, що спрощує розробникам індексацію даних блокчейну та створення децентралізованих застосунків. Основні продуктові моделі включають ринок виконання запитів даних та ринок кешування індексації даних, що задовольняє потреби користувачів у запитах продуктів.
Підграфи ( є основною структурою даних мережі The Graph, яка визначає, як витягувати та перетворювати дані з Блокчейн в запитуваний формат. Будь-хто може створювати підграфи, кілька додатків можуть повторно використовувати ці підграфи, що підвищує повторне використання даних та ефективність використання.
Мережа The Graph складається з чотирьох ключових ролей: індексаторів, кураторів, делегатів та розробників. Індексатори надають послуги індексації та обробки запитів; делегати стейкають токени для підтримки роботи індексованих нод; куратори відповідають за сигналізацію, які підграфи повинні бути проіндексовані мережею; розробники як замовники створюють та подають підграфи.
Продукти The Graph також швидко розвиваються на хвилі AI. Інструменти AutoAgora, Allocation Optimizer та AgentC, розроблені Semiotic Labs, покращують продуктивність екосистеми в кількох аспектах, таких як динамічний механізм ціноутворення, оптимізація розподілу ресурсів та запити на природній мові.
![Читання, індексація до аналізу, короткий опис Web3 даних індексації])https://img-cdn.gateio.im/webp-social/moments-cf9a002b9b094fbbe3be7f611001b5c1.webp(
) 3.2 Ланцюгова база
Chainbase є повноцінною мережею даних, яка інтегрує всі дані блокчейну в одну платформу. Його унікальні функції включають:
Реальний озеро даних: надає спеціалізоване реальне озеро даних для потоків даних Блокчейн.
Двомодульна архітектура: на базі Eigenlayer AVS побудовано шар виконання, що в поєднанні з алгоритмом консенсусу CometBFT формує паралельну двомодульну архітектуру.
Інноваційний стандарт формату даних: впровадження стандарту формату даних "manuscripts", оптимізація структуризації та використання даних криптоіндустрії.
Модель крипто-світу: поєднуючи технологію AI-моделей, створити AI-модель, яка здатна розуміти, передбачати Блокчейн-транзакції та взаємодіяти з ними.
AI-модель Theia від Chainbase є її ключовою перевагою, основаною на моделі DORA від NVIDIA, що поєднує дані на блокчейні та поза ним, а також просторову та часову активність, вивчає та аналізує криптовалютні патерни, реагуючи через причинно-наслідкове мислення.
![Читання, індексація до аналізу, короткий опис сектора індексації даних Web3]###https://img-cdn.gateio.im/webp-social/moments-b343cab5112c1a3d52f4e72122ae0df2.webp(
) 3.3 Простір і Час
Space and Time ###SxT( прагне створити перевіряємий обчислювальний рівень, розширюючи нульові знання в децентралізованих сховищах даних. Його інноваційна технологія Proof of SQL є технологією нульових знань, яка забезпечує, що SQL-запити, виконувані в децентралізованих сховищах даних, є незмінними та перевіряємими.
SxT співпрацює з лабораторією інновацій Microsoft AI для розробки генеративних AI інструментів, які полегшують користувачам обробку даних Блокчейн за допомогою обробки природної мови. У Space and Time Studio користувачі можуть вводити запити природною мовою, AI автоматично перетворює їх на SQL і виконує запит.
![Читання, індексація до аналізу, короткий опис траси індексації даних Web3])https://img-cdn.gateio.im/webp-social/moments-97443cbd177ac4ffd1665da670ffbf12.webp(
Висновок та перспективи
Технологія індексації даних Блокчейн спочатку від джерела даних Ноди, через розвиток解析 даних та індексаторів, врешті-решт еволюціонувала до повноцінного сервісу даних з підтримкою ШІ, пройшовши поступовий процес вдосконалення. Цей постійний розвиток технологій не тільки підвищив ефективність та точність доступу до даних, але й забезпечив користувачам інтелектуальний досвід.
У майбутньому, з розвитком нових технологій, таких як технології ШІ та нульові знання, послуги з обробки даних Блокчейн стануть ще більш інтелектуальними та безпечними. Як інфраструктура, послуги з обробки даних Блокчейн продовжать надавати потужну підтримку для прогресу та інновацій у галузі.
![Читання, індексація до аналізу, короткий опис сектора індексації даних Web3])https://img-cdn.gateio.im/webp-social/moments-0742180b7da8a9dcddafc465a4dba9cb.webp(
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
22 лайків
Нагородити
22
9
Поділіться
Прокоментувати
0/400
LoneValidator
· 07-08 04:08
Цього року всі грають у ланцюги за допомогою ШІ? Неймовірно.
Переглянути оригіналвідповісти на0
GasWaster
· 07-08 03:30
ai ще потрібно грати з індексацією даних? Цей раунд спрацює?
Переглянути оригіналвідповісти на0
BlockDetective
· 07-08 02:31
ai що завгодно може робити, не перебільшуй занадто.
Переглянути оригіналвідповісти на0
AirdropFreedom
· 07-06 18:37
Знову розгорілася хвиля концепції AI, в результаті чого web3 стає все більш конкурентним.
Переглянути оригіналвідповісти на0
ETHReserveBank
· 07-05 20:40
булран прийшов, дані справжня нафта
Переглянути оригіналвідповісти на0
BlockchainTherapist
· 07-05 20:40
Хто ще грає в ноди? Зараз всі займаються ШІ.
Переглянути оригіналвідповісти на0
TokenBeginner'sGuide
· 07-05 20:36
Нагадуємо: відповідно до останніх досліджень Wave Research, 86% проектів сліпо інтегрують AI без надійних даних підтримки, врешті-решт перетворюючись на піар. Рекомендуємо всім обережно перевіряти, щоб уникнути оманливих маркетингових слів.
Переглянути оригіналвідповісти на0
GhostAddressHunter
· 07-05 20:29
Дані Майнінг дійсно має потенціал. Чекаю на об'єднання.
Переглянути оригіналвідповісти на0
MoonlightGamer
· 07-05 20:27
Прийшли, чому всі штучні інтелекти збираються у блокчейні, що тут відбувається~
Еволюція сервісів даних Блокчейн: від Нод до штучного інтелекту, що надає можливості всьому ланцюгу
Еволюція технології індексації даних Блокчейн: від Ноди до послуг повного ланцюга з підтримкою ШІ
1. Вступ
В останні роки децентралізовані додатки (dApp) в сфері Блокчейн бурхливо розвиваються, від ранніх фінансових, ігрових та соціальних додатків до сьогоднішнього багатогранного екосистеми мульти-ланцюгів. У цьому процесі джерела даних та способи доступу, на яких покладається dApp, також постійно еволюціонують.
У 2024 році штучний інтелект (AI) та Web3 стануть гарячими темами. AI-системи потребують величезних обсягів даних для постійного навчання та еволюції, так само як рослини потребують сонця та вологи для здорового росту. Без підтримки даними навіть найсучасніші алгоритми AI не зможуть продемонструвати свою справжню інтелектуальність та ефективність.
Ця стаття детально аналізує еволюцію індексації даних Блокчейн під кутом зору доступності даних у Блокчейн в процесі розвитку галузі. Ми також порівняємо традиційний протокол індексації даних The Graph з новими протоколами сервісу даних Блокчейн Chainbase та Space and Time, обговорюючи подібності та відмінності цих нових протоколів, що поєднують технології ШІ в сервісах даних та архітектурі продуктів.
2. Складність та простота індексації даних: від ноди Блокчейн до бази даних усієї ланцюга
2.1 Джерело даних: Блокчейн Нода
Основою Блокчейн є децентралізована мережа, що складається з безлічі Нод, кожна з яких зберігає повну копію даних Блокчейн. Проте для звичайних користувачів створення та обслуговування Ноди не є простим завданням, адже воно вимагає професійних навичок і стикається з високими витратами на апаратуру та пропускну здатність. Водночас, можливості запиту звичайних Нод обмежені, що ускладнює задоволення потреб розробників.
Щоб вирішити цю проблему, виникли постачальники нод для віддаленого процесу виклику (RPC). Ці постачальники відповідають за експлуатацію та управління нодами, надаючи користувачам доступ до даних через RPC-інтерфейси. Хоча публічні RPC-інтерфейси безкоштовні, вони мають обмеження швидкості, що може вплинути на досвід користувачів dApp. Приватні RPC-інтерфейси, хоч і мають кращу продуктивність, все ще виявляються неефективними для складних запитів і важко масштабуються через мережу. Тим не менш, стандартизовані API-інтерфейси постачальників нод знизили бар'єри для доступу користувачів до даних на блокчейні, заклавши основу для подальшої обробки даних та застосувань.
2.2 Аналіз даних: від прототипних даних до придатних даних
Блокчейн нода, що надає первинні дані, зазвичай проходить через шифрування та кодування, тому безпосереднє використання цих даних є складним для звичайних користувачів та розробників. Процес розбору даних перетворює складні прототипні дані в більш зрозумілий та зручний для роботи формат, що є ключовим етапом у всьому процесі індексації даних.
2.3 Еволюція індексаторів даних
З ростом обсягу даних Блокчейн, потреба в індексаторах стає все більш очевидною. Індексатори можуть організовувати дані з ланцюга і зберігати їх у базі даних для зручності запитів. Вони індексують дані Блокчейн і надають подібні до SQL мови запитів ( такі як GraphQL ) інтерфейс, що забезпечує доступність даних в будь-який час. Індексатори надають розробникам стандартизовану мову запитів, що значно спрощує процес отримання даних.
Різні типи індексаторів мають свої особливості:
Наразі, вимоги до зберігання архівних нод Ethereum в різних клієнтах коливаються від 3TB до 13.5TB, і з постійним зростанням Блокчейн ця кількість даних продовжує зростати. Перед обличчям такої величезної кількості даних, основні протоколи індексації не лише підтримують багатоланкову індексацію, але й розробили рамки для аналізу даних відповідно до потреб різних застосунків.
В порівнянні з традиційними RPC-інтерфейсами, індексатори мають значні переваги в ефективності індексації та запиту даних. Вони можуть ефективно індексувати великі обсяги даних, підтримують складні запити та фільтрацію даних, а також проводять аналіз після вилучення. Деякі індексатори також підтримують агрегацію джерел даних з кількох блокчейнів, що усуває проблему необхідності розгортання кількох API для багатоланцюгових dApp. Завдяки розподіленій роботі, індексатори забезпечують більшу безпеку та продуктивність, водночас знижуючи ризик переривань, які можуть виникнути через централізованих постачальників RPC.
2.4 Повна база даних Блокчейн: Вирівнювання за пріоритетом потоку
Зі зростанням складності вимог до застосування стандартизований формат індексації API поступово стає недостатнім для задоволення різноманітних запитів, таких як міжблокчейн-доступ або відображення даних поза ланцюгом. У сучасній архітектурі даних метод "потокового пріоритету" стає рішенням для обмежень традиційної пакетної обробки, реалізуючи обробку та аналіз даних у реальному часі.
Постачальники послуг даних Блокчейн також рухаються в напрямку створення потоків даних Блокчейн. Традиційні постачальники послуг індексування запустили продукти для отримання даних Блокчейн в реальному часі у вигляді потоків даних, такі як Substreams від The Graph і Mirror від Goldsky. Одночасно з'явилися такі послуги, як Chainbase і SubSquid, які є реальними озерами даних, що генеруються на основі Блокчейн.
Ці послуги спрямовані на вирішення потреби в реальному аналізі Блокчейн-транзакцій та наданні більш комплексних можливостей для запитів. Переглядаючи виклики даних на ланцюгу з точки зору сучасних дата-пайплайнів, ми можемо уявити світ, здатний створити адаптовані до будь-якого бізнес-випадку високопродуктивні набори даних.
3. AI + База даних? Глибоке порівняння The Graph, Chainbase, Space and Time
3.1 Граф
Мережа The Graph надає послуги індексації та запиту даних з кількох блокчейнів через децентралізовану мережу нод, що спрощує розробникам індексацію даних блокчейну та створення децентралізованих застосунків. Основні продуктові моделі включають ринок виконання запитів даних та ринок кешування індексації даних, що задовольняє потреби користувачів у запитах продуктів.
Підграфи ( є основною структурою даних мережі The Graph, яка визначає, як витягувати та перетворювати дані з Блокчейн в запитуваний формат. Будь-хто може створювати підграфи, кілька додатків можуть повторно використовувати ці підграфи, що підвищує повторне використання даних та ефективність використання.
Мережа The Graph складається з чотирьох ключових ролей: індексаторів, кураторів, делегатів та розробників. Індексатори надають послуги індексації та обробки запитів; делегати стейкають токени для підтримки роботи індексованих нод; куратори відповідають за сигналізацію, які підграфи повинні бути проіндексовані мережею; розробники як замовники створюють та подають підграфи.
Продукти The Graph також швидко розвиваються на хвилі AI. Інструменти AutoAgora, Allocation Optimizer та AgentC, розроблені Semiotic Labs, покращують продуктивність екосистеми в кількох аспектах, таких як динамічний механізм ціноутворення, оптимізація розподілу ресурсів та запити на природній мові.
![Читання, індексація до аналізу, короткий опис Web3 даних індексації])https://img-cdn.gateio.im/webp-social/moments-cf9a002b9b094fbbe3be7f611001b5c1.webp(
) 3.2 Ланцюгова база
Chainbase є повноцінною мережею даних, яка інтегрує всі дані блокчейну в одну платформу. Його унікальні функції включають:
AI-модель Theia від Chainbase є її ключовою перевагою, основаною на моделі DORA від NVIDIA, що поєднує дані на блокчейні та поза ним, а також просторову та часову активність, вивчає та аналізує криптовалютні патерни, реагуючи через причинно-наслідкове мислення.
![Читання, індексація до аналізу, короткий опис сектора індексації даних Web3]###https://img-cdn.gateio.im/webp-social/moments-b343cab5112c1a3d52f4e72122ae0df2.webp(
) 3.3 Простір і Час
Space and Time ###SxT( прагне створити перевіряємий обчислювальний рівень, розширюючи нульові знання в децентралізованих сховищах даних. Його інноваційна технологія Proof of SQL є технологією нульових знань, яка забезпечує, що SQL-запити, виконувані в децентралізованих сховищах даних, є незмінними та перевіряємими.
SxT співпрацює з лабораторією інновацій Microsoft AI для розробки генеративних AI інструментів, які полегшують користувачам обробку даних Блокчейн за допомогою обробки природної мови. У Space and Time Studio користувачі можуть вводити запити природною мовою, AI автоматично перетворює їх на SQL і виконує запит.
![Читання, індексація до аналізу, короткий опис траси індексації даних Web3])https://img-cdn.gateio.im/webp-social/moments-97443cbd177ac4ffd1665da670ffbf12.webp(
Висновок та перспективи
Технологія індексації даних Блокчейн спочатку від джерела даних Ноди, через розвиток解析 даних та індексаторів, врешті-решт еволюціонувала до повноцінного сервісу даних з підтримкою ШІ, пройшовши поступовий процес вдосконалення. Цей постійний розвиток технологій не тільки підвищив ефективність та точність доступу до даних, але й забезпечив користувачам інтелектуальний досвід.
У майбутньому, з розвитком нових технологій, таких як технології ШІ та нульові знання, послуги з обробки даних Блокчейн стануть ще більш інтелектуальними та безпечними. Як інфраструктура, послуги з обробки даних Блокчейн продовжать надавати потужну підтримку для прогресу та інновацій у галузі.
![Читання, індексація до аналізу, короткий опис сектора індексації даних Web3])https://img-cdn.gateio.im/webp-social/moments-0742180b7da8a9dcddafc465a4dba9cb.webp(