Evolución de la tecnología de indexación de datos en la cadena de bloques: desde nodo hasta servicios de cadena completa habilitados por IA
1. Introducción
En los últimos años, las aplicaciones descentralizadas (dApp) han florecido en el campo de la cadena de bloques, desde las primeras aplicaciones financieras, de juegos y sociales, hasta la actualidad, donde coexisten múltiples ecosistemas de cadenas. En este proceso, las fuentes de datos y los métodos de acceso de las dApp también han ido evolucionando.
En 2024, la inteligencia artificial (AI) y Web3 se convertirán en temas candentes. Los sistemas de IA necesitan grandes volúmenes de datos para seguir aprendiendo y evolucionando, al igual que las plantas necesitan luz solar y agua para crecer robustas. Sin el apoyo de datos, incluso los algoritmos de IA más avanzados tendrán dificultades para demostrar su inteligencia y eficacia.
Este artículo analizará en profundidad la evolución del índice de datos de la cadena de bloques desde la perspectiva de la accesibilidad de los datos de la cadena de bloques en el proceso de desarrollo de la industria. También compararemos el protocolo de índice de datos tradicional The Graph con los nuevos protocolos de servicios de datos de cadena de bloques Chainbase y Space and Time, explorando las similitudes y diferencias de estos nuevos protocolos que combinan tecnología de IA en los servicios de datos y la arquitectura de productos.
2. La complejidad y simplicidad de la indexación de datos: desde el nodo de la cadena de bloques hasta la base de datos de la cadena completa
2.1 Fuente de datos: Nodo de la cadena de bloques
La base de la cadena de bloques es una red descentralizada compuesta por numerosos nodos, cada uno de los cuales almacena una copia completa de los datos de la cadena de bloques. Sin embargo, para los usuarios comunes, construir y mantener un nodo no es una tarea fácil, ya que no solo se requieren habilidades profesionales, sino que también se enfrentan a altos costos de hardware y ancho de banda. Al mismo tiempo, la capacidad de consulta de los nodos comunes es limitada, lo que dificulta satisfacer las necesidades de los desarrolladores.
Para resolver este problema, surgieron los proveedores de nodos de llamada a procedimiento remoto (RPC). Estos proveedores son responsables de la operación y gestión de los nodos, ofreciendo servicios de acceso a datos a los usuarios a través de puntos finales RPC. Aunque los puntos finales RPC públicos son gratuitos, tienen limitaciones de velocidad, lo que puede afectar la experiencia del usuario de la dApp. Los puntos finales RPC privados, aunque tienen un mejor rendimiento, todavía muestran ineficiencia para consultas complejas y son difíciles de escalar a través de redes. A pesar de esto, las interfaces API estandarizadas de los proveedores de nodos han reducido la barrera de acceso de los usuarios a los datos en la cadena, sentando las bases para la posterior interpretación y aplicación de datos.
2.2 Análisis de datos: de datos prototipos a datos utilizables
Los datos originales proporcionados por los nodos de la cadena de bloques suelen estar encriptados y codificados, lo que hace que su uso directo sea bastante difícil para los usuarios comunes y los desarrolladores. El proceso de análisis de datos convierte los datos prototipo complejos en un formato más comprensible y manejable, siendo un eslabón clave en todo el proceso de indexación de datos.
2.3 La evolución del indexador de datos
Con el aumento explosivo de la cantidad de datos en la cadena de bloques, la demanda de indexadores de datos se ha vuelto cada vez más evidente. Los indexadores pueden organizar los datos en la cadena y almacenarlos en bases de datos, facilitando así la consulta. Indexan los datos de la cadena de bloques y proporcionan un lenguaje de consulta similar a SQL ( como la interfaz GraphQL ), haciendo que los datos estén disponibles en cualquier momento. Los indexadores ofrecen a los desarrolladores un lenguaje de consulta estandarizado, simplificando en gran medida el proceso de recuperación de datos.
Diferentes tipos de indexadores tienen sus propias características:
Indexador de nodo completo: extrae datos directamente del nodo completo, asegurando la integridad de los datos, pero requiere una gran cantidad de recursos de almacenamiento y procesamiento.
Indexador ligero: depende de nodos completos para obtener datos específicos bajo demanda, reduce la necesidad de almacenamiento pero puede aumentar el tiempo de consulta.
Indexador especializado: optimizado para tipos específicos de datos o cadenas de bloques, como datos NFT o transacciones DeFi.
Agregador de índices: extrae datos de múltiples cadenas de bloques y fuentes, incluyendo información fuera de la cadena, proporcionando una interfaz de consulta unificada, adecuada para dApps multichain.
Actualmente, los requisitos de almacenamiento de los nodos de archivo de Ethereum varían entre 3TB y 13.5TB en diferentes clientes, y con el crecimiento continuo de la cadena de bloques, esta cantidad de datos sigue aumentando. Frente a tal volumen de datos, los protocolos de indexación más populares no solo admiten la indexación de múltiples cadenas, sino que también han personalizado marcos de análisis de datos para satisfacer las necesidades de datos de diferentes aplicaciones.
En comparación con los puntos finales RPC tradicionales, los indexadores tienen ventajas significativas en términos de eficiencia de indexación y consulta de datos. Pueden indexar grandes volúmenes de datos de manera eficiente, soportar consultas complejas y filtrado de datos, y realizar análisis después de la extracción. Algunos indexadores también soportan la agregación de múltiples fuentes de datos de cadenas de bloques, evitando el problema de que las dApps multicanal necesiten desplegar múltiples API. A través de la ejecución distribuida, los indexadores ofrecen una mayor seguridad y rendimiento, al tiempo que reducen el riesgo de interrupciones que pueden surgir de proveedores de RPC centralizados.
2.4 Base de datos de cadena completa: alineación prioritaria al flujo
Con el aumento de la complejidad de las demandas de aplicación, el formato de índice API estandarizado se vuelve cada vez más difícil de satisfacer para las diversas necesidades de consulta, como el acceso entre cadenas o el mapeo de datos fuera de la cadena. En la arquitectura moderna de tuberías de datos, el enfoque "prioridad de flujo" se ha convertido en una solución para las limitaciones del procesamiento por lotes tradicional, logrando el procesamiento y análisis de datos en tiempo real.
Los proveedores de servicios de datos de cadena de bloques también están avanzando en la dirección de construir flujos de datos de cadena de bloques. Los proveedores de servicios de indexación tradicionales han lanzado productos para obtener datos de cadena de bloques en tiempo real de manera de flujo de datos, como Substreams de The Graph y Mirror de Goldsky. Al mismo tiempo, han surgido servicios de lagos de datos en tiempo real como Chainbase y SubSquid, que se basan en flujos de datos generados a partir de la cadena de bloques.
Estos servicios están diseñados para abordar la necesidad de analizar en tiempo real las transacciones de la cadena de bloques y proporcionar una capacidad de consulta más completa. Al redefinir el desafío de los datos en la cadena desde la perspectiva de los modernos canales de datos, podemos imaginar un mundo posible donde se puedan personalizar conjuntos de datos de alto rendimiento para cualquier caso de uso empresarial.
3. ¿IA + Base de datos? Comparación profunda de The Graph, Chainbase, Space and Time
3.1 The Graph
La red The Graph proporciona servicios de indexación y consulta de datos multichain a través de una red de nodos descentralizados, facilitando a los desarrolladores la indexación de datos de la cadena de bloques y la construcción de aplicaciones descentralizadas. Sus principales modelos de producto incluyen el mercado de ejecución de consultas de datos y el mercado de caché de indexación de datos, atendiendo las necesidades de consulta de productos de los usuarios.
Subgráficos ( son la estructura de datos básica de la red The Graph, que define cómo extraer y transformar datos de la cadena de bloques en un formato consultable. Cualquier persona puede crear subgráficos, y múltiples aplicaciones pueden reutilizar estos subgráficos, mejorando la reutilización de datos y la eficiencia de uso.
La red The Graph está compuesta por cuatro roles clave: indexador, curador, delegador y desarrollador. El indexador proporciona servicios de indexación y procesamiento de consultas; el delegador apuesta tokens para apoyar la operación de los nodos de índice; el curador es responsable de señalar qué subgráficas deben ser indexadas por la red; el desarrollador actúa como la parte demandante creando y enviando subgráficas.
Los productos de The Graph también están evolucionando rápidamente en la ola de la IA. Las herramientas AutoAgora, Allocation Optimizer y AgentC desarrolladas por Semiotic Labs mejoran el rendimiento del ecosistema en varios aspectos, como mecanismos de precios dinámicos, distribución óptima de recursos y consultas en lenguaje natural.
![Leer, indexar y analizar, resumen sobre la carrera de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-cf9a002b9b094fbbe3be7f611001b5c1.webp(
) 3.2 Chainbase
Chainbase es una red de datos de cadena completa que integra todos los datos de la cadena de bloques en una plataforma. Sus características únicas incluyen:
Lago de datos en tiempo real: proporciona un lago de datos en tiempo real dedicado al flujo de datos de la cadena de bloques.
Arquitectura de doble cadena: construida sobre la capa de ejecución de Eigenlayer AVS, formando una arquitectura paralela de doble cadena con el algoritmo de consenso CometBFT.
Estándar de formato de datos innovador: Introducir el estándar de formato de datos "manuscripts", optimizando la estructuración y utilización de los datos en la industria de la criptografía.
Modelo de mundo cripto: Combina la tecnología de modelos de IA para crear un modelo de IA que pueda entender, predecir las transacciones de la cadena de bloques y interactuar con ellas.
El modelo de IA Theia de Chainbase es uno de sus aspectos más destacados, basado en el modelo DORA de NVIDIA, que combina datos en cadena y fuera de cadena, así como actividades temporales y espaciales, para aprender y analizar patrones criptográficos, respondiendo a través de inferencias causales.
![Lectura, indexación para análisis, breve descripción de la pista de indexación de datos Web3]###https://img-cdn.gateio.im/webp-social/moments-b343cab5112c1a3d52f4e72122ae0df2.webp(
) 3.3 Espacio y Tiempo
Space and Time ###SxT( se dedica a crear una capa de cálculo verificable, ampliando pruebas de conocimiento cero en un almacén de datos descentralizado. Su tecnología innovadora Proof of SQL es una técnica de prueba de conocimiento cero que garantiza que las consultas SQL ejecutadas en un almacén de datos descentralizado sean a prueba de manipulaciones y verificables.
SxT colabora con el laboratorio de innovación de AI de Microsoft para desarrollar herramientas de AI generativas, facilitando a los usuarios el procesamiento de datos de la cadena de bloques a través del lenguaje natural. En Space and Time Studio, los usuarios pueden ingresar consultas en lenguaje natural, y la AI las convertirá automáticamente en SQL y ejecutará la consulta.
![Leer, indexar y analizar, resumen de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-97443cbd177ac4ffd1665da670ffbf12.webp(
Conclusión y perspectivas
La tecnología de indexación de datos de la cadena de bloques ha evolucionado desde las fuentes de datos iniciales de los nodos, pasando por el desarrollo de la解析 de datos y los indexadores, hasta llegar a un servicio de datos de toda la cadena potenciado por IA, atravesando un proceso de mejora gradual. Esta evolución constante de las tecnologías no solo ha mejorado la eficiencia y precisión del acceso a los datos, sino que también ha brindado a los usuarios una experiencia inteligente.
En el futuro, con el continuo desarrollo de nuevas tecnologías como la inteligencia artificial y las pruebas de conocimiento cero, los servicios de datos de la cadena de bloques se volverán aún más inteligentes y seguros. Como infraestructura, los servicios de datos de la cadena de bloques seguirán brindando un fuerte apoyo para el progreso y la innovación en la industria.
![Lectura, indexación para análisis, descripción de la pista de indexación de datos de Web3])https://img-cdn.gateio.im/webp-social/moments-0742180b7da8a9dcddafc465a4dba9cb.webp(
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
22 me gusta
Recompensa
22
9
Compartir
Comentar
0/400
LoneValidator
· 07-08 04:08
¿Ahora todos dependen de la IA para jugar con blockchain? Ridículo.
Ver originalesResponder0
GasWaster
· 07-08 03:30
¿AI todavía quiere jugar con la indexación de datos? ¿Esto funcionará?
Ver originalesResponder0
BlockDetective
· 07-08 02:31
La IA puede hacer de todo, no exageres.
Ver originalesResponder0
AirdropFreedom
· 07-06 18:37
Una nueva ola de conceptos de IA ha hecho que web3 sea cada vez más competitivo.
Ver originalesResponder0
ETHReserveBank
· 07-05 20:40
El bull run ha llegado, los datos son el verdadero petróleo.
Ver originalesResponder0
BlockchainTherapist
· 07-05 20:40
¿Quién aún juega con nodos? Ahora todo es IA.
Ver originalesResponder0
TokenBeginner'sGuide
· 07-05 20:36
Pequeño recordatorio: Según la última investigación de Wave Research, el 86% de los proyectos integran la IA de manera ciega en ausencia de datos fiables de soporte, convirtiéndose finalmente en una simple estrategia de marketing. Se recomienda a todos que sean cautelosos al discernir, para evitar ser engañados por el discurso de marketing.
Ver originalesResponder0
GhostAddressHunter
· 07-05 20:29
La minería de datos realmente tiene potencial. Espero la fusión.
Ver originalesResponder0
MoonlightGamer
· 07-05 20:27
¡Ya está! ¿Por qué la IA se está acercando tanto a on-chain? ¿Qué está pasando?~
Cadena de bloques datos servicio evolución: de Nodo a AI empoderando toda la cadena
Evolución de la tecnología de indexación de datos en la cadena de bloques: desde nodo hasta servicios de cadena completa habilitados por IA
1. Introducción
En los últimos años, las aplicaciones descentralizadas (dApp) han florecido en el campo de la cadena de bloques, desde las primeras aplicaciones financieras, de juegos y sociales, hasta la actualidad, donde coexisten múltiples ecosistemas de cadenas. En este proceso, las fuentes de datos y los métodos de acceso de las dApp también han ido evolucionando.
En 2024, la inteligencia artificial (AI) y Web3 se convertirán en temas candentes. Los sistemas de IA necesitan grandes volúmenes de datos para seguir aprendiendo y evolucionando, al igual que las plantas necesitan luz solar y agua para crecer robustas. Sin el apoyo de datos, incluso los algoritmos de IA más avanzados tendrán dificultades para demostrar su inteligencia y eficacia.
Este artículo analizará en profundidad la evolución del índice de datos de la cadena de bloques desde la perspectiva de la accesibilidad de los datos de la cadena de bloques en el proceso de desarrollo de la industria. También compararemos el protocolo de índice de datos tradicional The Graph con los nuevos protocolos de servicios de datos de cadena de bloques Chainbase y Space and Time, explorando las similitudes y diferencias de estos nuevos protocolos que combinan tecnología de IA en los servicios de datos y la arquitectura de productos.
2. La complejidad y simplicidad de la indexación de datos: desde el nodo de la cadena de bloques hasta la base de datos de la cadena completa
2.1 Fuente de datos: Nodo de la cadena de bloques
La base de la cadena de bloques es una red descentralizada compuesta por numerosos nodos, cada uno de los cuales almacena una copia completa de los datos de la cadena de bloques. Sin embargo, para los usuarios comunes, construir y mantener un nodo no es una tarea fácil, ya que no solo se requieren habilidades profesionales, sino que también se enfrentan a altos costos de hardware y ancho de banda. Al mismo tiempo, la capacidad de consulta de los nodos comunes es limitada, lo que dificulta satisfacer las necesidades de los desarrolladores.
Para resolver este problema, surgieron los proveedores de nodos de llamada a procedimiento remoto (RPC). Estos proveedores son responsables de la operación y gestión de los nodos, ofreciendo servicios de acceso a datos a los usuarios a través de puntos finales RPC. Aunque los puntos finales RPC públicos son gratuitos, tienen limitaciones de velocidad, lo que puede afectar la experiencia del usuario de la dApp. Los puntos finales RPC privados, aunque tienen un mejor rendimiento, todavía muestran ineficiencia para consultas complejas y son difíciles de escalar a través de redes. A pesar de esto, las interfaces API estandarizadas de los proveedores de nodos han reducido la barrera de acceso de los usuarios a los datos en la cadena, sentando las bases para la posterior interpretación y aplicación de datos.
2.2 Análisis de datos: de datos prototipos a datos utilizables
Los datos originales proporcionados por los nodos de la cadena de bloques suelen estar encriptados y codificados, lo que hace que su uso directo sea bastante difícil para los usuarios comunes y los desarrolladores. El proceso de análisis de datos convierte los datos prototipo complejos en un formato más comprensible y manejable, siendo un eslabón clave en todo el proceso de indexación de datos.
2.3 La evolución del indexador de datos
Con el aumento explosivo de la cantidad de datos en la cadena de bloques, la demanda de indexadores de datos se ha vuelto cada vez más evidente. Los indexadores pueden organizar los datos en la cadena y almacenarlos en bases de datos, facilitando así la consulta. Indexan los datos de la cadena de bloques y proporcionan un lenguaje de consulta similar a SQL ( como la interfaz GraphQL ), haciendo que los datos estén disponibles en cualquier momento. Los indexadores ofrecen a los desarrolladores un lenguaje de consulta estandarizado, simplificando en gran medida el proceso de recuperación de datos.
Diferentes tipos de indexadores tienen sus propias características:
Actualmente, los requisitos de almacenamiento de los nodos de archivo de Ethereum varían entre 3TB y 13.5TB en diferentes clientes, y con el crecimiento continuo de la cadena de bloques, esta cantidad de datos sigue aumentando. Frente a tal volumen de datos, los protocolos de indexación más populares no solo admiten la indexación de múltiples cadenas, sino que también han personalizado marcos de análisis de datos para satisfacer las necesidades de datos de diferentes aplicaciones.
En comparación con los puntos finales RPC tradicionales, los indexadores tienen ventajas significativas en términos de eficiencia de indexación y consulta de datos. Pueden indexar grandes volúmenes de datos de manera eficiente, soportar consultas complejas y filtrado de datos, y realizar análisis después de la extracción. Algunos indexadores también soportan la agregación de múltiples fuentes de datos de cadenas de bloques, evitando el problema de que las dApps multicanal necesiten desplegar múltiples API. A través de la ejecución distribuida, los indexadores ofrecen una mayor seguridad y rendimiento, al tiempo que reducen el riesgo de interrupciones que pueden surgir de proveedores de RPC centralizados.
2.4 Base de datos de cadena completa: alineación prioritaria al flujo
Con el aumento de la complejidad de las demandas de aplicación, el formato de índice API estandarizado se vuelve cada vez más difícil de satisfacer para las diversas necesidades de consulta, como el acceso entre cadenas o el mapeo de datos fuera de la cadena. En la arquitectura moderna de tuberías de datos, el enfoque "prioridad de flujo" se ha convertido en una solución para las limitaciones del procesamiento por lotes tradicional, logrando el procesamiento y análisis de datos en tiempo real.
Los proveedores de servicios de datos de cadena de bloques también están avanzando en la dirección de construir flujos de datos de cadena de bloques. Los proveedores de servicios de indexación tradicionales han lanzado productos para obtener datos de cadena de bloques en tiempo real de manera de flujo de datos, como Substreams de The Graph y Mirror de Goldsky. Al mismo tiempo, han surgido servicios de lagos de datos en tiempo real como Chainbase y SubSquid, que se basan en flujos de datos generados a partir de la cadena de bloques.
Estos servicios están diseñados para abordar la necesidad de analizar en tiempo real las transacciones de la cadena de bloques y proporcionar una capacidad de consulta más completa. Al redefinir el desafío de los datos en la cadena desde la perspectiva de los modernos canales de datos, podemos imaginar un mundo posible donde se puedan personalizar conjuntos de datos de alto rendimiento para cualquier caso de uso empresarial.
3. ¿IA + Base de datos? Comparación profunda de The Graph, Chainbase, Space and Time
3.1 The Graph
La red The Graph proporciona servicios de indexación y consulta de datos multichain a través de una red de nodos descentralizados, facilitando a los desarrolladores la indexación de datos de la cadena de bloques y la construcción de aplicaciones descentralizadas. Sus principales modelos de producto incluyen el mercado de ejecución de consultas de datos y el mercado de caché de indexación de datos, atendiendo las necesidades de consulta de productos de los usuarios.
Subgráficos ( son la estructura de datos básica de la red The Graph, que define cómo extraer y transformar datos de la cadena de bloques en un formato consultable. Cualquier persona puede crear subgráficos, y múltiples aplicaciones pueden reutilizar estos subgráficos, mejorando la reutilización de datos y la eficiencia de uso.
La red The Graph está compuesta por cuatro roles clave: indexador, curador, delegador y desarrollador. El indexador proporciona servicios de indexación y procesamiento de consultas; el delegador apuesta tokens para apoyar la operación de los nodos de índice; el curador es responsable de señalar qué subgráficas deben ser indexadas por la red; el desarrollador actúa como la parte demandante creando y enviando subgráficas.
Los productos de The Graph también están evolucionando rápidamente en la ola de la IA. Las herramientas AutoAgora, Allocation Optimizer y AgentC desarrolladas por Semiotic Labs mejoran el rendimiento del ecosistema en varios aspectos, como mecanismos de precios dinámicos, distribución óptima de recursos y consultas en lenguaje natural.
![Leer, indexar y analizar, resumen sobre la carrera de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-cf9a002b9b094fbbe3be7f611001b5c1.webp(
) 3.2 Chainbase
Chainbase es una red de datos de cadena completa que integra todos los datos de la cadena de bloques en una plataforma. Sus características únicas incluyen:
El modelo de IA Theia de Chainbase es uno de sus aspectos más destacados, basado en el modelo DORA de NVIDIA, que combina datos en cadena y fuera de cadena, así como actividades temporales y espaciales, para aprender y analizar patrones criptográficos, respondiendo a través de inferencias causales.
![Lectura, indexación para análisis, breve descripción de la pista de indexación de datos Web3]###https://img-cdn.gateio.im/webp-social/moments-b343cab5112c1a3d52f4e72122ae0df2.webp(
) 3.3 Espacio y Tiempo
Space and Time ###SxT( se dedica a crear una capa de cálculo verificable, ampliando pruebas de conocimiento cero en un almacén de datos descentralizado. Su tecnología innovadora Proof of SQL es una técnica de prueba de conocimiento cero que garantiza que las consultas SQL ejecutadas en un almacén de datos descentralizado sean a prueba de manipulaciones y verificables.
SxT colabora con el laboratorio de innovación de AI de Microsoft para desarrollar herramientas de AI generativas, facilitando a los usuarios el procesamiento de datos de la cadena de bloques a través del lenguaje natural. En Space and Time Studio, los usuarios pueden ingresar consultas en lenguaje natural, y la AI las convertirá automáticamente en SQL y ejecutará la consulta.
![Leer, indexar y analizar, resumen de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-97443cbd177ac4ffd1665da670ffbf12.webp(
Conclusión y perspectivas
La tecnología de indexación de datos de la cadena de bloques ha evolucionado desde las fuentes de datos iniciales de los nodos, pasando por el desarrollo de la解析 de datos y los indexadores, hasta llegar a un servicio de datos de toda la cadena potenciado por IA, atravesando un proceso de mejora gradual. Esta evolución constante de las tecnologías no solo ha mejorado la eficiencia y precisión del acceso a los datos, sino que también ha brindado a los usuarios una experiencia inteligente.
En el futuro, con el continuo desarrollo de nuevas tecnologías como la inteligencia artificial y las pruebas de conocimiento cero, los servicios de datos de la cadena de bloques se volverán aún más inteligentes y seguros. Como infraestructura, los servicios de datos de la cadena de bloques seguirán brindando un fuerte apoyo para el progreso y la innovación en la industria.
![Lectura, indexación para análisis, descripción de la pista de indexación de datos de Web3])https://img-cdn.gateio.im/webp-social/moments-0742180b7da8a9dcddafc465a4dba9cb.webp(