Evolución de la tecnología de indexación de datos de la cadena de bloques: de nodos a bases de datos de cadena completa potenciadas por IA

Evolución de la tecnología de indexación de datos de la cadena de bloques y perspectivas futuras

1. Introducción

Desde las primeras aplicaciones de la Cadena de bloques hasta los diversos dApp financieros, de juegos y sociales de hoy en día, el ecosistema de la Cadena de bloques ha experimentado una gran transformación. En este proceso, la fuente de datos en la que se basan las interacciones de los dApp se ha convertido gradualmente en el centro de atención de la industria.

En 2024, la fusión de la IA y Web3 se convierte en un tema candente. En el campo de la inteligencia artificial, los datos son como la fuente de vida para su crecimiento y evolución. Así como las plantas necesitan luz solar y humedad para crecer fuertes, los sistemas de IA también dependen de grandes volúmenes de datos para seguir aprendiendo y pensando. Sin el apoyo de los datos, incluso el algoritmo de IA más sofisticado tendrá dificultades para demostrar su inteligencia y eficacia.

Este artículo profundizará en el desarrollo de la accesibilidad de datos en la cadena de bloques, analizará la evolución de la tecnología de indexación de datos en la industria y comparará varios de los principales protocolos de indexación de datos, prestando especial atención a cómo los protocolos emergentes utilizan la tecnología de IA para optimizar los servicios de datos y la arquitectura de productos.

2. La evolución del índice de datos: de nodos a base de datos de cadena de bloques

2.1 Fuente de datos: nodo de la Cadena de bloques

La cadena de bloques a menudo se describe como un libro de contabilidad descentralizado. Los nodos son la base de toda la red, responsables de registrar, almacenar y difundir todos los datos de transacciones en la cadena. Cada nodo guarda una copia completa de los datos de la cadena de bloques, asegurando la característica de descentralización de la red. Sin embargo, para los usuarios comunes, construir y mantener un nodo no es tarea fácil, ya que no solo requiere habilidades especializadas, sino que también implica altos costos de hardware y ancho de banda. Además, la capacidad de consulta de los nodos comunes es limitada, lo que dificulta satisfacer las necesidades de los desarrolladores.

Para resolver este problema, surgieron los proveedores de nodos RPC. Asumen los costos y la gestión de los nodos, ofreciendo servicios de datos a través de puntos finales RPC. Aunque los puntos finales RPC públicos son gratuitos, tienen limitaciones de velocidad, lo que puede afectar la experiencia del usuario de las dApps. Los puntos finales RPC privados ofrecen un mejor rendimiento, pero tienen una eficiencia más baja para consultas complejas y son difíciles de escalar y de ser compatibles entre redes. A pesar de esto, la interfaz API estandarizada de los proveedores de nodos ha reducido la barrera de acceso de los usuarios a los datos en la cadena, sentando las bases para el posterior análisis de datos y aplicaciones.

Leer, indexar para analizar, resumen de la pista de indexación de datos de Web3

2.2 Análisis de datos: de datos en bruto a datos utilizables

Los datos originales proporcionados por los nodos de la cadena de bloques suelen ser procesados mediante cifrado y codificación, lo que garantiza la integridad y seguridad de los datos, pero aumenta la dificultad de análisis. Para los usuarios comunes y los desarrolladores, manejar estos datos directamente requiere un gran conocimiento técnico y recursos computacionales.

El proceso de análisis de datos se vuelve especialmente importante en este contexto. Al convertir datos brutos complejos en un formato más comprensible y manejable, los usuarios pueden aprovechar estos datos de manera más intuitiva. La calidad del análisis afecta directamente la eficiencia y efectividad de las aplicaciones de datos de la Cadena de bloques, siendo un eslabón clave en todo el proceso de indexación de datos.

2.3 El desarrollo del indexador de datos

Con el aumento explosivo de la cantidad de datos de la Cadena de bloques, la necesidad de indexadores de datos se vuelve cada vez más prominente. La función principal de los indexadores es organizar los datos en la cadena y almacenarlos en una base de datos para su consulta. Indexan los datos de la Cadena de bloques y proporcionan una interfaz de lenguaje de consulta similar a SQL (como GraphQL), haciendo que los datos estén disponibles en cualquier momento. Esta interfaz de consulta unificada permite a los desarrolladores recuperar la información necesaria de manera rápida y precisa, simplificando enormemente todo el proceso.

Diferentes tipos de indexadores tienen sus ventajas:

  1. Indexador de nodos completos: extrae datos directamente de nodos completos, asegurando que los datos sean completos y precisos, pero requiere una gran capacidad de almacenamiento y procesamiento.
  2. Indexador ligero: depende de nodos completos para obtener datos específicos, reduce la necesidad de almacenamiento pero puede aumentar el tiempo de consulta.
  3. Indexador especializado: optimizado para tipos de datos específicos o Cadena de bloques, como datos de NFT o transacciones de DeFi.
  4. Agregador de índices: extrae datos de múltiples cadenas de bloques y fuentes, incluyendo información fuera de la cadena, proporcionando una interfaz de consulta unificada, adecuada para dApps multichain.

Actualmente, los requisitos de almacenamiento de los nodos de archivo de Ethereum varían de 3TB a 13.5TB en diferentes clientes, y continúan aumentando a medida que crece la cadena de bloques. Frente a tal cantidad de datos, los protocolos de indexación más utilizados no solo soportan la indexación multichain, sino que también han personalizado marcos de análisis de datos para diferentes necesidades de aplicación.

La aparición de los indexadores ha mejorado significativamente la eficiencia de indexación y consulta de datos. En comparación con los puntos finales RPC tradicionales, los indexadores pueden manejar grandes volúmenes de datos de manera eficiente, soportando consultas complejas y filtrado de datos. Algunos indexadores también soportan la agregación de múltiples fuentes de datos de cadenas, evitando el problema de que las dApps multi-cadena necesiten desplegar múltiples API. A través de la ejecución distribuida, los indexadores ofrecen una mayor seguridad y rendimiento, reduciendo el riesgo de interrupciones que pueden surgir de los proveedores de RPC centralizados.

Leer, indexar para analizar, resumen de la pista de indexación de datos Web3

2.4 Base de datos de cadena completa: alineación prioritaria al flujo

A medida que la escala del proyecto se expande, las API estandarizadas tienen dificultades para satisfacer las crecientes demandas de consultas complejas, como búsquedas, acceso entre cadenas o mapeo de datos fuera de la cadena. El enfoque "prioritario en el flujo" en la arquitectura moderna de tuberías de datos se convierte en una solución para superar las limitaciones del procesamiento por lotes tradicional, permitiendo el procesamiento y análisis de datos en tiempo real.

Los proveedores de servicios de datos de Cadena de bloques también están avanzando hacia la construcción de flujos de datos. Los proveedores de servicios de indexación tradicionales han lanzado productos de flujo de datos en tiempo real de Cadena de bloques, como Substreams de cierto protocolo y Mirror de cierta empresa. Al mismo tiempo, proveedores emergentes como cierta plataforma de datos y cierto protocolo también ofrecen lagos de datos en tiempo real generados a partir de Cadena de bloques.

Estos servicios están diseñados para abordar la necesidad de analizar en tiempo real las transacciones de la cadena de bloques y proporcionar capacidades de consulta completas. Al replantear la gestión de datos en la cadena desde la perspectiva de los modernos canales de datos, podemos explorar más posibilidades de almacenamiento y utilización de datos. Considerar indexadores como Subgraph y ETL de Ethereum como flujos de datos en lugar de salidas finales abre nuevas posibilidades para la personalización de conjuntos de datos de alto rendimiento.

Leer, indexar y analizar, resumen de la pista de indexación de datos Web3

3. La combinación de IA y bases de datos: comparación de protocolos principales

3.1 Un protocolo de índice descentralizado

El protocolo ofrece servicios de indexación y consulta de datos multichain a través de una red de nodos descentralizados. Sus productos centrales incluyen un mercado de ejecución de consultas de datos y un mercado de caché de indexación de datos, que satisfacen las necesidades de consulta de los usuarios.

La estructura de datos base del protocolo es el "subgrafo", que define cómo extraer y transformar datos de la cadena de bloques en un formato consultable. La red está compuesta por cuatro roles: indexadores, curadores, delegadores y desarrolladores, asegurando el funcionamiento del sistema a través de incentivos económicos.

El protocolo ha tenido recientes avances en aplicaciones de IA. El equipo de desarrollo central del ecosistema ha desarrollado varias herramientas de IA, como un mecanismo de precios dinámicos, un optimizador de distribución de recursos y herramientas de consulta en lenguaje natural, mejorando la inteligencia del sistema y la facilidad de uso para los usuarios.

Leer, indexar y analizar, resumen de la pista de indexación de datos Web3

3.2 Red de datos de cadena de bloques completa

Esta es una plataforma que integra todos los datos de la cadena de bloques, ofreciendo características como un lago de datos en tiempo real, una arquitectura de doble cadena, estándares de formatos de datos innovadores y un modelo del mundo criptográfico.

La plataforma se basa en una capa de ejecución construida sobre cierta tecnología, formando una arquitectura de doble cadena paralela con un cierto algoritmo de consenso, lo que mejora la programabilidad y la combinabilidad de los datos entre cadenas. La plataforma ha introducido un nuevo estándar de formato de datos llamado "manuscripts", optimizando la estructuración y utilización de los datos en la industria de criptografía.

La plataforma combina la tecnología de modelos de IA para crear un modelo de IA que puede entender, predecir transacciones de Cadena de bloques e interactuar con ellas. Actualmente se ha lanzado una versión básica del modelo para el uso público, que se basa en la tecnología desarrollada por una empresa, combinando datos on-chain y off-chain así como actividades temporales y espaciales, para explorar en profundidad el valor y las reglas potenciales de los datos on-chain.

Lectura, indexación a análisis, resumen de la pista de indexación de datos Web3

3.3 Capa de cálculo verificable

Este proyecto tiene como objetivo crear una capa de cálculo verificable, ampliando la prueba de conocimiento cero sobre un almacén de datos descentralizado, para ofrecer un procesamiento de datos confiable para contratos inteligentes, modelos de lenguaje grande y empresas.

El proyecto ha introducido una innovadora tecnología de prueba de conocimiento cero, que garantiza que las consultas SQL ejecutadas en un almacén de datos descentralizado sean a prueba de manipulaciones y verificables. Esta tecnología ha cambiado la forma en que las redes tradicionales de Cadena de bloques dependen de mecanismos de consenso para validar la autenticidad de los datos, mejorando el rendimiento general del sistema.

El proyecto colabora con el laboratorio de IA de una gran empresa tecnológica para desarrollar herramientas de IA generativa que simplifican el proceso para que los usuarios procesen datos de la Cadena de bloques a través del procesamiento del lenguaje natural. Los usuarios pueden ingresar consultas en lenguaje natural, la IA las convierte automáticamente en SQL y ejecuta la consulta, presentando el resultado final.

Leer, indexar y analizar, resumen de la pista de indexación de datos de Web3

Conclusión y perspectivas

La tecnología de indexación de datos de la Cadena de bloques ha pasado por un proceso de evolución desde la fuente de datos de nodo, a la解析 y el indexador de datos, y luego al servicio de datos de toda la cadena potenciado por IA. Este proceso ha mejorado continuamente la eficiencia y precisión del acceso a los datos, brindando a los usuarios una experiencia más inteligente.

En el futuro, con el desarrollo de nuevas tecnologías como la inteligencia artificial y las pruebas de conocimiento cero, los servicios de datos de la Cadena de bloques se volverán aún más inteligentes y seguros. Como infraestructura, estos servicios seguirán brindando un apoyo importante para el progreso y la innovación en la industria.

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 7
  • Compartir
Comentar
0/400
Ramen_Until_Richvip
· hace11h
¿La cadena de bloques también juega a la IA? ¡Empecemos!
Ver originalesResponder0
GasFeeAssassinvip
· hace11h
Ah, esta fuente de datos es más problemática que la tarifa de gas.
Ver originalesResponder0
BTCBeliefStationvip
· hace11h
¡Wuhu! Los datos de AI de jugar en la cadena son impresionantes.
Ver originalesResponder0
VirtualRichDreamvip
· hace11h
perspectivas valiosas y duras, esperando la primavera de web3
Ver originalesResponder0
GasFeeCryingvip
· hace11h
Esta sopa huele realmente bien.
Ver originalesResponder0
SignatureAnxietyvip
· hace11h
Todo el día hablando de IA, los datos son el verdadero amo.
Ver originalesResponder0
TopEscapeArtistvip
· hace11h
El Rebote aún no ha formado un giro de fondo. Concepto de juego puro, espera a posiciones en largo.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)