Los proyectos de Web3 con concepto de IA se han convertido en un objetivo de captación de fondos en los mercados primario y secundario.
Las oportunidades de Web3 en la industria de la IA se manifiestan en: utilizar incentivos distribuidos para coordinar el suministro potencial en la larga cola------a través de datos, almacenamiento y computación; al mismo tiempo, establecer un modelo de código abierto y un mercado descentralizado para Agentes de IA.
La principal área de aplicación de la IA en la industria Web3 es la financiación en cadena (pagos de criptomonedas, transacciones, análisis de datos) y el apoyo al desarrollo.
La utilidad de AI+Web3 se refleja en la complementariedad de ambos: Web3 tiene la esperanza de combatir la concentración de AI, y AI tiene la esperanza de ayudar a Web3 a romper barreras.
Introducción
En los últimos dos años, el desarrollo de la IA ha sido como si se hubiera presionado un botón de aceleración; esta mariposa provocada por ChatGPT no solo ha abierto un nuevo mundo de inteligencia artificial generativa, sino que también ha generado un gran impulso en el Web3.
Con el apoyo del concepto de IA, el impulso de financiamiento en el mercado de criptomonedas, que se ha desacelerado, es notable. Según estadísticas de los medios, solo en la primera mitad de 2024, un total de 64 proyectos Web3+IA completaron financiamiento, y el sistema operativo basado en inteligencia artificial Zyber365 logró una cantidad máxima de financiamiento de 100 millones de dólares en su ronda A.
El mercado secundario es aún más próspero. Los datos de un sitio web de agregación de criptomonedas muestran que en poco más de un año, el valor total del mercado del sector de IA ha alcanzado los 48,5 mil millones de dólares, con un volumen de transacciones de 8,6 mil millones de dólares en 24 horas; los avances en tecnologías de IA han traído beneficios evidentes, después del lanzamiento del modelo de conversión de texto a video Sora de una empresa, el precio promedio del sector de IA aumentó un 151%; el efecto de la IA también se ha reflejado en uno de los sectores de captación de capital de criptomonedas, Meme: el primer concepto de MemeCoin de AI Agent, GOAT, se volvió rápidamente popular y logró una valoración de 1,4 mil millones de dólares, desencadenando con éxito la fiebre de los Memes de IA.
La investigación y los temas sobre AI+Web3 también están en auge, desde AI+Depin hasta AI Memecoin y ahora AI Agent y AI DAO, la emoción de FOMO ya no puede seguir el ritmo de la rotación de nuevas narrativas.
AI+Web3, esta combinación de términos llena de dinero caliente, oportunidades y fantasías futuras, no puede evitar ser vista como un matrimonio arreglado por el capital; parece que es difícil distinguir si debajo de esta lujosa vestimenta, realmente es el terreno de los especuladores o la víspera de una explosión al amanecer.
Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿se volverá mejor con el otro? ¿Se pueden beneficiar de los modelos del otro? En este artículo, también intentamos examinar este patrón desde la perspectiva de quienes nos precedieron: ¿cómo puede Web3 desempeñar un papel en cada uno de los eslabones de la pila tecnológica de IA, y qué nueva vitalidad puede aportar la IA a Web3?
Parte 1 ¿Qué oportunidades hay en Web3 bajo la pila de IA?
Antes de profundizar en este tema, necesitamos entender la pila tecnológica de los grandes modelos de IA:
Expresar todo el proceso en un lenguaje más sencillo: el "gran modelo" es como el cerebro humano. En las primeras etapas, este cerebro pertenece a un bebé recién llegado al mundo, que necesita observar e ingerir una gran cantidad de información del entorno para entender este mundo; esta es la fase de "recolección" de datos. Debido a que las computadoras no poseen los sentidos humanos como la vista y el oído, antes del entrenamiento, la gran cantidad de información no etiquetada del exterior debe ser convertida a través de "preprocesamiento" en un formato de información que la computadora pueda entender y utilizar.
Después de ingresar los datos, la IA construyó un modelo con capacidad de comprensión y predicción a través de "entrenamiento", lo que se puede considerar como el proceso en el que un bebé gradualmente entiende y aprende sobre el mundo exterior. Los parámetros del modelo son como la capacidad lingüística que el bebé ajusta continuamente durante su proceso de aprendizaje. Cuando el contenido de aprendizaje comienza a dividirse en disciplinas, o se recibe retroalimentación al comunicarse con otros y se realizan correcciones, se entra en la etapa de "ajuste fino" del gran modelo.
Los niños, al crecer y aprender a hablar, pueden entender el significado y expresar sus sentimientos e ideas en nuevas conversaciones. Esta etapa es similar al "razonamiento" de los grandes modelos de IA, que pueden predecir y analizar nuevas entradas de lenguaje y texto. Los bebés expresan sus sentimientos, describen objetos y resuelven diversos problemas a través de su capacidad lingüística, lo que también es similar a cómo los grandes modelos de IA se utilizan en la fase de razonamiento para realizar tareas específicas después de completar su entrenamiento, como la clasificación de imágenes, el reconocimiento de voz, entre otros.
Y el Agente de IA se acerca más a la siguiente forma de los grandes modelos: capaz de ejecutar tareas de manera independiente y perseguir objetivos complejos, no solo posee capacidad de pensamiento, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.
Actualmente, en respuesta a los puntos críticos de la IA en diversas pilas, Web3 ha comenzado a formar un ecosistema interconectado y multifacético que abarca todas las etapas del proceso de modelos de IA.
Uno, Capa básica: Airbnb de poder de cálculo y datos
Poder de cómputo
Actualmente, uno de los mayores costos de la IA es la potencia computacional y la energía necesarias para entrenar y razonar modelos.
Un ejemplo es que la LLAMA3 de una empresa necesita 16,000 H100GPU producidas por un fabricante (que es una unidad de procesamiento gráfico de alto nivel diseñada para cargas de trabajo de inteligencia artificial y computación de alto rendimiento). El precio unitario de la versión de 80GB oscila entre 30,000 y 40,000 dólares, lo que requiere una inversión en hardware de cálculo de entre 400 y 700 millones de dólares (GPU + chips de red). Además, el entrenamiento mensual consume 1.6 mil millones de kilovatios hora, y el gasto energético mensual es de casi 20 millones de dólares.
La descompresión de la potencia de cálculo de la IA es precisamente el primer campo donde Web3 se cruza con la IA------DePin (red de infraestructura física descentralizada). Actualmente, un sitio de datos ha enumerado más de 1400 proyectos, entre los cuales los proyectos representativos de compartición de potencia GPU incluyen io.net, Aethir, Akash, Render Network, entre otros.
Su lógica principal radica en que la plataforma permite a individuos o entidades con recursos de GPU ociosos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permiso. A través de un mercado en línea similar a plataformas de transporte o alquiler a corto plazo, se mejora la utilización de los recursos de GPU que no están siendo utilizados de manera óptima, lo que permite a los usuarios finales acceder a recursos de cálculo eficientes a un costo más bajo; al mismo tiempo, el mecanismo de staking asegura que si se viola el mecanismo de control de calidad o se interrumpe la red, los proveedores de recursos enfrentarán las sanciones correspondientes.
Sus características son:
Reunir recursos de GPU ociosos: los proveedores son principalmente centros de datos independientes de tamaño pequeño y mediano de terceros, recursos de potencia excedente de operadores de minas de criptomonedas, y hardware de minería con mecanismo de consenso PoS, como cierta red de almacenamiento y ciertas máquinas mineras de cadenas de bloques populares. Actualmente, también hay proyectos dedicados a iniciar equipos con un umbral de entrada más bajo, como exolab, que utiliza ciertas marcas de laptops, teléfonos móviles, tabletas y otros dispositivos locales para establecer una red de poder de cálculo para la inferencia de modelos grandes.
Enfrentando el mercado de larga cola del poder de cálculo de la IA:
a. "Desde el punto de vista técnico", el mercado de potencia de cálculo descentralizado es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos que proporciona un clúster de GPU de gran escala, mientras que la inferencia tiene requisitos de rendimiento de GPU relativamente bajos, como Aethir que se centra en trabajos de renderizado de baja latencia y aplicaciones de inferencia de IA.
b. En el lado de la demanda, las pequeñas y medianas empresas que requieren potencia de cálculo no entrenarán sus propios modelos grandes de manera independiente, sino que simplemente optarán por optimizar y ajustar unos pocos modelos grandes principales. Estos escenarios son naturalmente adecuados para los recursos de cálculo distribuidos y ociosos.
Propiedad descentralizada: El significado tecnológico de la blockchain radica en que los propietarios de los recursos siempre mantienen el control sobre ellos, ajustándose de manera flexible según la demanda, al mismo tiempo que obtienen beneficios.
Datos
Los datos son la base de la IA. Sin datos, el cálculo es tan inútil como una hoja flotante, y la relación entre los datos y el modelo es como el dicho "Basura entra, basura sale". La cantidad de datos y la calidad de la entrada determinan la calidad de la salida del modelo final. En cuanto al entrenamiento de los modelos de IA actuales, los datos determinan la capacidad lingüística, la capacidad de comprensión, e incluso la visión de valores y la humanización del modelo. Actualmente, las dificultades en la demanda de datos de IA se concentran principalmente en las siguientes cuatro áreas:
Hambre de datos: El entrenamiento de modelos de IA depende de una gran cantidad de datos de entrada. Los documentos públicos muestran que una empresa entrenó GPT-4 con una cantidad de parámetros que alcanzó niveles de billones.
Calidad de los datos: Con la integración de la IA en diversas industrias, la actualidad de los datos, la diversidad de los datos, la especialización de los datos verticales y la incorporación de nuevas fuentes de datos, como las emociones en las redes sociales, también han planteado nuevas exigencias para su calidad.
Problemas de privacidad y cumplimiento: Actualmente, los diferentes países y empresas están prestando cada vez más atención a la importancia de los conjuntos de datos de calidad y están imponiendo restricciones a la recopilación de conjuntos de datos.
Costos de procesamiento de datos elevados: gran volumen de datos, proceso complejo de manejo. Los datos públicos muestran que más del 30% de los costos de I+D de las empresas de IA se destinan a la recolección y procesamiento de datos básicos.
Actualmente, las soluciones de web3 se reflejan en las siguientes cuatro áreas:
Recolección de datos: La cantidad de datos del mundo real que se pueden obtener de forma gratuita se está agotando rápidamente, y los gastos de las empresas de IA en la compra de datos aumentan cada año. Sin embargo, al mismo tiempo, estos gastos no se están devolviendo a los verdaderos contribuyentes de datos; las plataformas están disfrutando completamente de la creación de valor que aportan los datos, como una cierta plataforma de redes sociales que logró ingresos de 203 millones de dólares a través de un acuerdo de autorización de datos con una empresa de IA.
Permitir que los usuarios que realmente contribuyen participen en la creación de valor que aporta los datos, así como obtener datos más privados y valiosos de los usuarios de manera económica a través de redes distribuidas y mecanismos de incentivos, es la visión de Web3.
Grass es una capa de datos y una red descentralizada, donde los usuarios pueden contribuir con ancho de banda ocioso y tráfico de retransmisión ejecutando nodos de Grass para capturar datos en tiempo real de todo Internet y recibir recompensas en tokens;
Vana introduce un concepto único de piscina de liquidez de datos (DLP), donde los usuarios pueden cargar sus datos privados (como historiales de compras, hábitos de navegación, actividades en redes sociales, etc.) a un DLP específico y elegir de manera flexible si autorizan a terceros específicos a utilizar esos datos;
En PublicAI, los usuarios pueden usar #AI 或#Web3 como etiqueta de clasificación en cierta plataforma social y @PublicAI para llevar a cabo la recolección de datos.
Preprocesamiento de datos: En el proceso de procesamiento de datos de la IA, debido a que los datos recopilados suelen ser ruidosos y contener errores, deben limpiarse y transformarse en un formato utilizable antes de entrenar el modelo, lo que implica tareas repetitivas de normalización, filtrado y manejo de valores faltantes. Esta etapa es uno de los pocos eslabones manuales en la industria de la IA, y ha dado lugar a la industria de los etiquetadores de datos. A medida que las exigencias del modelo sobre la calidad de los datos aumentan, también lo hace el umbral para los etiquetadores de datos, y esta tarea es naturalmente adecuada para el mecanismo de incentivos descentralizado de Web3.
Actualmente, Grass y OpenLayer están considerando unirse a esta etapa clave de la anotación de datos.
Synesis ha propuesto el concepto de «Train2earn», enfatizando la calidad de los datos; los usuarios pueden obtener recompensas al proporcionar datos etiquetados, anotaciones u otras formas de entrada.
El proyecto de etiquetado de datos Sapien gamifica las tareas de etiquetado y permite a los usuarios apostar puntos para ganar más puntos.
Privacidad y seguridad de los datos: es necesario aclarar que la privacidad de los datos y la seguridad de los datos son dos conceptos diferentes. La privacidad de los datos se refiere al manejo de datos sensibles, mientras que la seguridad de los datos protege la información de datos contra el acceso, destrucción y robo no autorizados. Por lo tanto, las ventajas de la tecnología de privacidad de Web3 y sus posibles escenarios de aplicación se reflejan en dos aspectos: (1) entrenamiento de datos sensibles; (2) colaboración de datos: varios propietarios de datos pueden participar en el entrenamiento de IA sin necesidad de compartir sus datos originales.
Las tecnologías de privacidad más comunes en Web3 incluyen:
Entorno de ejecución confiable ( TEE ), como Super Protocol;
Encriptación homomórfica completamente (FHE), por ejemplo, BasedAI, Fhenix.io o Inco Network;
La tecnología de conocimiento cero (zk), como el Protocolo Reclaim que utiliza la tecnología zkTLS, genera pruebas de conocimiento cero del tráfico HTTPS, permitiendo a los usuarios importar de manera segura actividades, reputación y datos de identidad desde sitios web externos sin exponer información sensible.
Sin embargo, actualmente este campo aún se encuentra en una etapa temprana, la mayoría de los proyectos aún están en exploración, y uno de los dilemas actuales es que el costo de computación es demasiado alto, algunos ejemplos son:
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
9 me gusta
Recompensa
9
6
Compartir
Comentar
0/400
ser_ngmi
· hace3h
Siento que web3 está condenado y ahora la IA viene a Cupones de clip
Ver originalesResponder0
HashBandit
· 07-16 03:50
en mis días de minería teníamos verdadera descentralización... no esta tontería de hype de IA smh
Ver originalesResponder0
CoconutWaterBoy
· 07-16 03:50
¡Ganar dinero juntos, eh~
Ver originalesResponder0
CryptoTherapist
· 07-16 03:39
brb haciendo algunos ejercicios de respiración profunda para procesar esta ansiedad por la fusión ai-web3 tbh
Ver originalesResponder0
SleepTrader
· 07-16 03:39
Ya están especulando con conceptos, solo es una herramienta para recolectar dinero.
Explorando las oportunidades de la pila de IA en Web3: desde la Potencia computacional compartida hasta la privacidad de los datos
IA+Web3: Torres y plazas
TL;DR
Los proyectos de Web3 con concepto de IA se han convertido en un objetivo de captación de fondos en los mercados primario y secundario.
Las oportunidades de Web3 en la industria de la IA se manifiestan en: utilizar incentivos distribuidos para coordinar el suministro potencial en la larga cola------a través de datos, almacenamiento y computación; al mismo tiempo, establecer un modelo de código abierto y un mercado descentralizado para Agentes de IA.
La principal área de aplicación de la IA en la industria Web3 es la financiación en cadena (pagos de criptomonedas, transacciones, análisis de datos) y el apoyo al desarrollo.
La utilidad de AI+Web3 se refleja en la complementariedad de ambos: Web3 tiene la esperanza de combatir la concentración de AI, y AI tiene la esperanza de ayudar a Web3 a romper barreras.
Introducción
En los últimos dos años, el desarrollo de la IA ha sido como si se hubiera presionado un botón de aceleración; esta mariposa provocada por ChatGPT no solo ha abierto un nuevo mundo de inteligencia artificial generativa, sino que también ha generado un gran impulso en el Web3.
Con el apoyo del concepto de IA, el impulso de financiamiento en el mercado de criptomonedas, que se ha desacelerado, es notable. Según estadísticas de los medios, solo en la primera mitad de 2024, un total de 64 proyectos Web3+IA completaron financiamiento, y el sistema operativo basado en inteligencia artificial Zyber365 logró una cantidad máxima de financiamiento de 100 millones de dólares en su ronda A.
El mercado secundario es aún más próspero. Los datos de un sitio web de agregación de criptomonedas muestran que en poco más de un año, el valor total del mercado del sector de IA ha alcanzado los 48,5 mil millones de dólares, con un volumen de transacciones de 8,6 mil millones de dólares en 24 horas; los avances en tecnologías de IA han traído beneficios evidentes, después del lanzamiento del modelo de conversión de texto a video Sora de una empresa, el precio promedio del sector de IA aumentó un 151%; el efecto de la IA también se ha reflejado en uno de los sectores de captación de capital de criptomonedas, Meme: el primer concepto de MemeCoin de AI Agent, GOAT, se volvió rápidamente popular y logró una valoración de 1,4 mil millones de dólares, desencadenando con éxito la fiebre de los Memes de IA.
La investigación y los temas sobre AI+Web3 también están en auge, desde AI+Depin hasta AI Memecoin y ahora AI Agent y AI DAO, la emoción de FOMO ya no puede seguir el ritmo de la rotación de nuevas narrativas.
AI+Web3, esta combinación de términos llena de dinero caliente, oportunidades y fantasías futuras, no puede evitar ser vista como un matrimonio arreglado por el capital; parece que es difícil distinguir si debajo de esta lujosa vestimenta, realmente es el terreno de los especuladores o la víspera de una explosión al amanecer.
Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿se volverá mejor con el otro? ¿Se pueden beneficiar de los modelos del otro? En este artículo, también intentamos examinar este patrón desde la perspectiva de quienes nos precedieron: ¿cómo puede Web3 desempeñar un papel en cada uno de los eslabones de la pila tecnológica de IA, y qué nueva vitalidad puede aportar la IA a Web3?
Parte 1 ¿Qué oportunidades hay en Web3 bajo la pila de IA?
Antes de profundizar en este tema, necesitamos entender la pila tecnológica de los grandes modelos de IA:
Expresar todo el proceso en un lenguaje más sencillo: el "gran modelo" es como el cerebro humano. En las primeras etapas, este cerebro pertenece a un bebé recién llegado al mundo, que necesita observar e ingerir una gran cantidad de información del entorno para entender este mundo; esta es la fase de "recolección" de datos. Debido a que las computadoras no poseen los sentidos humanos como la vista y el oído, antes del entrenamiento, la gran cantidad de información no etiquetada del exterior debe ser convertida a través de "preprocesamiento" en un formato de información que la computadora pueda entender y utilizar.
Después de ingresar los datos, la IA construyó un modelo con capacidad de comprensión y predicción a través de "entrenamiento", lo que se puede considerar como el proceso en el que un bebé gradualmente entiende y aprende sobre el mundo exterior. Los parámetros del modelo son como la capacidad lingüística que el bebé ajusta continuamente durante su proceso de aprendizaje. Cuando el contenido de aprendizaje comienza a dividirse en disciplinas, o se recibe retroalimentación al comunicarse con otros y se realizan correcciones, se entra en la etapa de "ajuste fino" del gran modelo.
Los niños, al crecer y aprender a hablar, pueden entender el significado y expresar sus sentimientos e ideas en nuevas conversaciones. Esta etapa es similar al "razonamiento" de los grandes modelos de IA, que pueden predecir y analizar nuevas entradas de lenguaje y texto. Los bebés expresan sus sentimientos, describen objetos y resuelven diversos problemas a través de su capacidad lingüística, lo que también es similar a cómo los grandes modelos de IA se utilizan en la fase de razonamiento para realizar tareas específicas después de completar su entrenamiento, como la clasificación de imágenes, el reconocimiento de voz, entre otros.
Y el Agente de IA se acerca más a la siguiente forma de los grandes modelos: capaz de ejecutar tareas de manera independiente y perseguir objetivos complejos, no solo posee capacidad de pensamiento, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.
Actualmente, en respuesta a los puntos críticos de la IA en diversas pilas, Web3 ha comenzado a formar un ecosistema interconectado y multifacético que abarca todas las etapas del proceso de modelos de IA.
Uno, Capa básica: Airbnb de poder de cálculo y datos
Poder de cómputo
Actualmente, uno de los mayores costos de la IA es la potencia computacional y la energía necesarias para entrenar y razonar modelos.
Un ejemplo es que la LLAMA3 de una empresa necesita 16,000 H100GPU producidas por un fabricante (que es una unidad de procesamiento gráfico de alto nivel diseñada para cargas de trabajo de inteligencia artificial y computación de alto rendimiento). El precio unitario de la versión de 80GB oscila entre 30,000 y 40,000 dólares, lo que requiere una inversión en hardware de cálculo de entre 400 y 700 millones de dólares (GPU + chips de red). Además, el entrenamiento mensual consume 1.6 mil millones de kilovatios hora, y el gasto energético mensual es de casi 20 millones de dólares.
La descompresión de la potencia de cálculo de la IA es precisamente el primer campo donde Web3 se cruza con la IA------DePin (red de infraestructura física descentralizada). Actualmente, un sitio de datos ha enumerado más de 1400 proyectos, entre los cuales los proyectos representativos de compartición de potencia GPU incluyen io.net, Aethir, Akash, Render Network, entre otros.
Su lógica principal radica en que la plataforma permite a individuos o entidades con recursos de GPU ociosos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permiso. A través de un mercado en línea similar a plataformas de transporte o alquiler a corto plazo, se mejora la utilización de los recursos de GPU que no están siendo utilizados de manera óptima, lo que permite a los usuarios finales acceder a recursos de cálculo eficientes a un costo más bajo; al mismo tiempo, el mecanismo de staking asegura que si se viola el mecanismo de control de calidad o se interrumpe la red, los proveedores de recursos enfrentarán las sanciones correspondientes.
Sus características son:
Reunir recursos de GPU ociosos: los proveedores son principalmente centros de datos independientes de tamaño pequeño y mediano de terceros, recursos de potencia excedente de operadores de minas de criptomonedas, y hardware de minería con mecanismo de consenso PoS, como cierta red de almacenamiento y ciertas máquinas mineras de cadenas de bloques populares. Actualmente, también hay proyectos dedicados a iniciar equipos con un umbral de entrada más bajo, como exolab, que utiliza ciertas marcas de laptops, teléfonos móviles, tabletas y otros dispositivos locales para establecer una red de poder de cálculo para la inferencia de modelos grandes.
Enfrentando el mercado de larga cola del poder de cálculo de la IA:
a. "Desde el punto de vista técnico", el mercado de potencia de cálculo descentralizado es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos que proporciona un clúster de GPU de gran escala, mientras que la inferencia tiene requisitos de rendimiento de GPU relativamente bajos, como Aethir que se centra en trabajos de renderizado de baja latencia y aplicaciones de inferencia de IA.
b. En el lado de la demanda, las pequeñas y medianas empresas que requieren potencia de cálculo no entrenarán sus propios modelos grandes de manera independiente, sino que simplemente optarán por optimizar y ajustar unos pocos modelos grandes principales. Estos escenarios son naturalmente adecuados para los recursos de cálculo distribuidos y ociosos.
Datos
Los datos son la base de la IA. Sin datos, el cálculo es tan inútil como una hoja flotante, y la relación entre los datos y el modelo es como el dicho "Basura entra, basura sale". La cantidad de datos y la calidad de la entrada determinan la calidad de la salida del modelo final. En cuanto al entrenamiento de los modelos de IA actuales, los datos determinan la capacidad lingüística, la capacidad de comprensión, e incluso la visión de valores y la humanización del modelo. Actualmente, las dificultades en la demanda de datos de IA se concentran principalmente en las siguientes cuatro áreas:
Hambre de datos: El entrenamiento de modelos de IA depende de una gran cantidad de datos de entrada. Los documentos públicos muestran que una empresa entrenó GPT-4 con una cantidad de parámetros que alcanzó niveles de billones.
Calidad de los datos: Con la integración de la IA en diversas industrias, la actualidad de los datos, la diversidad de los datos, la especialización de los datos verticales y la incorporación de nuevas fuentes de datos, como las emociones en las redes sociales, también han planteado nuevas exigencias para su calidad.
Problemas de privacidad y cumplimiento: Actualmente, los diferentes países y empresas están prestando cada vez más atención a la importancia de los conjuntos de datos de calidad y están imponiendo restricciones a la recopilación de conjuntos de datos.
Costos de procesamiento de datos elevados: gran volumen de datos, proceso complejo de manejo. Los datos públicos muestran que más del 30% de los costos de I+D de las empresas de IA se destinan a la recolección y procesamiento de datos básicos.
Actualmente, las soluciones de web3 se reflejan en las siguientes cuatro áreas:
Permitir que los usuarios que realmente contribuyen participen en la creación de valor que aporta los datos, así como obtener datos más privados y valiosos de los usuarios de manera económica a través de redes distribuidas y mecanismos de incentivos, es la visión de Web3.
Grass es una capa de datos y una red descentralizada, donde los usuarios pueden contribuir con ancho de banda ocioso y tráfico de retransmisión ejecutando nodos de Grass para capturar datos en tiempo real de todo Internet y recibir recompensas en tokens;
Vana introduce un concepto único de piscina de liquidez de datos (DLP), donde los usuarios pueden cargar sus datos privados (como historiales de compras, hábitos de navegación, actividades en redes sociales, etc.) a un DLP específico y elegir de manera flexible si autorizan a terceros específicos a utilizar esos datos;
En PublicAI, los usuarios pueden usar #AI 或#Web3 como etiqueta de clasificación en cierta plataforma social y @PublicAI para llevar a cabo la recolección de datos.
Actualmente, Grass y OpenLayer están considerando unirse a esta etapa clave de la anotación de datos.
Synesis ha propuesto el concepto de «Train2earn», enfatizando la calidad de los datos; los usuarios pueden obtener recompensas al proporcionar datos etiquetados, anotaciones u otras formas de entrada.
El proyecto de etiquetado de datos Sapien gamifica las tareas de etiquetado y permite a los usuarios apostar puntos para ganar más puntos.
Las tecnologías de privacidad más comunes en Web3 incluyen:
Entorno de ejecución confiable ( TEE ), como Super Protocol;
Encriptación homomórfica completamente (FHE), por ejemplo, BasedAI, Fhenix.io o Inco Network;
La tecnología de conocimiento cero (zk), como el Protocolo Reclaim que utiliza la tecnología zkTLS, genera pruebas de conocimiento cero del tráfico HTTPS, permitiendo a los usuarios importar de manera segura actividades, reputación y datos de identidad desde sitios web externos sin exponer información sensible.
Sin embargo, actualmente este campo aún se encuentra en una etapa temprana, la mayoría de los proyectos aún están en exploración, y uno de los dilemas actuales es que el costo de computación es demasiado alto, algunos ejemplos son: