IA e Web3: Novas Oportunidades para Construir Infraestruturas de IA Distribuídas

AI+Web3: Torres e Praças

TL;DR

  1. Projetos Web3 com conceito de IA tornam-se alvos de captação de recursos nos mercados primário e secundário.

  2. As oportunidades do Web3 na indústria de AI manifestam-se em: usar incentivos distribuídos para coordenar o potencial de fornecimento na cauda longa — através de dados, armazenamento e computação; ao mesmo tempo que se constroem modelos de código aberto e um mercado descentralizado para Agentes de AI.

  3. A IA na indústria Web3 é principalmente utilizada em finanças na cadeia (pagamentos em criptomoedas, transações, análise de dados) e para auxiliar no desenvolvimento.

  4. A utilidade do AI+Web3 é refletida na complementaridade de ambos: o Web3 promete combater a centralização da IA, enquanto a IA promete ajudar o Web3 a romper barreiras.

AI+Web3:Torres e Praças

Introdução

Nos últimos dois anos, o desenvolvimento da IA parece ter sido acelerado. A onda gerada pelo Chatgpt não só abriu um novo mundo de inteligência artificial generativa, mas também criou um movimento no domínio do Web3.

Com o suporte do conceito de IA, o financiamento do mercado de criptomoedas teve um aumento significativo. Apenas no primeiro semestre de 2024, 64 projetos Web3+IA conseguiram financiamento, sendo que o sistema operacional baseado em inteligência artificial Zyber365 alcançou o maior financiamento de 100 milhões de dólares na rodada A.

O mercado secundário está mais próspero, o site de agregação de criptomoedas Coingecko mostra que, em pouco mais de um ano, o valor total do setor de IA atingiu 48,5 bilhões de dólares, com um volume de negociação de quase 8,6 bilhões de dólares nas últimas 24 horas. Os benefícios trazidos pelos avanços nas tecnologias de IA são evidentes, após o lançamento do modelo de texto para vídeo Sora da OpenAI, o preço médio do setor de IA subiu 151%. O efeito da IA também se estendeu a um dos setores de captação de criptomoedas, Meme: o primeiro conceito de MemeCoin com Agente de IA - GOAT rapidamente se tornou popular e alcançou uma avaliação de 1,4 bilhão de dólares, causando um verdadeiro furor no Meme de IA.

A pesquisa e os tópicos sobre AI+Web3 também estão em alta, desde AI+Depin até AI Memecoin, passando pelos atuais AI Agent e AI DAO, a emoção FOMO já não consegue acompanhar a velocidade de rotação das novas narrativas.

AI+Web3, esta combinação de termos cheia de dinheiro fácil, oportunidades e fantasias futuras, não pode deixar de ser vista como um casamento arranjado facilitado pelo capital. Parece que é difícil distinguir, sob este manto glamoroso, se é o palco dos especuladores ou a véspera de uma explosão ao amanhecer?

Para responder a esta questão, uma reflexão crucial para ambas as partes é: será que a outra parte se tornará melhor? Será que se pode beneficiar dos padrões da outra parte? Neste artigo, também tentamos olhar para este cenário a partir dos ombros de gigantes: como é que o Web3 pode desempenhar um papel em cada etapa da pilha de tecnologia de IA, e o que a IA pode trazer de novo ao Web3?

Parte.1 Quais são as oportunidades do Web3 sob a pilha de IA?

Antes de abordar este tópico, precisamos entender a pilha tecnológica dos grandes modelos de IA:

Usando uma linguagem mais simples para descrever todo o processo: o "grande modelo" é como o cérebro humano. Na fase inicial, esse cérebro pertence a um bebê que acaba de chegar ao mundo, precisando observar e absorver uma vasta quantidade de informações do ambiente para entender este mundo, que é a fase de "coleta" de dados. Como os computadores não possuem os múltiplos sentidos humanos, como a visão e a audição, antes do treinamento, as informações não rotuladas em larga escala do exterior precisam ser convertidas, através da "pré-processamento", em um formato de informação que o computador consiga entender e utilizar.

Depois de inserir os dados, a IA constrói um modelo com capacidade de compreensão e previsão através do "treinamento", que pode ser visto como o processo em que um bebê gradualmente entende e aprende sobre o mundo exterior. Os parâmetros do modelo são como as habilidades linguísticas que o bebê ajusta continuamente durante o processo de aprendizado. Quando o conteúdo aprendido começa a ser dividido em disciplinas ou quando há comunicação com outras pessoas que fornece feedback e correção, entra-se na fase de "ajuste fino" do grande modelo.

As crianças, ao crescerem e aprenderem a falar, conseguem compreender o significado em novas conversas e expressar seus sentimentos e pensamentos. Esta fase é semelhante à "inferência" de um grande modelo de IA, onde o modelo é capaz de prever e analisar novos inputs de linguagem e texto. Os bebês expressam sentimentos, descrevem objetos e resolvem vários problemas através da capacidade linguística, o que também é semelhante à aplicação de grandes modelos de IA em tarefas específicas na fase de inferência, após serem treinados e colocados em uso, como classificação de imagens, reconhecimento de voz, etc.

O AI Agent está mais próximo da próxima forma dos grandes modelos - capaz de executar tarefas de forma independente e perseguir objetivos complexos, não apenas possuindo capacidade de pensamento, mas também sendo capaz de memória, planejamento e de utilizar ferramentas para interagir com o mundo.

Atualmente, em resposta às dificuldades do AI em várias camadas, o Web3 formou inicialmente um ecossistema interconectado e multilayer, abrangendo todas as fases do processo dos modelos de AI.

AI+Web3: Torre e Praça

Uma, Camada Básica: Airbnb de Poder de Cálculo e Dados

Poder de Cálculo

Atualmente, um dos maiores custos da IA é a potência de cálculo e a energia necessárias para treinar e inferir modelos.

Um exemplo é que um grande modelo de linguagem de uma empresa de tecnologia precisa de 16.000 GPUs de alto desempenho, produzidas por um conhecido fabricante de chips, durante 30 dias para completar o treinamento. O preço unitário da versão de 80GB varia entre 30.000 e 40.000 dólares, o que requer um investimento em hardware de computação de 400 a 700 milhões de dólares (GPU + chip de rede), enquanto o treinamento mensal consome 1,6 mil milhões de quilowatts-hora, com gastos com energia próximos de 20 milhões de dólares por mês.

A descompressão do poder computacional da IA é precisamente uma das primeiras áreas de interseção entre o Web3 e a IA - DePin (Rede de Infraestrutura Física Descentralizada). Atualmente, o site de dados DePin Ninja já apresentou mais de 1400 projetos, entre os quais os projetos representativos de compartilhamento de poder computacional de GPU incluem io.net, Aethir, Akash, Render Network, entre outros.

A lógica principal está no fato de que a plataforma permite que indivíduos ou entidades com recursos de GPU ociosos contribuam com sua capacidade de computação de forma descentralizada e sem permissão. Isso é feito através de um mercado online semelhante a uma plataforma de economia compartilhada, onde compradores e vendedores aumentam a utilização de recursos de GPU que não estão sendo plenamente aproveitados. Como resultado, os usuários finais também obtêm recursos de computação eficientes a um custo mais baixo. Ao mesmo tempo, o mecanismo de staking também garante que, se houver violação do mecanismo de controle de qualidade ou interrupção da rede, os provedores de recursos enfrentem penalidades correspondentes.

As suas características residem em:

  • Reunir recursos ociosos de GPU: os fornecedores são principalmente operadores de centros de dados independentes de pequeno e médio porte, mineradoras de criptomoedas e recursos de potência excedente, com um mecanismo de consenso PoS, como máquinas de mineração de FileCoin e ETH. Atualmente, também há projetos dedicados a iniciar dispositivos com barreiras de entrada mais baixas, como o exolab, que utiliza MacBook, iPhone, iPad e outros dispositivos locais para estabelecer uma rede de computação para a inferência de grandes modelos.

  • Enfrentando o mercado de cauda longa da potência de cálculo de IA:

a. "Do ponto de vista técnico", o mercado de poder computacional descentralizado é mais adequado para etapas de inferência. O treinamento depende mais da capacidade de processamento de dados proporcionada por GPUs em larga escala, enquanto a inferência exige um desempenho computacional de GPU relativamente baixo, como Aethir que se concentra em trabalhos de renderização de baixa latência e aplicações de inferência de IA.

b. Do lado da demanda, os provedores de poder computacional de médio e pequeno porte não irão treinar seus próprios grandes modelos de forma independente, mas apenas escolherão otimizar e ajustar finamente em torno de alguns poucos grandes modelos de destaque, e esses cenários são naturalmente adequados para recursos de computação distribuída ociosos.

  • Propriedade descentralizada: o significado técnico da blockchain é que os proprietários de recursos mantêm sempre o controle sobre os recursos, ajustando-se de forma flexível de acordo com a demanda, ao mesmo tempo em que obtêm lucros.

Dados

Os dados são a base da IA. Sem dados, o cálculo é tão inútil quanto um capim à deriva, e a relação entre dados e modelos é como diz o velho provérbio: "Lixo entra, lixo sai". A quantidade de dados e a qualidade da entrada determinam a qualidade da saída do modelo final. Para o treinamento dos modelos de IA atuais, os dados determinam a capacidade linguística, a capacidade de compreensão, e até mesmo a visão de mundo e a expressividade humanizada do modelo. Atualmente, a crise de demanda de dados da IA se concentra principalmente em quatro áreas:

  • Fome de dados: O treinamento de modelos de IA depende de uma grande quantidade de dados de entrada. Dados públicos mostram que uma conhecida empresa de IA treinou o número de parâmetros de seu grande modelo de linguagem para um nível na ordem dos trilhões.

  • Qualidade dos dados: Com a integração da IA em várias indústrias, a atualidade dos dados, a diversidade dos dados, a especialização dos dados verticais e a incorporação de novas fontes de dados, como as emoções nas redes sociais, impuseram novas exigências à sua qualidade.

  • Questões de privacidade e conformidade: atualmente, vários países e empresas estão começando a reconhecer a importância de conjuntos de dados de qualidade e estão impondo restrições à coleta de conjuntos de dados.

  • Alto custo de processamento de dados: grande volume de dados e processo de tratamento complexo. Dados públicos mostram que mais de 30% dos custos de P&D das empresas de IA são utilizados na coleta e processamento de dados básicos.

Atualmente, as soluções Web3 estão refletidas nas seguintes quatro áreas:

  1. Coleta de dados: a capacidade de fornecer gratuitamente dados do mundo real coletados está rapidamente se esgotando, e os gastos das empresas de IA em dados estão aumentando ano após ano. No entanto, ao mesmo tempo, esses gastos não estão beneficiando realmente os verdadeiros contribuintes dos dados, pois as plataformas desfrutam inteiramente da criação de valor trazida pelos dados, como uma certa plataforma de redes sociais que gerou uma receita total de 203 milhões de dólares através de um contrato de autorização de dados com uma empresa de IA.

Permitir que os usuários que realmente contribuem participem igualmente na criação de valor gerado pelos dados, bem como obter dados mais privados e valiosos dos usuários de forma econômica através de redes distribuídas e mecanismos de incentivo, é a visão do Web3.

  • O Grass é uma camada de dados e rede descentralizada, onde os usuários podem executar nós Grass, contribuindo com largura de banda ociosa e tráfego de retransmissão para capturar dados em tempo real de toda a internet e receber recompensas em tokens.

  • A Vana introduziu um conceito único de piscina de liquidez de dados (DLP), onde os usuários podem fazer upload de seus dados pessoais (como histórico de compras, hábitos de navegação, atividades em redes sociais, etc.) para uma DLP específica e escolher flexivelmente se desejam autorizar o uso desses dados por terceiros específicos.

  • No PublicAI, os usuários podem usar #AI或#Web3 como uma etiqueta de classificação em uma determinada plataforma social e @PublicAI para realizar a coleta de dados.

  1. Pré-processamento de dados: No processo de tratamento de dados da IA, como os dados coletados geralmente são ruidosos e contêm erros, eles devem ser limpos e convertidos para um formato utilizável antes de treinar o modelo, envolvendo tarefas repetitivas de padronização, filtragem e tratamento de valores ausentes. Esta fase é uma das poucas etapas manuais na indústria de IA, tendo gerado a profissão de anotador de dados, à medida que a exigência de qualidade dos dados pelos modelos aumenta, o nível de entrada para anotadores de dados também se eleva, e essa tarefa é inerentemente adequada para o mecanismo de incentivo descentralizado do Web3.
  • Neste momento, o Grass e o OpenLayer estão a considerar a inclusão da rotulagem de dados nesta fase crucial.

  • A Synesis introduziu o conceito de "Train2earn", enfatizando a qualidade dos dados, permitindo que os usuários recebam recompensas ao fornecer dados anotados, comentários ou outras formas de entrada.

  • O projeto de anotação de dados Sapien gamifica as tarefas de marcação e permite que os usuários façam staking de pontos para ganhar mais pontos.

  1. Privacidade e Segurança de Dados: É importante esclarecer que privacidade de dados e segurança de dados são dois conceitos diferentes. A privacidade de dados envolve o tratamento de dados sensíveis, enquanto a segurança de dados protege as informações contra acessos, destruições e roubos não autorizados. Assim, as vantagens das tecnologias de privacidade no Web3 e os potenciais cenários de aplicação são refletidos em dois aspectos: (1) Treinamento de Dados Sensíveis; (2) Colaboração de Dados: Vários proprietários de dados podem participar conjuntamente do treinamento de IA sem precisar compartilhar seus dados originais.

As tecnologias de privacidade mais comuns no Web3 atualmente incluem:

  • Ambiente de Execução Confiável ( TEE ), como o Super Protocol.

  • Criptografia totalmente homomórfica (FHE), como BasedAI, Fhenix.io ou Inco Network.

  • Tecnologia de conhecimento zero (zk), como o Protocolo Reclaim que utiliza a tecnologia zkTLS, gera provas de conhecimento zero para o tráfego HTTPS, permitindo que os usuários importem de forma segura dados de atividades, reputação e identidade de sites externos, sem expor informações sensíveis.

No entanto, atualmente o campo ainda está em estágio inicial, a maioria dos projetos ainda está em exploração, um dos dilemas atuais é que o custo computacional é muito alto, alguns exemplos são:

  • O framework zkML EZKL leva cerca de 80 minutos para gerar uma prova de um modelo 1M-nanoGPT.

  • De acordo com os dados da Modulus Labs, os custos do zkML são mais de 1000 vezes superiores aos de cálculo puro.

  1. Armazenamento de dados: Após ter os dados, é necessário um local para armazená-los na cadeia, bem como o LLM gerado a partir desses dados. Com a disponibilidade de dados (DA) como questão central, antes da atualização Danksharding do Ethereum, sua capacidade era de 0,08MB. Ao mesmo tempo, o treinamento de modelos de IA e a inferência em tempo real geralmente requerem uma taxa de transferência de dados de 50 a 100GB por segundo. Essa diferença de magnitude torna as soluções existentes na cadeia incapazes de lidar com "aplicações de IA que consomem muitos recursos."
  • 0g.AI é o representante desta categoria
Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 4
  • Partilhar
Comentar
0/400
ApeEscapeArtistvip
· 07-11 12:17
Futuro promissor
Ver originalResponder0
LayerZeroHerovip
· 07-11 12:05
Só a complementaridade pode levar à vitória mútua.
Ver originalResponder0
ShadowStakervip
· 07-11 12:00
Direção que vale a pena explorar
Ver originalResponder0
NotGonnaMakeItvip
· 07-11 11:58
O futuro já chegou
Ver originalResponder0
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)