Autor: contribuinte principal do Biteye @anci_hu49074
“Estamos numa era de competição global para construir os melhores modelos básicos. O poder computacional e a arquitetura do modelo são importantes, mas a verdadeira barreira é a formação de dados.”
—Sandeep Chinchali, Diretor de IA, Story
Vamos falar sobre o potencial do AI Data track na perspectiva da Scale AI
O maior boato no círculo da IA este mês é a Meta demonstrando sua capacidade financeira. Zuckerberg recrutou talentos em toda parte e formou uma equipe luxuosa da Meta AI composta principalmente por talentos de pesquisa científica chineses. O líder da equipe é Alexander Wang, que tem apenas 28 anos e fundou a Scale AI. Ele fundou a Scale AI, que atualmente é avaliada em 29 bilhões de dólares. Os objetos de serviço incluem o exército dos EUA, bem como OpenAI, Anthropic, Meta e outros gigantes da IA concorrentes, todos os quais dependem dos serviços de dados fornecidos pela Scale AI. O negócio central da Scale AI é fornecer uma grande quantidade de dados rotulados precisos.
Por que a Scale AI se destaca entre um grupo de unicórnios?
A razão é que descobriu a importância dos dados na indústria de IA desde cedo.
O poder de computação, os modelos e os dados são os três pilares dos modelos de IA. Se o grande modelo for comparado a uma pessoa, então o modelo é o corpo, o poder de computação é a comida e os dados são o conhecimento/informação.
Nos anos desde a ascensão do LLM, o foco de desenvolvimento da indústria também se deslocou de modelos para poder de computação. Hoje, a maioria dos modelos estabeleceu transformadores como a estrutura do modelo, com inovações ocasionais como MoE ou MoRe. Os principais gigantes construíram seus próprios Super Clusters para completar a Grande Muralha do poder de computação ou assinaram acordos de longo prazo com serviços de nuvem poderosos como a AWS. Uma vez que o poder de computação básico é atendido, a importância dos dados tornou-se gradativamente proeminente.
Ao contrário das empresas de big data tradicionais B2B com uma reputação proeminente no mercado secundário, como Palantir, a Scale AI, como o nome sugere, está comprometida em construir uma base de dados sólida para modelos de IA. Seu negócio não se limita à mineração de dados existentes, mas também se concentra em um negócio de geração de dados a longo prazo. A empresa também tenta formar uma equipe de treinadores de IA através de especialistas artificiais em diferentes áreas para fornecer dados de treinamento de melhor qualidade para o treinamento de modelos de IA.
Se você não concorda com este negócio, vamos dar uma olhada em como o modelo é treinado.
O treinamento do modelo é dividido em duas partes - pré-treinamento e ajuste fino.
A parte de pré-treinamento é um pouco como o processo em que os bebês humanos aprendem gradualmente a falar. O que normalmente precisamos é fornecer ao modelo de IA uma grande quantidade de texto, código e outras informações obtidas de rastreadores online. O modelo aprende esses conteúdos por conta própria, aprende a falar a linguagem humana ( academicamente chamada de linguagem natural ), e possui habilidades básicas de comunicação.
A parte de ajuste fino é semelhante a ir para a escola, onde geralmente existem respostas e direções claras de certo e errado. As escolas formarão os alunos em diferentes talentos com base em seus respectivos posicionamentos. Também usaremos alguns conjuntos de dados pré-processados e direcionados para treinar o modelo a ter as capacidades que esperamos.
Neste ponto, você pode ter percebido que os dados que precisamos também estão divididos em duas partes.
Alguns dados não precisam ser processados em demasia, apenas o suficiente é suficiente, geralmente a partir de dados de crawlers de grandes plataformas UGC como Reddit, Twitter, Github, bases de dados de literatura pública, bases de dados privadas de empresas, etc.
A outra parte, como os manuais profissionais, requer um cuidadoso design e seleção para garantir que as qualidades específicas e excelentes do modelo possam ser cultivadas. Isso exige que realizemos alguns trabalhos necessários, como limpeza de dados, seleção, rotulagem e feedback manual.
Estes dois conjuntos de dados constituem o corpo principal da trilha de Dados de IA. Não subestime estes conjuntos de dados aparentemente de baixa tecnologia. A visão dominante atual é que, à medida que a vantagem de poder computacional nas leis de escalonamento se torna gradualmente ineficaz, os dados se tornarão o pilar mais importante para diferentes fabricantes de grandes modelos manterem sua vantagem competitiva.
À medida que as capacidades dos modelos continuam a melhorar, dados de treinamento mais sofisticados e profissionais se tornarão variáveis-chave que influenciam as capacidades do modelo. Se compararmos ainda mais o treinamento de modelos ao cultivo de mestres em artes marciais, então conjuntos de dados de alta qualidade são os melhores segredos das artes marciais ( para completar esta metáfora, também podemos dizer que a potência de computação é a panaceia e o modelo é a própria qualificação ).
Do ponto de vista vertical, os Dados de IA também são uma pista de longo prazo com a capacidade de acumular. Com a acumulação de trabalhos anteriores, os ativos de dados também terão a capacidade de se multiplicar e se tornarão mais populares à medida que envelhecem.
Web3 DataFi: O Solo Fértil Escolhido para Dados de IA
Comparado com a equipa de rotulagem manual remota da Scale AI, composta por centenas de milhares de pessoas nas Filipinas, Venezuela e outros locais, o Web3 tem uma vantagem natural no campo dos dados de IA, e o novo termo DataFi nasceu.
Idealmente, as vantagens do Web3 DataFi são as seguintes:
Soberania de dados, segurança e privacidade garantidas por contratos inteligentes
Num estágio em que os dados públicos existentes estão prestes a ser desenvolvidos e esgotados, como minerar ainda mais dados não divulgados, até mesmo dados privados, é uma direção importante para obter e expandir fontes de dados. Isso enfrenta uma questão importante de escolha de confiança - você escolhe um sistema de compra de contrato de uma grande empresa centralizada e vende seus dados; ou você escolhe o método blockchain, continua a manter a IP dos dados em suas mãos e entende claramente através de contratos inteligentes: quem usa seus dados, quando e para qual propósito.
Ao mesmo tempo, para informações sensíveis, você pode usar zk, TEE e outros métodos para garantir que seus dados privados sejam tratados apenas por máquinas que mantêm a boca fechada e não serão vazados.
Vantagem de arbitragem geográfica natural: arquitetura distribuída gratuita para atrair a força de trabalho mais adequada
Talvez seja hora de desafiar a relação tradicional de produção de trabalho. Em vez de procurar mão de obra barata em todo o mundo como a Scale AI, é melhor aproveitar as características distribuídas da blockchain e permitir que a força de trabalho espalhada pelo mundo participe da contribuição de dados por meio de incentivos abertos e transparentes garantidos por contratos inteligentes.
Para tarefas de trabalho intensivo, como etiquetagem de dados e avaliação de modelos, o uso do Web3 DataFi é mais favorável à diversidade de participantes do que a abordagem centralizada de estabelecer fábricas de dados, o que também tem um significado a longo prazo para evitar viés de dados.
As claras vantagens de incentivo e liquidação da blockchain
Como evitar a tragédia da "Fábrica de Couro Jiangnan"? Naturalmente, devemos usar o sistema de incentivos com etiquetas de preço claras em contratos inteligentes para substituir a escuridão da natureza humana.
No contexto da desglobalização inevitável, como podemos continuar a alcançar arbitragem geográfica de baixo custo? É obviamente mais difícil abrir empresas em todo o mundo, então por que não contornar as barreiras do velho mundo e abraçar o método de liquidação em cadeia?
É benéfico para a construção de um mercado de dados "one-stop" mais eficiente e aberto.
"Os intermediários lucrando com a diferença de preços" é uma dor eterna para ambos os lados da oferta e da demanda. Em vez de deixar uma empresa de dados centralizada agir como intermediária, é melhor criar uma plataforma na cadeia, através de um mercado aberto como o Taobao, para que os lados da oferta e da demanda de dados possam se conectar de forma mais transparente e eficiente.
Com o desenvolvimento do ecossistema de IA on-chain, a demanda por dados on-chain tornará-se mais vigorosa, segmentada e diversificada. Apenas um mercado descentralizado pode digerir eficientemente essa demanda e transformá-la em prosperidade ecológica.
Para os investidores de retalho, o DataFi é também o projeto de IA mais descentralizado que é mais favorável à participação de investidores de retalho comuns.
Embora o surgimento de ferramentas de IA tenha diminuído o limiar de aprendizagem até certo ponto, e a intenção original da IA descentralizada seja romper o atual monopólio dos negócios de IA por gigantes; no entanto, deve-se admitir que muitos projetos atuais não são muito acessíveis para investidores de varejo sem formação técnica - participar da mineração em redes de computação descentralizada costuma ser acompanhado de um caro investimento inicial em hardware, e o limiar técnico do mercado de modelos pode facilmente desestimular participantes comuns.
Em contraste, é uma das poucas oportunidades que usuários comuns podem aproveitar na revolução da IA. O Web3 permite que você participe dela completando várias tarefas simples, incluindo fornecer dados, rotular e avaliar modelos com base na intuição e instinto do cérebro humano, ou ainda usar ferramentas de IA para realizar algumas criações simples, participar em transações de dados, etc. Para os velhos motoristas do Partido Mao, o valor de dificuldade é basicamente zero.
Projetos potenciais do Web3 DataFi
Onde o dinheiro flui, aí está a direção. Além do Scale AI receber um investimento de 14,3 bilhões de dólares da Meta e o preço das ações da Palantir disparar mais de 5 vezes em um ano no mundo Web2, o DataFi também teve um desempenho muito bom no financiamento Web3. Aqui damos uma breve introdução a esses projetos.
Sahara AI, @SaharaLabsAI, levantou 49 milhões de dólares
O objetivo final da Sahara AI é construir uma super infraestrutura de IA descentralizada e um mercado de negociação. O primeiro setor a ser testado é o AI Data. A versão beta pública da sua Plataforma de Serviços de Dados DSP ( será lançada no dia 22 de julho. Os usuários podem obter recompensas em tokens contribuindo com dados, participando na rotulagem de dados e em outras tarefas.
Link: app.saharaai.com
)# Yupp, @yupp_ai, arrecadou 33 milhões de dólares
Yupp é uma plataforma de feedback de modelos de IA que coleta feedback dos usuários sobre a saída do modelo. A tarefa principal atual é que os usuários podem comparar a saída de diferentes modelos para o mesmo aviso e, em seguida, selecionar aquele que acham melhor. Completar a tarefa pode render pontos Yupp, que podem ser trocados por stablecoins fiduciárias, como o USDC.
Link:
Vana, @vana, arrecadou 23 milhões de dólares
A Vana concentra-se em converter os dados pessoais dos usuários ###, como atividades em redes sociais, histórico de navegação, etc.( em ativos digitais monetizáveis. Os usuários podem autorizar o upload de seus dados pessoais para o respectivo pool de liquidez de dados )DLP( nos DataDAOs. Esses dados serão agrupados e utilizados para participar de tarefas como treinamento de modelos de IA, e os usuários também receberão recompensas em tokens correspondentes.
Link:
)# Chainbase, @ChainbaseHQ, angaria 16,5 milhões de dólares
O negócio da Chainbase foca em dados on-chain e atualmente cobre mais de 200 blockchains, transformando atividades on-chain em ativos de dados estruturados, verificáveis e monetizáveis para o desenvolvimento de dApps. O negócio da Chainbase é principalmente obtido através de indexação multi-chain e outros métodos, e os dados são processados através do seu sistema Manuscript e do modelo de IA Theia. Usuários comuns atualmente não estão muito envolvidos.
Sapien, @JoinSapien, angariou 15,5 milhões de dólares
A Sapien visa converter o conhecimento humano em dados de treinamento de IA de alta qualidade em larga escala. Qualquer pessoa pode realizar a anotação de dados na plataforma e garantir a qualidade dos dados por meio de verificação por pares. Ao mesmo tempo, os usuários são incentivados a construir uma reputação de longo prazo ou fazer compromissos através de staking para ganhar mais recompensas.
Link:
Prisma X, @PrismaXai , angaria 11 milhões de dólares
O Prisma X quer ser uma camada de coordenação aberta para robôs, onde a coleta de dados físicos é fundamental. Este projeto está atualmente em suas fases iniciais. De acordo com o white paper recentemente lançado, a participação pode incluir investir em robôs para coletar dados, operar remotamente os dados dos robôs, etc. Atualmente, um quiz baseado no white paper está aberto, e você pode participar para ganhar pontos.
Link:
Masa, @getmasafi, arrecadou 8,9 milhões de dólares
Masa é um dos principais projetos de subnet no ecossistema Bittensor, e atualmente opera a Subnet de Dados Número 42 e a Subnet de Agentes Número 59. A subnet de dados está comprometida em fornecer acesso em tempo real a dados. Atualmente, os mineradores principalmente capturam dados em tempo real no X/Twitter através de hardware TEE. Para usuários comuns, a dificuldade e o custo de participação são relativamente altos.
Irys, @irys_xyz, levantou 8,7 milhões de dólares
A Irys foca em armazenamento de dados programável e computação, visando fornecer soluções eficientes e de baixo custo para IA, aplicações descentralizadas ###dApps( e outras aplicações intensivas em dados. Em termos de contribuição de dados, os usuários comuns não podem participar muito no momento, mas há várias atividades para participar na atual fase de testnet.
Link:
)# ORO, @getoro_xyz, levantou 6 milhões de dólares
O que a ORO deseja fazer é capacitar pessoas comuns a participarem na contribuição de IA. Os métodos de apoio incluem: 1. Vincular a sua conta pessoal para contribuir com dados pessoais, incluindo contas sociais, dados de saúde, contas de comércio eletrónico e financeiras; 2. Completar tarefas de dados. A rede de testes já está online e você pode participar.
Link: app.getoro.xyz
Gata, @Gata_xyz, levantou 4 milhões de dólares
Posicionado como uma camada de dados descentralizada, a Gata atualmente tem três produtos principais para participar: 1. Data Agent: uma série de Agentes de IA que podem automaticamente executar e processar dados assim que o usuário abre a página da web; 2. AII-in-one Chat: um mecanismo semelhante à avaliação de modelo do Yupp para ganhar recompensas; 3. GPT-to-Earn: um plug-in de navegador que coleta os dados de conversação dos usuários no ChatGPT.
Link:
Como você vê esses projetos atuais?
Neste momento, as barreiras de entrada para estes projetos não são geralmente altas, mas deve-se reconhecer que, uma vez que os usuários e a adesão ecológica sejam acumulados, as vantagens da plataforma acumular-se-ão rapidamente. Portanto, nas fases iniciais, os esforços devem ser focados em incentivos e na experiência do usuário. Apenas atraindo um número suficiente de usuários é que o negócio de big data pode ser realizado.
No entanto, como projetos intensivos em mão de obra, estas plataformas de dados também devem considerar como gerir a mão de obra e garantir a qualidade da saída de dados enquanto atraem mão de obra. Afinal, um problema comum de muitos projetos Web3 é que a maioria dos usuários na plataforma são apenas gananciosos implacáveis. Muitas vezes sacrificam a qualidade em prol de benefícios de curto prazo. Se forem permitidos tornar-se os principais usuários da plataforma, o mau dinheiro inevitavelmente expulsará o bom dinheiro, e, em última análise, a qualidade dos dados não pode ser garantida e os compradores não podem ser atraídos. Neste momento, vimos que projetos como Sahara e Sapien enfatizaram a qualidade dos dados e se esforçaram para estabelecer uma relação de cooperação a longo prazo e saudável com a mão de obra na plataforma.
Além disso, a falta de transparência é outro problema dos atuais projetos em cadeia. De fato, o triângulo impossível da blockchain forçou muitos projetos a seguirem o caminho de "centralização impulsiona descentralização" na fase de startup. Mas agora, cada vez mais projetos em cadeia dão às pessoas a impressão de "projetos Web2 antigos com pele Web3" - há muito poucos dados públicos que podem ser rastreados na cadeia, e até mesmo o roadmap é difícil de ver a determinação de longo prazo de abertura e transparência. Isso é indubitavelmente tóxico para o desenvolvimento saudável a longo prazo do Web3 DataFi, e também esperamos que mais projetos mantenham sempre suas intenções originais e acelerem o ritmo de abertura e transparência.
Finalmente, o caminho de adoção em massa da DataFi deve também ser dividido em duas partes: uma é atrair um número suficiente de participantes toC para se juntarem à rede, formando uma nova força para a coleta/geração de dados e consumidores da economia de IA, formando um ciclo ecológico fechado; a outra é ganhar reconhecimento das atuais empresas mainstream toB. Afinal, a curto prazo, elas são a principal fonte de grandes pedidos de dados com seus bolsos fundos. Nesse aspecto, também vimos que a Sahara AI, Vana, etc., fizeram bons progressos.
Conclusão
Para ser mais fatalista, o DataFi é sobre usar a inteligência humana para nutrir a inteligência das máquinas a longo prazo, enquanto usa contratos inteligentes como um contrato para garantir que o trabalho da inteligência humana seja lucrativo e, em última análise, desfrute do feedback da inteligência das máquinas.
Se você está ansioso com a incerteza da era da IA, e se ainda tem ideais de blockchain em meio às oscilações do mundo das criptomoedas, então seguir os passos de um grupo de gigantes do capital e se juntar ao DataFi é uma boa escolha para acompanhar a tendência.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Dados são ativos: DataFi está abrindo um novo oceano azul
Autor: contribuinte principal do Biteye @anci_hu49074
“Estamos numa era de competição global para construir os melhores modelos básicos. O poder computacional e a arquitetura do modelo são importantes, mas a verdadeira barreira é a formação de dados.”
—Sandeep Chinchali, Diretor de IA, Story
Vamos falar sobre o potencial do AI Data track na perspectiva da Scale AI
O maior boato no círculo da IA este mês é a Meta demonstrando sua capacidade financeira. Zuckerberg recrutou talentos em toda parte e formou uma equipe luxuosa da Meta AI composta principalmente por talentos de pesquisa científica chineses. O líder da equipe é Alexander Wang, que tem apenas 28 anos e fundou a Scale AI. Ele fundou a Scale AI, que atualmente é avaliada em 29 bilhões de dólares. Os objetos de serviço incluem o exército dos EUA, bem como OpenAI, Anthropic, Meta e outros gigantes da IA concorrentes, todos os quais dependem dos serviços de dados fornecidos pela Scale AI. O negócio central da Scale AI é fornecer uma grande quantidade de dados rotulados precisos.
Por que a Scale AI se destaca entre um grupo de unicórnios?
A razão é que descobriu a importância dos dados na indústria de IA desde cedo.
O poder de computação, os modelos e os dados são os três pilares dos modelos de IA. Se o grande modelo for comparado a uma pessoa, então o modelo é o corpo, o poder de computação é a comida e os dados são o conhecimento/informação.
Nos anos desde a ascensão do LLM, o foco de desenvolvimento da indústria também se deslocou de modelos para poder de computação. Hoje, a maioria dos modelos estabeleceu transformadores como a estrutura do modelo, com inovações ocasionais como MoE ou MoRe. Os principais gigantes construíram seus próprios Super Clusters para completar a Grande Muralha do poder de computação ou assinaram acordos de longo prazo com serviços de nuvem poderosos como a AWS. Uma vez que o poder de computação básico é atendido, a importância dos dados tornou-se gradativamente proeminente.
Ao contrário das empresas de big data tradicionais B2B com uma reputação proeminente no mercado secundário, como Palantir, a Scale AI, como o nome sugere, está comprometida em construir uma base de dados sólida para modelos de IA. Seu negócio não se limita à mineração de dados existentes, mas também se concentra em um negócio de geração de dados a longo prazo. A empresa também tenta formar uma equipe de treinadores de IA através de especialistas artificiais em diferentes áreas para fornecer dados de treinamento de melhor qualidade para o treinamento de modelos de IA.
Se você não concorda com este negócio, vamos dar uma olhada em como o modelo é treinado.
O treinamento do modelo é dividido em duas partes - pré-treinamento e ajuste fino.
A parte de pré-treinamento é um pouco como o processo em que os bebês humanos aprendem gradualmente a falar. O que normalmente precisamos é fornecer ao modelo de IA uma grande quantidade de texto, código e outras informações obtidas de rastreadores online. O modelo aprende esses conteúdos por conta própria, aprende a falar a linguagem humana ( academicamente chamada de linguagem natural ), e possui habilidades básicas de comunicação.
A parte de ajuste fino é semelhante a ir para a escola, onde geralmente existem respostas e direções claras de certo e errado. As escolas formarão os alunos em diferentes talentos com base em seus respectivos posicionamentos. Também usaremos alguns conjuntos de dados pré-processados e direcionados para treinar o modelo a ter as capacidades que esperamos.
Neste ponto, você pode ter percebido que os dados que precisamos também estão divididos em duas partes.
Estes dois conjuntos de dados constituem o corpo principal da trilha de Dados de IA. Não subestime estes conjuntos de dados aparentemente de baixa tecnologia. A visão dominante atual é que, à medida que a vantagem de poder computacional nas leis de escalonamento se torna gradualmente ineficaz, os dados se tornarão o pilar mais importante para diferentes fabricantes de grandes modelos manterem sua vantagem competitiva.
À medida que as capacidades dos modelos continuam a melhorar, dados de treinamento mais sofisticados e profissionais se tornarão variáveis-chave que influenciam as capacidades do modelo. Se compararmos ainda mais o treinamento de modelos ao cultivo de mestres em artes marciais, então conjuntos de dados de alta qualidade são os melhores segredos das artes marciais ( para completar esta metáfora, também podemos dizer que a potência de computação é a panaceia e o modelo é a própria qualificação ).
Do ponto de vista vertical, os Dados de IA também são uma pista de longo prazo com a capacidade de acumular. Com a acumulação de trabalhos anteriores, os ativos de dados também terão a capacidade de se multiplicar e se tornarão mais populares à medida que envelhecem.
Web3 DataFi: O Solo Fértil Escolhido para Dados de IA
Comparado com a equipa de rotulagem manual remota da Scale AI, composta por centenas de milhares de pessoas nas Filipinas, Venezuela e outros locais, o Web3 tem uma vantagem natural no campo dos dados de IA, e o novo termo DataFi nasceu.
Idealmente, as vantagens do Web3 DataFi são as seguintes:
Num estágio em que os dados públicos existentes estão prestes a ser desenvolvidos e esgotados, como minerar ainda mais dados não divulgados, até mesmo dados privados, é uma direção importante para obter e expandir fontes de dados. Isso enfrenta uma questão importante de escolha de confiança - você escolhe um sistema de compra de contrato de uma grande empresa centralizada e vende seus dados; ou você escolhe o método blockchain, continua a manter a IP dos dados em suas mãos e entende claramente através de contratos inteligentes: quem usa seus dados, quando e para qual propósito.
Ao mesmo tempo, para informações sensíveis, você pode usar zk, TEE e outros métodos para garantir que seus dados privados sejam tratados apenas por máquinas que mantêm a boca fechada e não serão vazados.
Talvez seja hora de desafiar a relação tradicional de produção de trabalho. Em vez de procurar mão de obra barata em todo o mundo como a Scale AI, é melhor aproveitar as características distribuídas da blockchain e permitir que a força de trabalho espalhada pelo mundo participe da contribuição de dados por meio de incentivos abertos e transparentes garantidos por contratos inteligentes.
Para tarefas de trabalho intensivo, como etiquetagem de dados e avaliação de modelos, o uso do Web3 DataFi é mais favorável à diversidade de participantes do que a abordagem centralizada de estabelecer fábricas de dados, o que também tem um significado a longo prazo para evitar viés de dados.
Como evitar a tragédia da "Fábrica de Couro Jiangnan"? Naturalmente, devemos usar o sistema de incentivos com etiquetas de preço claras em contratos inteligentes para substituir a escuridão da natureza humana.
No contexto da desglobalização inevitável, como podemos continuar a alcançar arbitragem geográfica de baixo custo? É obviamente mais difícil abrir empresas em todo o mundo, então por que não contornar as barreiras do velho mundo e abraçar o método de liquidação em cadeia?
"Os intermediários lucrando com a diferença de preços" é uma dor eterna para ambos os lados da oferta e da demanda. Em vez de deixar uma empresa de dados centralizada agir como intermediária, é melhor criar uma plataforma na cadeia, através de um mercado aberto como o Taobao, para que os lados da oferta e da demanda de dados possam se conectar de forma mais transparente e eficiente.
Com o desenvolvimento do ecossistema de IA on-chain, a demanda por dados on-chain tornará-se mais vigorosa, segmentada e diversificada. Apenas um mercado descentralizado pode digerir eficientemente essa demanda e transformá-la em prosperidade ecológica.
Para os investidores de retalho, o DataFi é também o projeto de IA mais descentralizado que é mais favorável à participação de investidores de retalho comuns.
Embora o surgimento de ferramentas de IA tenha diminuído o limiar de aprendizagem até certo ponto, e a intenção original da IA descentralizada seja romper o atual monopólio dos negócios de IA por gigantes; no entanto, deve-se admitir que muitos projetos atuais não são muito acessíveis para investidores de varejo sem formação técnica - participar da mineração em redes de computação descentralizada costuma ser acompanhado de um caro investimento inicial em hardware, e o limiar técnico do mercado de modelos pode facilmente desestimular participantes comuns.
Em contraste, é uma das poucas oportunidades que usuários comuns podem aproveitar na revolução da IA. O Web3 permite que você participe dela completando várias tarefas simples, incluindo fornecer dados, rotular e avaliar modelos com base na intuição e instinto do cérebro humano, ou ainda usar ferramentas de IA para realizar algumas criações simples, participar em transações de dados, etc. Para os velhos motoristas do Partido Mao, o valor de dificuldade é basicamente zero.
Projetos potenciais do Web3 DataFi
Onde o dinheiro flui, aí está a direção. Além do Scale AI receber um investimento de 14,3 bilhões de dólares da Meta e o preço das ações da Palantir disparar mais de 5 vezes em um ano no mundo Web2, o DataFi também teve um desempenho muito bom no financiamento Web3. Aqui damos uma breve introdução a esses projetos.
Sahara AI, @SaharaLabsAI, levantou 49 milhões de dólares
O objetivo final da Sahara AI é construir uma super infraestrutura de IA descentralizada e um mercado de negociação. O primeiro setor a ser testado é o AI Data. A versão beta pública da sua Plataforma de Serviços de Dados DSP ( será lançada no dia 22 de julho. Os usuários podem obter recompensas em tokens contribuindo com dados, participando na rotulagem de dados e em outras tarefas.
Link: app.saharaai.com
)# Yupp, @yupp_ai, arrecadou 33 milhões de dólares
Yupp é uma plataforma de feedback de modelos de IA que coleta feedback dos usuários sobre a saída do modelo. A tarefa principal atual é que os usuários podem comparar a saída de diferentes modelos para o mesmo aviso e, em seguida, selecionar aquele que acham melhor. Completar a tarefa pode render pontos Yupp, que podem ser trocados por stablecoins fiduciárias, como o USDC.
Link:
Vana, @vana, arrecadou 23 milhões de dólares
A Vana concentra-se em converter os dados pessoais dos usuários ###, como atividades em redes sociais, histórico de navegação, etc.( em ativos digitais monetizáveis. Os usuários podem autorizar o upload de seus dados pessoais para o respectivo pool de liquidez de dados )DLP( nos DataDAOs. Esses dados serão agrupados e utilizados para participar de tarefas como treinamento de modelos de IA, e os usuários também receberão recompensas em tokens correspondentes.
Link:
)# Chainbase, @ChainbaseHQ, angaria 16,5 milhões de dólares
O negócio da Chainbase foca em dados on-chain e atualmente cobre mais de 200 blockchains, transformando atividades on-chain em ativos de dados estruturados, verificáveis e monetizáveis para o desenvolvimento de dApps. O negócio da Chainbase é principalmente obtido através de indexação multi-chain e outros métodos, e os dados são processados através do seu sistema Manuscript e do modelo de IA Theia. Usuários comuns atualmente não estão muito envolvidos.
Sapien, @JoinSapien, angariou 15,5 milhões de dólares
A Sapien visa converter o conhecimento humano em dados de treinamento de IA de alta qualidade em larga escala. Qualquer pessoa pode realizar a anotação de dados na plataforma e garantir a qualidade dos dados por meio de verificação por pares. Ao mesmo tempo, os usuários são incentivados a construir uma reputação de longo prazo ou fazer compromissos através de staking para ganhar mais recompensas.
Link:
Prisma X, @PrismaXai , angaria 11 milhões de dólares
O Prisma X quer ser uma camada de coordenação aberta para robôs, onde a coleta de dados físicos é fundamental. Este projeto está atualmente em suas fases iniciais. De acordo com o white paper recentemente lançado, a participação pode incluir investir em robôs para coletar dados, operar remotamente os dados dos robôs, etc. Atualmente, um quiz baseado no white paper está aberto, e você pode participar para ganhar pontos.
Link:
Masa, @getmasafi, arrecadou 8,9 milhões de dólares
Masa é um dos principais projetos de subnet no ecossistema Bittensor, e atualmente opera a Subnet de Dados Número 42 e a Subnet de Agentes Número 59. A subnet de dados está comprometida em fornecer acesso em tempo real a dados. Atualmente, os mineradores principalmente capturam dados em tempo real no X/Twitter através de hardware TEE. Para usuários comuns, a dificuldade e o custo de participação são relativamente altos.
Irys, @irys_xyz, levantou 8,7 milhões de dólares
A Irys foca em armazenamento de dados programável e computação, visando fornecer soluções eficientes e de baixo custo para IA, aplicações descentralizadas ###dApps( e outras aplicações intensivas em dados. Em termos de contribuição de dados, os usuários comuns não podem participar muito no momento, mas há várias atividades para participar na atual fase de testnet.
Link:
)# ORO, @getoro_xyz, levantou 6 milhões de dólares
O que a ORO deseja fazer é capacitar pessoas comuns a participarem na contribuição de IA. Os métodos de apoio incluem: 1. Vincular a sua conta pessoal para contribuir com dados pessoais, incluindo contas sociais, dados de saúde, contas de comércio eletrónico e financeiras; 2. Completar tarefas de dados. A rede de testes já está online e você pode participar.
Link: app.getoro.xyz
Gata, @Gata_xyz, levantou 4 milhões de dólares
Posicionado como uma camada de dados descentralizada, a Gata atualmente tem três produtos principais para participar: 1. Data Agent: uma série de Agentes de IA que podem automaticamente executar e processar dados assim que o usuário abre a página da web; 2. AII-in-one Chat: um mecanismo semelhante à avaliação de modelo do Yupp para ganhar recompensas; 3. GPT-to-Earn: um plug-in de navegador que coleta os dados de conversação dos usuários no ChatGPT.
Link:
Como você vê esses projetos atuais?
Neste momento, as barreiras de entrada para estes projetos não são geralmente altas, mas deve-se reconhecer que, uma vez que os usuários e a adesão ecológica sejam acumulados, as vantagens da plataforma acumular-se-ão rapidamente. Portanto, nas fases iniciais, os esforços devem ser focados em incentivos e na experiência do usuário. Apenas atraindo um número suficiente de usuários é que o negócio de big data pode ser realizado.
No entanto, como projetos intensivos em mão de obra, estas plataformas de dados também devem considerar como gerir a mão de obra e garantir a qualidade da saída de dados enquanto atraem mão de obra. Afinal, um problema comum de muitos projetos Web3 é que a maioria dos usuários na plataforma são apenas gananciosos implacáveis. Muitas vezes sacrificam a qualidade em prol de benefícios de curto prazo. Se forem permitidos tornar-se os principais usuários da plataforma, o mau dinheiro inevitavelmente expulsará o bom dinheiro, e, em última análise, a qualidade dos dados não pode ser garantida e os compradores não podem ser atraídos. Neste momento, vimos que projetos como Sahara e Sapien enfatizaram a qualidade dos dados e se esforçaram para estabelecer uma relação de cooperação a longo prazo e saudável com a mão de obra na plataforma.
Além disso, a falta de transparência é outro problema dos atuais projetos em cadeia. De fato, o triângulo impossível da blockchain forçou muitos projetos a seguirem o caminho de "centralização impulsiona descentralização" na fase de startup. Mas agora, cada vez mais projetos em cadeia dão às pessoas a impressão de "projetos Web2 antigos com pele Web3" - há muito poucos dados públicos que podem ser rastreados na cadeia, e até mesmo o roadmap é difícil de ver a determinação de longo prazo de abertura e transparência. Isso é indubitavelmente tóxico para o desenvolvimento saudável a longo prazo do Web3 DataFi, e também esperamos que mais projetos mantenham sempre suas intenções originais e acelerem o ritmo de abertura e transparência.
Finalmente, o caminho de adoção em massa da DataFi deve também ser dividido em duas partes: uma é atrair um número suficiente de participantes toC para se juntarem à rede, formando uma nova força para a coleta/geração de dados e consumidores da economia de IA, formando um ciclo ecológico fechado; a outra é ganhar reconhecimento das atuais empresas mainstream toB. Afinal, a curto prazo, elas são a principal fonte de grandes pedidos de dados com seus bolsos fundos. Nesse aspecto, também vimos que a Sahara AI, Vana, etc., fizeram bons progressos.
Conclusão
Para ser mais fatalista, o DataFi é sobre usar a inteligência humana para nutrir a inteligência das máquinas a longo prazo, enquanto usa contratos inteligentes como um contrato para garantir que o trabalho da inteligência humana seja lucrativo e, em última análise, desfrute do feedback da inteligência das máquinas.
Se você está ansioso com a incerteza da era da IA, e se ainda tem ideais de blockchain em meio às oscilações do mundo das criptomoedas, então seguir os passos de um grupo de gigantes do capital e se juntar ao DataFi é uma boa escolha para acompanhar a tendência.