Ajuste Fino do Llama 3.2 11B com Q-LoRA para Perguntas e Respostas Extrativas

terça-feira, novembro 26, 2024 12:00 AM

251

Modelos de Linguagem de Grande Escala (LLMs) tornaram-se ferramentas essenciais em processamento de linguagem natural, capazes de lidar com uma variedade de tarefas. No entanto, devido ao seu treinamento amplo, eles podem não se destacar em aplicações específicas sem uma adaptação adicional. Técnicas de ajuste fino, como Q-LoRA, permitem que pesquisadores adaptem modelos pré-treinados como o Llama 3.2 11B para tarefas específicas, como perguntas e respostas extrativas. Este artigo descreve o processo de ajuste fino do Llama 3.2 11B usando Q-LoRA no conjunto de dados SQuAD v2, mostrando as melhorias de desempenho alcançadas por meio deste método.

LoRA, ou Adaptação de Baixa Classificação, é uma técnica que introduz novos pesos a um modelo existente sem alterar os parâmetros originais. Ao adicionar pesos de adaptador que ajustam as saídas de certas camadas, o LoRA permite que os modelos mantenham seu conhecimento pré-treinado enquanto adquirem novas capacidades adaptadas a tarefas específicas. Neste experimento, o foco está no ajuste fino do Llama 3.2 11B para perguntas e respostas extrativas, visando extrair segmentos de texto precisos que respondem diretamente às consultas dos usuários, em vez de resumir ou reformular o conteúdo. O experimento foi realizado em uma plataforma Google Colab utilizando uma GPU A100, com a biblioteca Hugging Face Transformers facilitando a implementação.

Os resultados do processo de ajuste fino foram promissores, demonstrando um aumento significativo no desempenho do modelo no conjunto de validação. O score BERT melhorou de 0.6469 para 0.7505, enquanto o score de correspondência exata subiu de 0.116 para 0.418. Essas melhorias indicam que a técnica Q-LoRA adapta efetivamente o modelo Llama 3.2 11B para tarefas de perguntas e respostas extrativas. Este artigo serve como um guia para pesquisadores que desejam aplicar métodos semelhantes a outros modelos e tarefas, destacando o potencial do ajuste fino no campo do processamento de linguagem natural.

Source: spheron.network

Related News

há 2 dias

io.net Relata Crescimento de Receita em Meio a Desafios de Mercado

No último relatório trimestral, a io.net demonstrou um crescimento significativo na receita, alcançando um impressionante aumento de 82,6%, o que elevou sua receita total para 5,7 milhões de dólares. Esse aumento na receita é particularmente notável, dado a contração mais ampla do mercado de criptomoedas, onde a capitalização de mercado de seu token IO despencou 71,4% para 108 milhões de dólares, juntamente com uma queda de 74,9% no preço do token. Apesar desses desafios, a io.net integrou-se com várias plataformas focadas em IA e computação, incluindo parcerias com Zerebro, KREA e Injective, visando aprimorar as capacidades de computação GPU descentralizada para aplicações em IA e DeFi. A infraestrutura da io.net, que é construída em uma rede descentralizada de GPUs e CPUs, permite acesso escalável a recursos computacionais, particularmente para aplicações de aprendizado de máquina e IA. A plataforma suporta uma ampla gama de frameworks de aprendizado de máquina, garantindo flexibilidade e eficiência na alocação de recursos. No entanto, os recursos computacionais verificados diariamente em média apresentaram uma queda, com GPUs e CPUs verificadas caindo 11,1% e 4,5%, respectivamente. Essa redução reflete os desafios contínuos do lado da oferta e uma diminuição nos incentivos de token, que impactaram a atividade geral dentro da rede. Apesar das métricas de desempenho mistas, a io.net manteve um ritmo constante de desenvolvimento, com numerosas colaborações voltadas para expandir seu ecossistema. As parcerias formadas no primeiro trimestre de 2025, incluindo aquelas com a Alpha Network e a Mira Network, destacam o compromisso da io.net em aprimorar a infraestrutura de IA descentralizada. À medida que o projeto continua a refinar seus modelos econômicos e expandir suas capacidades de rede, ele permanece um jogador chave no cenário em evolução dos recursos computacionais descentralizados, mesmo em meio a um ambiente de mercado desafiador.

IA Financiamento

há 2 dias

Ben Goertzel: Pioneiro da IA Descentralizada para um Futuro Melhor

Ben Goertzel, um pioneiro em inteligência artificial, tem defendido a IA descentralizada desde que escreveu sua primeira linha de código há 30 anos. Com o mundo à beira de alcançar a Inteligência Geral Artificial (AGI), Goertzel enfatiza a importância da descentralização para garantir que essa poderosa tecnologia beneficie a humanidade, em vez de servir a poderes centralizados. Na recente conferência Consensus em Toronto, ele expressou otimismo de que a AGI poderia ser lançada nos próximos um a três anos por meio de seu projeto, SingularityNET, que visa criar um mercado global para serviços de IA. O projeto fez avanços significativos, incluindo parcerias com a Mind Network e a Filecoin Foundation, um investimento de 53 milhões de dólares em um supercomputador modular e uma fusão de tokens com o Ocean Protocol e Fetch.ai. A visão de Goertzel para a IA descentralizada está enraizada em suas experiências iniciais com a internet, que ele inicialmente viu como uma plataforma descentralizada. No entanto, ele observa que a ascensão de gigantes da tecnologia como Google e Facebook levou a uma internet mais centralizada, o que mina os princípios fundamentais da descentralização. Ele argumenta que, para que a AGI seja uma força para o bem, deve ser construída sobre uma arquitetura descentralizada desde o início. Essa filosofia é refletida no design do SingularityNET, Hyperon e na próxima ASI Chain, que é adaptada para aplicações de IA descentralizadas. Goertzel acredita que a trajetória da era pós-AGI diferirá significativamente com base no papel dos ecossistemas descentralizados em seu desenvolvimento. Além de seu trabalho em IA, Goertzel tem um histórico de exploração de conceitos de dinheiro descentralizado que remonta aos anos 90. Embora ele e seus colegas inicialmente tenham descartado a praticidade de transações descentralizadas devido a preocupações com velocidade e custo, o surgimento do Bitcoin validou algumas de suas ideias iniciais. Ele reflete humoristicamente sobre as oportunidades perdidas daquela época, reconhecendo que a falta de acumen empresarial os impediu de imaginar as aplicações mais sombrias do dinheiro descentralizado. Hoje, o compromisso de Goertzel com a IA descentralizada continua a ganhar força, posicionando-o e suas iniciativas como jogadores-chave no cenário em evolução da tecnologia e governança.

IA Financiamento

há 6 dias

Investidores Olham para os Tokens de Cripto GRASS e PI em Meio a Liquidações de Mercado

Atualmente, os investidores estão focados nos tokens de cripto GRASS e PI, que estão fazendo manchetes devido às suas propostas de valor únicas. A venda antecipada da Best Wallet também chamou atenção, arrecadando mais de 12 milhões de dólares. Nas últimas 24 horas, exchanges de cripto como Binance, Bybit e OKX liquidaram mais de 665 milhões de dólares em posições alavancadas, afetando mais de 153.000 traders. Apesar dessa turbulência, muitos traders permanecem otimistas em relação ao GRASS e ao PI, vendo-os como potenciais tokens de destaque para o segundo trimestre de 2025. Notavelmente, o cripto PI subiu 80% desde o início de abril, enquanto o GRASS aumentou 140% desde seu ponto mais baixo em outubro de 2024. O GRASS é uma plataforma descentralizada de camada 2 construída sobre a Solana, apoiada por proeminentes capitalistas de risco como Polychain Capital e Tribe Capital. Ela permite que os usuários monetizem a largura de banda da internet ociosa, o que é crucial para o treinamento de modelos de IA. A plataforma facilitou a coleta de impressionantes 57 milhões de GB de dados da web pública apenas no primeiro trimestre de 2025. Os participantes ganham pontos GRASS, que podem ser convertidos em tokens GRASS, e a plataforma viu um aumento significativo no número de operadores de nós, indicando um crescente interesse e adoção. Analistas estão classificando o GRASS entre as principais criptomoedas a serem exploradas, destacando seu potencial nos setores de IA e infraestrutura física descentralizada (DePIN). Por outro lado, a Pi Network está avançando em direção à descentralização, tendo recentemente desativado seu nó central, capacitando assim sua comunidade de mais de 60 milhões de usuários. Apesar de enfrentar ceticismo quanto à sua legitimidade, a mainnet da Pi Network foi lançada em fevereiro de 2025, e o preço do cripto PI tem flutuado significativamente desde então. À medida que GRASS e PI continuam a evoluir, os investidores são aconselhados a realizar uma pesquisa completa antes de tomar decisões de investimento. Além disso, a venda antecipada da Best Wallet está gerando entusiasmo, com suas características e medidas de segurança posicionando-a como uma forte concorrente no espaço das carteiras de cripto.

Financiamento IA

há 10 dias

Amp e Aethir Brilham em Meio ao Resfriamento do Mercado de Cripto

Em um mercado de cripto em resfriamento, Amp (AMP) e Aethir (ATH) se destacaram como performers notáveis, cada um experimentando um aumento significativo de 16% em valor. Amp está atualmente avaliado em $0.0051, sustentado por um forte momentum de alta apoiado por médias móveis exponenciais (EMAs) e sinais de negociação favoráveis de indicadores como MACD e RSI, apesar dos avisos sobre condições de sobrecompra. Enquanto isso, Aethir, que se concentra em soluções de blockchain impulsionadas por IA, disparou para $0.052, rompendo níveis de resistência significativos e mantendo um otimismo de alta, embora o RSI sobrecomprado sugira que os traders devem permanecer vigilantes. A divergência no mercado de cripto é evidente, já que Helium (HNT) enfrenta pressão de baixa, negociando a $4.00 e lutando abaixo da crítica EMA de 200 dias. Essa situação representa um risco de novas quedas se romper o suporte da EMA de 100 dias em $3.83. As trajetórias contrastantes de Amp e Aethir em relação ao Helium destacam a volatilidade persistente e a inovação dentro do mercado de ativos digitais, levando os traders a equilibrar ambição com estratégias de gerenciamento de risco. À medida que os traders navegam por essas águas turbulentas, a resiliência de Amp e Aethir sublinha o potencial de crescimento mesmo em meio à estagnação do mercado. Os investidores são incentivados a monitorar de perto os principais indicadores técnicos, particularmente os níveis de EMA e RSI, para identificar pontos de entrada ideais e gerenciar riscos de forma eficaz. Os desenvolvimentos contínuos nesses projetos refletem a natureza dinâmica do cenário das criptomoedas, onde a inovação continua a impulsionar o interesse e as oportunidades de investimento.

Financiamento IA

há 11 dias

A Recuperação da Solana e a Ascensão dos Projetos Impulsionados por IA Bittensor e Unilabs

A Solana (SOL) mostrou uma recuperação notável, voltando 90% de seu ponto mais baixo este ano, mas ainda permanece restrita abaixo do nível crítico de resistência de $180. Os analistas estão otimistas, sugerindo que o preço da Solana pode estar à beira de uma ruptura significativa, especialmente à medida que muitas moedas meme SOL dispararam recentemente. O sentimento atual do mercado é impulsionado por fundamentos fortes e uma trajetória ascendente, com a SOL pairando em torno da marca de $170. Um movimento decisivo acima da resistência de $180 pode abrir caminho para uma potencial alta em direção a $200 e além, possivelmente alcançando níveis em torno de $250. Nesse meio tempo, o Bittensor (TAO) emergiu como um jogador notável, mantendo um desempenho estável enquanto outras criptomoedas, incluindo o Bitcoin (BTC), enfrentaram dificuldades. O interesse no Bittensor é amplamente impulsionado por sua abordagem inovadora à IA descentralizada, que ganhou força após eventos de alto perfil, como a presença de Donald Trump em um jantar de inovadores de criptomoedas e IA. Atualmente negociado em torno de $457, o Bittensor demonstrou resiliência, mantendo ganhos e refletindo uma crescente confiança do mercado em projetos que integram tecnologia blockchain com IA. Enquanto isso, o Unilabs (UNIL) está ganhando impulso como uma alternativa atraente para investidores que buscam diversificar de redes tradicionais de camada-1 como a Solana. Com foco na fusão da transparência da blockchain com a infraestrutura de IA, o Unilabs está se posicionando como um líder no espaço DeFi e IA. Seu modelo inovador, que inclui um sistema de incentivos baseado em tokens, visa atrair usuários e desenvolvedores. À medida que o crescimento da Solana estagna, o Unilabs apresenta uma oportunidade única para os traders, potencialmente redefinindo os padrões para plataformas DeFi de IA em um cenário de criptomoeda em rápida evolução.

IA Financiamento

há 16 dias

Xangle se junta à Theta Network como Validador Empresarial, Melhorando a Infraestrutura Blockchain

No dia 9, a corporação de infraestrutura blockchain Xangle anunciou sua entrada na mainnet global de blockchain Theta Network como um validador empresarial. A Theta Network é renomada por fornecer infraestrutura de nuvem descentralizada adaptada para setores como inteligência artificial (IA), mídia, esportes e entretenimento. Ela possui uma estrutura robusta suportada por mais de 30.000 nós de borda distribuídos em todo o mundo, garantindo operação e governança eficientes. A rede recebeu investimentos estratégicos de entidades notáveis, incluindo Samsung Next, Sony Innovation Fund, Bertelsmann Digital Media Investments e Creative Artists Agency (CAA), com gigantes globais como Google, Samsung e Binance também participando como validadores empresariais. Como parte de seu compromisso com o ecossistema Theta, a Xangle irá apostar um total de 200.000 tokens Theta (THETA), melhorando significativamente a segurança e a governança da rede como um nó validador. A empresa pretende contribuir ativamente para a expansão da rede de infraestrutura física descentralizada (DePIN) e do ecossistema de IA que a Theta promove. Fundada em 2018, a Xangle se estabeleceu como um dos principais provedores de serviços de infraestrutura web3 e plataforma de pesquisa na Coreia, oferecendo hubs comunitários, exploradores de blockchain e relatórios abrangentes de análise da indústria web3. Ela também atuou como validador para vários projetos globais, incluindo Aptos, Babylon, 0G e Initia. Lee Hyun-woo, co-CEO da Xangle, expressou entusiasmo sobre a parceria, afirmando: "Estamos muito satisfeitos por sermos listados como um validador empresarial ao lado do Google, Samsung e CAA através de nossa parceria estratégica com a Theta." Ele enfatizou que a aposta na rede de validadores da Theta se alinha perfeitamente com a missão da Xangle de aumentar a confiança, descentralização e transparência nas blockchains de camada 1. Mitch Liu, cofundador e CEO da Theta Network, ecoou esse sentimento, destacando as forças da Xangle em análise de blockchain e desenvolvimento de ecossistemas, e antecipando sinergias significativas na promoção do Theta (THETA) e do Theta Fuel (TFUEL), além de melhorar a segurança e escalabilidade geral da blockchain Theta.

IA Financiamento

Inscreva-se para as últimas notícias e atualizações da DePIN