Ajuste fino de Llama 3.2 11B con Q-LoRA para respuesta a preguntas extractivas

martes, noviembre 26, 2024 12:00 AM

251

Los Modelos de Lenguaje Grande (LLMs) se han convertido en herramientas esenciales en el procesamiento del lenguaje natural, capaces de manejar una variedad de tareas. Sin embargo, debido a su amplio entrenamiento, pueden no sobresalir en aplicaciones específicas sin una adaptación adicional. Las técnicas de ajuste fino, como Q-LoRA, permiten a los investigadores adaptar modelos preentrenados como Llama 3.2 11B para tareas particulares, como la respuesta a preguntas extractivas. Este artículo describe el proceso de ajuste fino de Llama 3.2 11B utilizando Q-LoRA en el conjunto de datos SQuAD v2, mostrando las mejoras en el rendimiento logradas a través de este método.

LoRA, o Adaptación de Bajo Rango, es una técnica que introduce nuevos pesos a un modelo existente sin alterar los parámetros originales. Al agregar pesos de adaptador que ajustan las salidas de ciertas capas, LoRA permite que los modelos retengan su conocimiento preentrenado mientras adquieren nuevas capacidades adaptadas a tareas específicas. En este experimento, el enfoque está en el ajuste fino de Llama 3.2 11B para la respuesta a preguntas extractivas, con el objetivo de extraer segmentos de texto precisos que respondan directamente a las consultas de los usuarios, en lugar de resumir o reformular el contenido. El experimento se llevó a cabo en una plataforma de Google Colab utilizando una GPU A100, con la biblioteca Hugging Face Transformers facilitando la implementación.

Los resultados del proceso de ajuste fino fueron prometedores, demostrando un aumento significativo en el rendimiento del modelo en el conjunto de validación. La puntuación BERT mejoró de 0.6469 a 0.7505, mientras que la puntuación de coincidencia exacta aumentó de 0.116 a 0.418. Estas mejoras indican que la técnica Q-LoRA adapta efectivamente el modelo Llama 3.2 11B para tareas de respuesta a preguntas extractivas. Este artículo sirve como guía para investigadores que buscan aplicar métodos similares a otros modelos y tareas, destacando el potencial del ajuste fino en el ámbito del procesamiento del lenguaje natural.

Source: spheron.network

Related News

hace 2 días

io.net informa sobre el crecimiento de ingresos en medio de desafíos del mercado

En el último informe trimestral, io.net ha demostrado un crecimiento significativo en los ingresos, logrando un impresionante aumento del 82.6%, lo que llevó sus ingresos totales a 5.7 millones de dólares. Este aumento en los ingresos es particularmente notable dado la contracción más amplia en el mercado de criptomonedas, donde la capitalización de mercado de su token IO se desplomó un 71.4% a 108 millones de dólares, junto con una caída del 74.9% en el precio del token. A pesar de estos desafíos, io.net se ha integrado con éxito con varias plataformas enfocadas en AI y computación, incluidas asociaciones con Zerebro, KREA e Injective, con el objetivo de mejorar las capacidades de computación GPU descentralizadas para aplicaciones en AI y DeFi. La infraestructura de io.net, que se basa en una red descentralizada de GPUs y CPUs, permite un acceso escalable a recursos de computación, particularmente para aplicaciones de aprendizaje automático y AI. La plataforma admite una amplia gama de marcos de aprendizaje automático, asegurando flexibilidad y eficiencia en la asignación de recursos. Sin embargo, los recursos de computación verificados promediados diariamente han visto una disminución, con GPUs y CPUs verificadas cayendo un 11.1% y un 4.5% respectivamente. Esta reducción refleja los desafíos continuos del lado de la oferta y una disminución en los incentivos de tokens, lo que ha impactado la actividad general dentro de la red. A pesar de las métricas de rendimiento mixtas, io.net ha mantenido un ritmo constante de desarrollo, con numerosas colaboraciones destinadas a expandir su ecosistema. Las asociaciones formadas en el primer trimestre de 2025, incluidas las de Alpha Network y Mira Network, destacan el compromiso de io.net con la mejora de la infraestructura de AI descentralizada. A medida que el proyecto continúa refinando sus modelos económicos y expandiendo sus capacidades de red, sigue siendo un actor clave en el paisaje en evolución de los recursos de computación descentralizados, incluso en medio de un entorno de mercado desafiante.

IA Financiación

hace 2 días

Ben Goertzel: Pionero de la IA descentralizada para un futuro mejor

Ben Goertzel, un pionero en inteligencia artificial, ha estado abogando por la IA descentralizada desde que escribió su primera línea de código hace 30 años. A medida que el mundo está al borde de lograr la Inteligencia General Artificial (AGI), Goertzel enfatiza la importancia de la descentralización para asegurar que esta poderosa tecnología beneficie a la humanidad en lugar de servir a poderes centralizados. En la reciente conferencia Consensus en Toronto, expresó su optimismo de que la AGI podría lanzarse dentro de uno a tres años a través de su proyecto, SingularityNET, que tiene como objetivo crear un mercado global para servicios de IA. El proyecto ha logrado avances significativos, incluidas asociaciones con Mind Network y la Filecoin Foundation, una inversión de 53 millones de dólares en una supercomputadora modular y una fusión de tokens con Ocean Protocol y Fetch.ai. La visión de Goertzel para la IA descentralizada se basa en sus primeras experiencias con Internet, que inicialmente vio como una plataforma descentralizada. Sin embargo, señala que el auge de gigantes tecnológicos como Google y Facebook ha llevado a un Internet más centralizado, lo que socava los principios fundamentales de la descentralización. Argumenta que para que la AGI sea una fuerza para el bien, debe construirse sobre una arquitectura descentralizada desde el principio. Esta filosofía se refleja en el diseño de SingularityNET, Hyperon y la próxima ASI Chain, que está diseñada para aplicaciones de IA descentralizadas. Goertzel cree que la trayectoria de la era post-AGI diferirá significativamente según el papel de los ecosistemas descentralizados en su desarrollo. Además de su trabajo en IA, Goertzel tiene una historia de exploración de conceptos de dinero descentralizado que se remonta a los años 90. Aunque él y sus colegas inicialmente desestimaron la viabilidad de las transacciones descentralizadas debido a preocupaciones sobre la velocidad y el costo, la aparición de Bitcoin ha validado algunas de sus ideas tempranas. Reflexiona humorísticamente sobre las oportunidades perdidas de esa época, reconociendo que su falta de perspicacia comercial les impidió imaginar las aplicaciones más oscuras del dinero descentralizado. Hoy en día, el compromiso de Goertzel con la IA descentralizada continúa ganando impulso, posicionándolo a él y a sus iniciativas como actores clave en el paisaje en evolución de la tecnología y la gobernanza.

IA Financiación

hace 6 días

Los inversores ponen su mirada en los tokens criptográficos GRASS y PI en medio de liquidaciones del mercado

Los inversores se están enfocando actualmente en los tokens criptográficos GRASS y PI, que están haciendo titulares debido a sus propuestas de valor únicas. La preventa en curso de Best Wallet también ha atraído atención, recaudando más de 12 millones de dólares. En las últimas 24 horas, intercambios de criptomonedas perpetuas como Binance, Bybit y OKX han liquidado más de 665 millones de dólares en posiciones apalancadas, afectando a más de 153,000 traders. A pesar de este tumulto, muchos traders siguen siendo optimistas sobre GRASS y PI, viéndolos como posibles tokens de ruptura para el segundo trimestre de 2025. Notablemente, el cripto PI ha aumentado un 80% desde principios de abril, mientras que GRASS ha aumentado un 140% desde su mínimo histórico a finales de octubre de 2024. GRASS es una plataforma descentralizada de capa 2 construida sobre Solana, respaldada por destacados capitalistas de riesgo como Polychain Capital y Tribe Capital. Permite a los usuarios monetizar el ancho de banda de internet inactivo, lo cual es crucial para el entrenamiento de modelos de IA. La plataforma ha facilitado la recopilación de impresionantes 57 millones de GB de datos web públicos solo en el primer trimestre de 2025. Los participantes ganan puntos GRASS, que son convertibles en tokens GRASS, y la plataforma ha visto un aumento significativo en los operadores de nodos, lo que indica un creciente interés y adopción. Los analistas están clasificando a GRASS entre las principales criptomonedas a explorar, destacando su potencial en los sectores de IA y redes de infraestructura física descentralizada (DePIN). Por otro lado, Pi Network está avanzando hacia la descentralización, habiendo desactivado recientemente su nodo central, empoderando así a su comunidad de más de 60 millones de usuarios. A pesar de enfrentar escepticismo sobre su legitimidad, la red principal de Pi Network se lanzó en febrero de 2025, y el precio del cripto PI ha fluctuado significativamente desde entonces. A medida que GRASS y PI continúan evolucionando, se aconseja a los inversores que realicen una investigación exhaustiva antes de tomar decisiones de inversión. Además, la preventa de Best Wallet está generando emoción, con sus características y medidas de seguridad que lo posicionan como un fuerte competidor en el espacio de las billeteras criptográficas.

Financiación IA

hace 10 días

Amp y Aethir brillan en medio de la enfriamiento del mercado cripto

En un mercado cripto en enfriamiento, Amp (AMP) y Aethir (ATH) han surgido como destacados, cada uno experimentando un notable aumento del 16% en su valor. Amp está valorado actualmente en $0.0051, impulsado por un fuerte impulso alcista respaldado por promedios móviles exponenciales (EMAs) clave y señales de trading favorables de indicadores como MACD y RSI, a pesar de las advertencias sobre condiciones de sobrecompra. Mientras tanto, Aethir, que se centra en soluciones de blockchain impulsadas por IA, ha aumentado a $0.052, rompiendo niveles de resistencia significativos y manteniendo un optimismo alcista, aunque el RSI sobrecomprado sugiere que los traders deben permanecer vigilantes. La divergencia en el mercado cripto es evidente, ya que Helium (HNT) enfrenta presión a la baja, cotizando a $4.00 y luchando por debajo del crítico EMA de 200 días. Esta situación plantea el riesgo de más caídas si se rompe el soporte del EMA de 100 días en $3.83. Las trayectorias contrastantes de Amp y Aethir frente a Helium destacan la persistente volatilidad y la innovación dentro del mercado de activos digitales, lo que lleva a los traders a equilibrar la ambición con estrategias de gestión de riesgos. A medida que los traders navegan por estas aguas turbulentas, la resiliencia de Amp y Aethir subraya el potencial de crecimiento incluso en medio de la estancación del mercado. Se anima a los inversores a monitorear de cerca los indicadores técnicos clave, particularmente los niveles de EMAs y RSI, para identificar puntos de entrada óptimos y gestionar riesgos de manera efectiva. Los desarrollos en curso en estos proyectos reflejan la naturaleza dinámica del paisaje de las criptomonedas, donde la innovación continúa impulsando el interés y las oportunidades de inversión.

Financiación IA

hace 11 días

La recuperación de Solana y el auge de los proyectos impulsados por IA Bittensor y Unilabs

Solana (SOL) ha mostrado una notable recuperación, rebotando un 90% desde su punto más bajo de este año, aunque sigue limitado por debajo del nivel de resistencia crítico de $180. Los analistas son optimistas y sugieren que el precio de Solana podría estar al borde de una ruptura significativa, especialmente ya que muchas monedas meme de SOL han aumentado recientemente. El sentimiento actual del mercado está impulsado por fundamentos sólidos y una trayectoria ascendente, con SOL rondando los $170. Un movimiento decisivo por encima de la resistencia de $180 podría allanar el camino para un posible aumento hacia los $200 y más allá, posiblemente alcanzando niveles alrededor de $250. En medio de esto, Bittensor (TAO) ha emergido como un jugador notable, manteniendo un rendimiento constante mientras otras criptomonedas, incluido Bitcoin (BTC), han tenido dificultades. El interés en Bittensor se debe en gran parte a su enfoque innovador hacia la IA descentralizada, que ha ganado tracción tras eventos de alto perfil, como la asistencia de Donald Trump a una cena de innovadores en cripto y IA. Actualmente cotizando alrededor de $457, Bittensor ha demostrado resiliencia, manteniendo ganancias y reflejando una creciente confianza del mercado en proyectos que integran tecnología blockchain con IA. Mientras tanto, Unilabs (UNIL) está ganando impulso como una alternativa convincente para los inversores que buscan diversificarse de redes tradicionales de capa 1 como Solana. Con un enfoque en fusionar la transparencia de blockchain con infraestructura de IA, Unilabs se está posicionando como líder en el espacio DeFi y de IA. Su modelo innovador, que incluye un sistema de incentivos basado en tokens, tiene como objetivo atraer tanto a usuarios como a desarrolladores. A medida que el crecimiento de Solana se estanca, Unilabs presenta una oportunidad única para los comerciantes, redefiniendo potencialmente los estándares para las plataformas DeFi de IA en un paisaje cripto en rápida evolución.

IA Financiación

hace 16 días

Xangle se une a Theta Network como validador empresarial, mejorando la infraestructura blockchain

El 9, la corporación de infraestructura blockchain Xangle anunció su entrada en la red principal global de blockchain Theta Network como validador empresarial. Theta Network es conocida por proporcionar infraestructura de nube descentralizada adaptada a sectores como inteligencia artificial (IA), medios, deportes y entretenimiento. Cuenta con un marco robusto respaldado por más de 30,000 nodos de borde distribuidos en todo el mundo, lo que garantiza un funcionamiento y gobernanza eficientes. La red ha atraído inversiones estratégicas de entidades notables, incluidas Samsung Next, Sony Innovation Fund, Bertelsmann Digital Media Investments y Creative Artists Agency (CAA), con gigantes globales como Google, Samsung y Binance también participando como validadores empresariales. Como parte de su compromiso con el ecosistema Theta, Xangle apostará un total de 200,000 tokens Theta (THETA), mejorando significativamente la seguridad y gobernanza de la red como nodo validador. La empresa tiene como objetivo contribuir activamente a la expansión de la red de infraestructura física descentralizada (DePIN) y el ecosistema de IA que promueve Theta. Fundada en 2018, Xangle se ha establecido como un proveedor líder de servicios de infraestructura web3 y plataforma de investigación en Corea, ofreciendo hubs comunitarios, exploradores de blockchain e informes de análisis de la industria web3. También ha servido como validador para varios proyectos globales, incluidos Aptos, Babylon, 0G e Initia. Lee Hyun-woo, co-CEO de Xangle, expresó su entusiasmo por la asociación, afirmando: "Estamos muy contentos de ser listados como un validador empresarial junto a Google, Samsung y CAA a través de nuestra asociación estratégica con Theta." Enfatizó que apostar en la red de validadores de Theta se alinea perfectamente con la misión de Xangle de mejorar la confianza, la descentralización y la transparencia en las blockchains de capa 1. Mitch Liu, cofundador y CEO de Theta Network, hizo eco de este sentimiento, destacando las fortalezas de Xangle en análisis de blockchain y desarrollo de ecosistemas, y anticipando sinergias significativas en la promoción de Theta (THETA) y Theta Fuel (TFUEL), además de mejorar la seguridad y escalabilidad general de la blockchain de Theta.

IA Financiación

Regístrate para las últimas noticias y actualizaciones de DePIN