Mejorando el Recall de Contexto en la Generación Aumentada por Recuperación

viernes, noviembre 22, 2024 12:00 AM
2,604

La generación aumentada por recuperación (RAG) ha surgido como un método fundamental para integrar grandes modelos de lenguaje (LLMs) en aplicaciones comerciales especializadas, permitiendo la infusión de datos propietarios en las respuestas del modelo. A pesar de su efectividad durante la fase de prueba de concepto (POC), los desarrolladores a menudo enfrentan caídas significativas en la precisión al trasladar RAG a producción. Este problema es particularmente pronunciado durante la fase de recuperación, donde el objetivo es recuperar con precisión el contexto más relevante para una consulta dada, una métrica conocida como recall de contexto. Este artículo profundiza en estrategias para mejorar el recall de contexto mediante la personalización y ajuste fino de modelos de incrustación, mejorando en última instancia el rendimiento de RAG en aplicaciones del mundo real.

RAG opera en dos pasos principales: recuperación y generación. En la fase de recuperación, el modelo convierte texto en vectores, indexa, recupera y vuelve a clasificar estos vectores para identificar las mejores coincidencias. Sin embargo, los fallos en esta fase pueden llevar a contextos relevantes perdidos, resultando en un menor recall de contexto y salidas de generación menos precisas. Una solución efectiva es adaptar el modelo de incrustación, que está diseñado para entender las relaciones entre los datos textuales, para producir incrustaciones que sean específicas para el conjunto de datos que se está utilizando. Este ajuste fino permite al modelo generar vectores similares para oraciones similares, mejorando su capacidad para recuperar contextos que son altamente relevantes para la consulta.

Para mejorar el recall de contexto, es esencial preparar un conjunto de datos adaptado que refleje los tipos de consultas que el modelo encontrará. Esto implica extraer una variedad de preguntas de la base de conocimientos, parafrasearlas para variabilidad y organizarlas por relevancia. Además, construir un conjunto de datos de evaluación ayuda a evaluar el rendimiento del modelo en un entorno realista. Al emplear un Evaluador de Recuperación de Información, los desarrolladores pueden medir métricas como Recall@k y Precision@k para evaluar la precisión de recuperación. En última instancia, el ajuste fino del modelo de incrustación puede llevar a mejoras sustanciales en el recall de contexto, asegurando que RAG se mantenga preciso y confiable en entornos de producción.

Related News

La Visión de 4EVERLAND para 2025: Potenciando Web3 a través de la Innovación cover
hace 3 días
La Visión de 4EVERLAND para 2025: Potenciando Web3 a través de la Innovación
Al entrar en 2025, 4EVERLAND está preparado para aumentar su compromiso de empoderar a los desarrolladores de Web3 y a la comunidad global a través de tecnología descentralizada innovadora. Basándose en los éxitos de 2024, que incluyeron la ampliación de asociaciones con protocolos líderes y el lanzamiento de servicios avanzados de IA, 4EVERLAND se centra en ofrecer infraestructura de vanguardia que respalde el ecosistema Web3. El próximo año promete ser transformador, con una misión clara de mejorar las ofertas y fomentar un enfoque impulsado por la comunidad mientras la empresa continúa BUIDL. En el primer trimestre, 4EVERLAND presentará la plataforma agregadora 4EVERBoost, diseñada como una solución integral de lanzamiento de Dapp para desarrolladores de Web3. Esta plataforma tiene como objetivo optimizar el proceso de implementación de aplicaciones, permitiendo a los desarrolladores optimizar flujos de trabajo y alcanzar a sus audiencias objetivo de manera eficiente. Además, la empresa planea profundizar las asociaciones con actores clave como zkSync, Arbitrum y Optimism, mejorando la interoperabilidad de los protocolos para mejorar la experiencia general del desarrollador y atraer más proyectos a la plataforma 4EVERLAND. A medida que avanza el año, 4EVERLAND lanzará un mercado de modelos de IA descentralizado en el segundo trimestre, facilitando la integración sin problemas de recursos de computación de IA para los desarrolladores. La introducción del Trabajador de IA simplificará aún más la implementación de modelos de IA a gran escala. En el tercer trimestre, la versión abierta de la Red de Nodos 4EVER empoderará a los miembros de la comunidad para contribuir con recursos inactivos, mejorando la escalabilidad y la confiabilidad. Finalmente, en el cuarto trimestre se formará un DAO, permitiendo a los titulares de tokens participar en la gobernanza, aumentando así la transparencia y la participación de la comunidad en los procesos de toma de decisiones. En general, 2025 está destinado a ser un año de innovación y colaboración para 4EVERLAND, consolidando su papel en el panorama de Web3.
io.net se une al Programa de Socios de Dell Technologies para mejorar soluciones de GPU descentralizadas cover
hace 8 días
io.net se une al Programa de Socios de Dell Technologies para mejorar soluciones de GPU descentralizadas
io.net, un actor destacado en la red de infraestructura física descentralizada (DePIN) para GPUs, se ha unido recientemente al Programa de Socios de Dell Technologies. Esta alianza estratégica está diseñada para mejorar el desarrollo comercial, las ventas y los esfuerzos de marketing de io.net. Como socio autorizado y proveedor de servicios en la nube, io.net tiene como objetivo integrar su red de GPU descentralizada con la robusta infraestructura de Dell, proporcionando soluciones escalables y rentables adaptadas a tecnologías emergentes como la inteligencia artificial (IA), el aprendizaje automático (ML) y la computación de alto rendimiento (HPC). Tausif Ahmed, VP de Desarrollo Comercial en io.net, enfatizó que esta asociación marca un hito significativo para la empresa, posicionándola como un proveedor líder de soluciones en los sectores de IA, ML y HPC. El Programa de Socios de Dell Technologies es una iniciativa internacional que equipa a los socios con recursos esenciales para el desarrollo comercial, las ventas y el marketing. Al unirse a este programa, io.net obtiene acceso a una gran cantidad de recursos que facilitarán la expansión de su red de GPU descentralizada y mejorarán sus capacidades en el mercado. Esta colaboración no solo permite a io.net desarrollar estrategias con otros socios, sino que también amplía su alcance global, permitiendo el despliegue de soluciones que integran sin problemas el poder de GPU descentralizadas con la infraestructura de hardware confiable de Dell. Se espera que la asociación refuerce los esfuerzos de comercialización de io.net y las actividades de co-marketing, beneficiando en última instancia a los clientes empresariales que buscan soluciones avanzadas de computación. A medida que la demanda de servicios de computación escalables y eficientes continúa en aumento en las industrias de IA y ML, la red descentralizada de io.net ofrece una alternativa convincente a los proveedores de servicios en la nube tradicionales. Al proporcionar clústeres de GPU bajo demanda que se pueden implementar rápidamente y a un costo menor, io.net aborda los cuellos de botella que enfrentan las organizaciones en el desarrollo de IA. La asociación con Dell está destinada a democratizar el acceso a soluciones de computación descentralizadas, particularmente para las empresas involucradas en el entrenamiento de IA, inferencia y casos de uso de HPC. Con la presencia global y la reputación confiable de Dell, io.net está bien posicionada para acelerar la adopción de estas soluciones innovadoras en diversas industrias.
Auki Labs presenta Posemesh: Una nueva era para la robótica colaborativa cover
hace 8 días
Auki Labs presenta Posemesh: Una nueva era para la robótica colaborativa
En el ámbito de la robótica, el desafío de permitir que múltiples robots colaboren de manera efectiva en espacios compartidos ha sido un obstáculo significativo. Auki Labs está abordando este problema a través del desarrollo del posemesh, un mapa espacial compartido que mejora la forma en que los robots perciben e interactúan con su entorno. Actualmente, la mayoría de los mapas espaciales carecen de información contextual, proporcionando solo datos geométricos sin etiquetas de objetos significativas. Esta limitación obliga a los robots a depender de procesos computacionales intensivos para el reconocimiento de objetos, lo que ralentiza la toma de decisiones y limita la escalabilidad de los sistemas autónomos. Al introducir el posemesh, Auki Labs tiene como objetivo optimizar este proceso, permitiendo que los robots operen de manera más eficiente con menores demandas computacionales. Los robots Unitree G1 y Go2-W están a la vanguardia de esta innovación, sirviendo como plataformas ideales para implementar el posemesh. Con sus avanzados sensores y movilidad, estos robots pueden navegar eficazmente por mapas espaciales preconstruidos. El posemesh facilita una comprensión compartida entre los robots, permitiéndoles coordinar movimientos y asignar tareas sin que cada robot tenga que procesar su entorno de manera independiente. Este enfoque colaborativo no solo mejora la eficiencia, sino que también minimiza la redundancia, lo que finalmente conduce a una mejor comunicación entre robots y sistemas más escalables en diversas industrias. Auki Labs imagina un futuro en el que los robots puedan adaptarse a los entornos en tiempo real, superando cuellos de botella computacionales y trabajando juntos sin problemas. Al invertir en el posemesh y plataformas robóticas avanzadas, la empresa está pionera en un enfoque más inteligente para la robótica y la IA. Esta iniciativa es crucial para la adopción generalizada de robots en entornos mixtos o híbridos, ya que desbloquea el potencial de flotas colaborativas que son mayores que la suma de sus partes. A medida que Auki Labs continúa innovando, la promesa de un futuro robótico más interconectado y eficiente se vuelve cada vez más tangible.
Lit Protocol: Unificando la Web con Soluciones Criptográficas Avanzadas cover
hace 9 días
Lit Protocol: Unificando la Web con Soluciones Criptográficas Avanzadas
En el panorama en rápida evolución de la tecnología blockchain, Lit Protocol está logrando avances significativos en la mejora de las capacidades criptográficas para cerrar la brecha entre redes y plataformas fragmentadas. Como una red descentralizada de gestión de claves y computación privada, Lit Protocol proporciona a los desarrolladores herramientas esenciales para gestionar secretos de manera segura y construir aplicaciones autónomas. Con soporte fundamental para primitivas criptográficas como firmas BLS y ECDSA, los desarrolladores han aprovechado Lit para crear aplicaciones innovadoras que facilitan interacciones sin problemas entre entornos web2 y web3. Este año ha visto un crecimiento notable en áreas como agentes de IA, abstracción de cadenas, billeteras de usuario y datos web verificables, mostrando el potencial de la infraestructura de Lit. Mirando hacia 2025, Lit Protocol planea expandir su oferta criptográfica introduciendo esquemas de firma y curvas adicionales para mejorar la interoperabilidad a través de varios ecosistemas. Las mejoras clave incluyen mejoras de rendimiento para la firma ECDSA, soporte para curvas NIST como P-256 y P-384, y la integración de firmas Schnorr/EdDSA a través del protocolo FROST. Estos avances permitirán a los desarrolladores construir aplicaciones más seguras y eficientes, asegurando al mismo tiempo la compatibilidad con una amplia gama de ecosistemas blockchain. Además, la introducción de claves de Cifrado Homomórfico Total (FHE) permitirá cálculos sobre datos cifrados, preservando la privacidad mientras se habilitan análisis avanzados y compartición segura de datos. Los logros de Lit Protocol en 2024 reflejan la dedicación de su comunidad de desarrolladores, con más de 24 millones de solicitudes criptográficas cumplidas y más de 1 millón de claves creadas. Asociaciones notables con organizaciones como Fox, Genius y Emblem Vault destacan la versatilidad de Lit Protocol en diversas aplicaciones, desde finanzas descentralizadas hasta gestión de datos programables. A medida que Lit continúa innovando y expandiendo sus capacidades, sigue comprometido a proporcionar a los desarrolladores las mejores herramientas para crear aplicaciones seguras, descentralizadas y autónomas, unificando en última instancia el paisaje digital fragmentado que navegamos hoy.
Zerebro se asocia con io.net para mejorar la validación de Ethereum con servicios de GPU descentralizados cover
hace 10 días
Zerebro se asocia con io.net para mejorar la validación de Ethereum con servicios de GPU descentralizados
En un movimiento significativo para el ecosistema de IA descentralizada, io.net ha anunciado una asociación con Zerebro, un agente autónomo de IA creativa, para mejorar las operaciones de los validadores de Ethereum. Esta colaboración permitirá a Zerebro utilizar la red de GPU escalable y geográficamente distribuida de io.net, aumentando así su potencia computacional para la validación de Ethereum. La asociación se alinea con la misión de io.net de proporcionar recursos de GPU asequibles y escalables a las startups de IA, asegurando la confiabilidad y escalabilidad en sus operaciones. Esta iniciativa marca un paso crucial en la integración de recursos de computación descentralizados en el campo en expansión de la tecnología de IA y blockchain. El cofundador de Zerebro, Agustin Cortes, enfatizó la importancia de esta asociación, afirmando que el acceso a servicios de GPU descentralizados empoderará a los usuarios para explorar aplicaciones innovadoras de IA y aplicaciones descentralizadas complejas (DApps). Comentó: "Zerebro está a la vanguardia de unir el futuro de la IA y las criptomonedas", destacando el compromiso con la descentralización mientras se fomenta la innovación. Se espera que la colaboración facilite el desarrollo de aplicaciones creativas y escalables, permitiendo a los desarrolladores aprovechar el potencial de las redes de computación descentralizadas para una variedad de tareas en la cadena. A medida que Zerebro continúa desarrollando su marco de código abierto, Zerepy, el enfoque en asegurar la blockchain de Ethereum a través de operaciones de validadores es primordial. La asociación con io.net no solo tiene como objetivo mejorar las funcionalidades centrales de Zerebro, sino también crear un futuro sostenible para los agentes autónomos de IA. Al aprovechar los clústeres de GPU de io.net, Zerebro puede mantener sus operaciones y explorar innovaciones como modelos de lenguaje grandes en redes descentralizadas. Esta colaboración significa un futuro prometedor para la integración de la IA y la blockchain, fomentando un entorno que es tanto autónomo como descentralizado, revolucionando en última instancia el panorama de los agentes de IA en la infraestructura web3.
Solana lanza DePIN Compute para satisfacer la creciente demanda de poder computacional de la IA cover
hace 10 días
Solana lanza DePIN Compute para satisfacer la creciente demanda de poder computacional de la IA
Solana ha lanzado Decentralized Physical Infrastructure Networks (DePIN) Compute, un sistema descentralizado innovador diseñado para abordar la creciente demanda de poder computacional impulsada por la rápida expansión de la inteligencia artificial (IA). Los sistemas de computación tradicionales están luchando por satisfacer esta demanda, pero DePIN ofrece una solución novedosa aprovechando recursos infrautilizados, similar a cómo Airbnb permite a los propietarios compartir sus propiedades vacías. Este enfoque innovador permite a los usuarios monetizar sus GPUs inactivas, poniéndolas a disposición de desarrolladores, investigadores y startups que necesitan recursos computacionales. La funcionalidad de DePIN Compute es sencilla: los usuarios pueden alquilar su potencia de GPU no utilizada, creando una nueva fuente de ingresos mientras optimizan la utilización de recursos. Este modelo descentralizado es particularmente beneficioso para desarrolladores e investigadores más pequeños que a menudo encuentran prohibitivos los costos de las plataformas de computación de alto rendimiento. Al utilizar tecnología blockchain, DePIN Compute garantiza un método rápido, rentable y escalable para compartir recursos computacionales, democratizando en última instancia el acceso a tecnología avanzada. La importancia de DePIN Compute se subraya con inversiones recientes, notablemente el compromiso de VanEck de más de 10 millones de dólares con el proyecto, lo que refleja una fuerte confianza en su potencial. El respaldo previo de VanEck a Solana ya ha contribuido a una respuesta positiva del mercado, incluida la presentación del primer fondo cotizado en bolsa (ETF) basado en SOL en los Estados Unidos. A medida que la IA continúa evolucionando, iniciativas como DePIN Compute están destinadas a revolucionar la forma en que se accede y utiliza el poder computacional, fomentando la innovación y permitiendo que una gama más amplia de individuos y organizaciones se beneficien de la tecnología de vanguardia.
Regístrate para las últimas noticias y actualizaciones de DePIN