Améliorer le rappel de contexte dans la génération augmentée par récupération

vendredi, novembre 22, 2024 12:00 AM
2,604

La génération augmentée par récupération (RAG) est devenue une méthode essentielle pour intégrer de grands modèles de langage (LLM) dans des applications commerciales spécialisées, permettant l’infusion de données propriétaires dans les réponses du modèle. Malgré son efficacité lors de la phase de preuve de concept (POC), les développeurs rencontrent souvent des baisses significatives de précision lors de la transition de RAG vers la production. Ce problème est particulièrement prononcé durant la phase de récupération, où l’objectif est de récupérer avec précision le contexte le plus pertinent pour une requête donnée, une métrique connue sous le nom de rappel de contexte. Cet article explore des stratégies pour améliorer le rappel de contexte en personnalisant et en ajustant les modèles d’embedding, améliorant ainsi les performances de RAG dans des applications réelles.

RAG fonctionne en deux étapes principales : récupération et génération. Dans la phase de récupération, le modèle convertit le texte en vecteurs, indexe, récupère et re-classe ces vecteurs pour identifier les meilleures correspondances. Cependant, des échecs dans cette phase peuvent entraîner des contextes pertinents manqués, ce qui entraîne un rappel de contexte plus faible et des sorties de génération moins précises. Une solution efficace consiste à adapter le modèle d’embedding, qui est conçu pour comprendre les relations entre les données textuelles, afin de produire des embeddings spécifiques au jeu de données utilisé. Cet ajustement permet au modèle de générer des vecteurs similaires pour des phrases similaires, améliorant ainsi sa capacité à récupérer un contexte hautement pertinent pour la requête.

Pour améliorer le rappel de contexte, il est essentiel de préparer un jeu de données sur mesure qui reflète les types de requêtes que le modèle rencontrera. Cela implique d’extraire une gamme diversifiée de questions de la base de connaissances, de les reformuler pour la variabilité et de les organiser par pertinence. De plus, la construction d’un jeu de données d’évaluation aide à évaluer les performances du modèle dans un cadre réaliste. En utilisant un évaluateur de récupération d’information, les développeurs peuvent mesurer des métriques telles que Recall@k et Precision@k pour évaluer la précision de la récupération. En fin de compte, l’ajustement du modèle d’embedding peut entraîner des améliorations substantielles du rappel de contexte, garantissant que RAG reste précis et fiable dans les environnements de production.

Related News

La vision de 4EVERLAND pour 2025 : Autonomiser le Web3 grâce à l'innovation cover
il y a 3 jours
La vision de 4EVERLAND pour 2025 : Autonomiser le Web3 grâce à l'innovation
Alors que nous entrons en 2025, 4EVERLAND est prêt à renforcer son engagement à autonomiser les développeurs Web3 et la communauté mondiale grâce à une technologie décentralisée innovante. S'appuyant sur les succès de 2024, qui comprenaient l'élargissement des partenariats avec des protocoles de premier plan et le lancement de services d'IA avancés, 4EVERLAND se concentre sur la fourniture d'une infrastructure de pointe qui soutient l'écosystème Web3. L'année à venir promet d'être transformative, avec une mission claire d'améliorer les offres et de favoriser une approche axée sur la communauté alors que l'entreprise continue de BUIDL. Au cours du premier trimestre, 4EVERLAND introduira la plateforme agrégateur 4EVERBoost, conçue comme une solution de lancement Dapp tout-en-un pour les développeurs Web3. Cette plateforme vise à rationaliser le processus de déploiement des applications, permettant aux développeurs d'optimiser leurs flux de travail et d'atteindre efficacement leurs publics cibles. De plus, l'entreprise prévoit d'approfondir les partenariats avec des acteurs clés tels que zkSync, Arbitrum et Optimism, améliorant l'interopérabilité des protocoles pour améliorer l'expérience globale des développeurs et attirer davantage de projets sur la plateforme 4EVERLAND. Au fur et à mesure que l'année avance, 4EVERLAND lancera un marché de modèles d'IA décentralisés au deuxième trimestre, facilitant l'intégration transparente des ressources de calcul IA pour les développeurs. L'introduction de l'AI Worker simplifiera encore le déploiement de modèles d'IA à grande échelle. Au troisième trimestre, la version ouverte du réseau 4EVER Node permettra aux membres de la communauté de contribuer des ressources inactives, améliorant ainsi la scalabilité et la fiabilité. Enfin, le quatrième trimestre verra la formation d'une DAO, permettant aux détenteurs de jetons de participer à la gouvernance, augmentant ainsi la transparence et l'implication de la communauté dans les processus décisionnels. Dans l'ensemble, 2025 s'annonce comme une année d'innovation et de collaboration pour 4EVERLAND, consolidant son rôle dans le paysage Web3.
io.net rejoint le programme partenaire de Dell Technologies pour améliorer les solutions GPU décentralisées cover
il y a 8 jours
io.net rejoint le programme partenaire de Dell Technologies pour améliorer les solutions GPU décentralisées
io.net, un acteur majeur dans le réseau d'infrastructure physique décentralisée (DePIN) pour les GPU, a récemment rejoint le programme partenaire de Dell Technologies. Cette alliance stratégique est conçue pour améliorer le développement commercial, les ventes et les efforts de marketing d'io.net. En tant que partenaire autorisé et fournisseur de services cloud, io.net vise à intégrer son réseau GPU décentralisé avec l'infrastructure robuste de Dell, offrant des solutions évolutives et rentables adaptées aux technologies émergentes telles que l'intelligence artificielle (IA), l'apprentissage automatique (ML) et le calcul haute performance (HPC). Tausif Ahmed, VP du développement commercial chez io.net, a souligné que ce partenariat marque une étape importante pour l'entreprise, la positionnant comme un fournisseur de solutions de premier plan dans les secteurs de l'IA, du ML et du HPC. Le programme partenaire de Dell Technologies est une initiative internationale qui fournit aux partenaires des ressources essentielles en développement commercial, ventes et marketing. En rejoignant ce programme, io.net accède à une multitude de ressources qui faciliteront l'expansion de son réseau GPU décentralisé et amélioreront ses capacités sur le marché. Cette collaboration permet non seulement à io.net de stratégiquement collaborer avec d'autres partenaires, mais elle étend également sa portée mondiale, permettant le déploiement de solutions qui intègrent sans effort la puissance GPU décentralisée avec l'infrastructure matérielle fiable de Dell. Le partenariat devrait renforcer les efforts de mise sur le marché d'io.net et les activités de co-marketing, bénéficiant finalement aux clients d'entreprise à la recherche de solutions informatiques avancées. Alors que la demande de services de calcul évolutifs et efficaces continue d'augmenter dans les secteurs de l'IA et du ML, le réseau décentralisé d'io.net offre une alternative convaincante aux fournisseurs de services cloud traditionnels. En fournissant des clusters GPU à la demande qui peuvent être déployés rapidement et à moindre coût, io.net répond aux goulets d'étranglement rencontrés par les organisations dans le développement de l'IA. Le partenariat avec Dell est destiné à démocratiser l'accès aux solutions de calcul décentralisées, en particulier pour les entreprises engagées dans la formation, l'inférence et les cas d'utilisation HPC en IA. Avec la présence mondiale et la réputation de confiance de Dell, io.net est bien positionné pour accélérer l'adoption de ces solutions innovantes dans divers secteurs.
Auki Labs dévoile Posemesh : Une nouvelle ère pour la robotique collaborative cover
il y a 8 jours
Auki Labs dévoile Posemesh : Une nouvelle ère pour la robotique collaborative
Dans le domaine de la robotique, le défi de permettre à plusieurs robots de collaborer efficacement dans des espaces partagés a été un obstacle significatif. Auki Labs s'attaque à ce problème grâce au développement du posemesh, une carte spatiale partagée qui améliore la façon dont les robots perçoivent et interagissent avec leur environnement. Actuellement, la plupart des cartes spatiales manquent d'informations contextuelles, fournissant uniquement des données géométriques sans étiquettes d'objets significatives. Cette limitation oblige les robots à s'appuyer sur des processus de reconnaissance d'objets intensifs en calcul, ce qui ralentit la prise de décision et limite l'évolutivité des systèmes autonomes. En introduisant le posemesh, Auki Labs vise à rationaliser ce processus, permettant aux robots de fonctionner plus efficacement avec des exigences computationnelles réduites. Les robots Unitree G1 et Go2-W sont à l'avant-garde de cette innovation, servant de plateformes idéales pour déployer le posemesh. Avec leurs capteurs avancés et leur mobilité, ces robots peuvent naviguer efficacement dans des cartes spatiales préconstruites. Le posemesh facilite une compréhension partagée entre les robots, leur permettant de coordonner leurs mouvements et d'allouer des tâches sans que chaque robot ait besoin de traiter indépendamment son environnement. Cette approche collaborative améliore non seulement l'efficacité, mais minimise également la redondance, conduisant finalement à une meilleure communication entre robots et à des systèmes plus évolutifs dans divers secteurs. Auki Labs envisage un avenir où les robots peuvent s'adapter aux environnements en temps réel, surmontant les goulets d'étranglement computationnels et travaillant ensemble de manière transparente. En investissant dans le posemesh et des plateformes robotiques avancées, l'entreprise ouvre la voie à une approche plus intelligente de la robotique et de l'IA. Cette initiative est cruciale pour l'adoption généralisée des robots dans des environnements mixtes ou hybrides, car elle libère le potentiel de flottes collaboratives qui sont supérieures à la somme de leurs parties. Alors qu'Auki Labs continue d'innover, la promesse d'un avenir robotique plus interconnecté et efficace devient de plus en plus tangible.
Lit Protocol : Unifier le Web avec des solutions cryptographiques avancées cover
il y a 9 jours
Lit Protocol : Unifier le Web avec des solutions cryptographiques avancées
Dans le paysage en évolution rapide de la technologie blockchain, Lit Protocol fait des progrès significatifs dans l'amélioration des capacités cryptographiques pour combler le fossé entre les réseaux et les plateformes fragmentés. En tant que réseau de gestion de clés décentralisé et de calcul privé, Lit Protocol fournit aux développeurs des outils essentiels pour gérer en toute sécurité des secrets et créer des applications autonomes. Avec un soutien fondamental pour des primitives cryptographiques telles que les signatures BLS et ECDSA, les développeurs ont utilisé Lit pour créer des applications innovantes qui facilitent des interactions fluides entre les environnements web2 et web3. Cette année a vu une croissance remarquable dans des domaines comme les agents IA, l'abstraction de chaînes, les portefeuilles utilisateurs et les données web vérifiables, mettant en avant le potentiel de l'infrastructure de Lit. En regardant vers 2025, Lit Protocol prévoit d'élargir ses offres cryptographiques en introduisant des schémas de signature et des courbes supplémentaires pour améliorer l'interopérabilité à travers divers écosystèmes. Les améliorations clés incluent des améliorations de performance pour la signature ECDSA, le support des courbes NIST comme P-256 et P-384, et l'intégration des signatures Schnorr/EdDSA via le protocole FROST. Ces avancées permettront aux développeurs de créer des applications plus sécurisées et efficaces tout en garantissant la compatibilité avec une large gamme d'écosystèmes blockchain. De plus, l'introduction de clés de chiffrement homomorphe complet (FHE) permettra des calculs sur des données chiffrées, préservant la vie privée tout en permettant des analyses avancées et un partage sécurisé des données. Les réalisations de Lit Protocol en 2024 reflètent le dévouement de sa communauté de développeurs, avec plus de 24 millions de demandes cryptographiques satisfaites et plus d'un million de clés créées. Des partenariats notables avec des organisations comme Fox, Genius et Emblem Vault soulignent la polyvalence de Lit Protocol dans diverses applications, allant de la finance décentralisée à la gestion de données programmables. Alors que Lit continue d'innover et d'élargir ses capacités, il reste engagé à fournir aux développeurs les meilleurs outils pour créer des applications sécurisées, décentralisées et autonomes, unifiant finalement le paysage numérique fragmenté que nous naviguons aujourd'hui.
Solana lance DePIN Compute pour répondre à la demande croissante d'IA en matière de puissance de calcul cover
il y a 10 jours
Solana lance DePIN Compute pour répondre à la demande croissante d'IA en matière de puissance de calcul
Solana a lancé Decentralized Physical Infrastructure Networks (DePIN) Compute, un système décentralisé révolutionnaire conçu pour répondre à la demande croissante de puissance de calcul, alimentée par l'expansion rapide de l'intelligence artificielle (IA). Les systèmes de calcul traditionnels peinent à satisfaire cette demande, mais DePIN offre une solution novatrice en tirant parti des ressources sous-utilisées, semblable à la manière dont Airbnb permet aux propriétaires de partager leurs propriétés vacantes. Cette approche innovante permet aux utilisateurs de monétiser leurs GPU inactifs, les rendant disponibles pour les développeurs, chercheurs et startups ayant besoin de ressources informatiques. La fonctionnalité de DePIN Compute est simple : les utilisateurs peuvent louer leur puissance GPU inutilisée, créant ainsi une nouvelle source de revenus tout en optimisant l'utilisation des ressources. Ce modèle décentralisé est particulièrement bénéfique pour les petits développeurs et chercheurs qui trouvent souvent les plateformes de calcul haute performance financièrement prohibitives. En utilisant la technologie blockchain, DePIN Compute garantit une méthode rapide, économique et évolutive pour partager des ressources informatiques, démocratisant ainsi l'accès à la technologie avancée. L'importance de DePIN Compute est soulignée par des investissements récents, notamment l'engagement de VanEck de plus de 10 millions de dollars dans le projet, reflétant une forte confiance dans son potentiel. Le soutien antérieur de VanEck à Solana a déjà contribué à une réponse positive du marché, y compris le dépôt de la première Exchange Traded Fund (ETF) basée sur SOL aux États-Unis. Alors que l'IA continue d'évoluer, des initiatives comme DePIN Compute sont prêtes à révolutionner la manière dont la puissance de calcul est accessible et utilisée, favorisant l'innovation et permettant à un plus large éventail d'individus et d'organisations de bénéficier de technologies de pointe.
Renforcer la confidentialité des données à l'ère du Web3 cover
il y a 10 jours
Renforcer la confidentialité des données à l'ère du Web3
Dans le paysage en évolution d'Internet, les préoccupations concernant la confidentialité des données atteignent des sommets historiques. Une récente enquête de MAGNA/Ketch a révélé que seulement 5 % des individus se sentent complètement en sécurité quant à la manière dont les entreprises collectent et utilisent leurs informations personnelles. Alors que nous faisons la transition vers le Web3, un nouveau paradigme émerge qui permet aux utilisateurs de reprendre le contrôle de leurs données. En tirant parti de la technologie blockchain aux côtés des technologies de protection de la vie privée (PET), le Web3 améliore non seulement la sécurité des données, mais redéfinit également les normes de confidentialité et de transparence dans la gestion des données. La décentralisation est un principe clé qui améliore la confidentialité des données dans le Web3. Les méthodes traditionnelles de sécurisation des données impliquent souvent de les centraliser en un seul endroit, ce qui peut créer un point de défaillance unique pour les acteurs malveillants. En revanche, les systèmes décentralisés distribuent les données sur plusieurs emplacements, rendant beaucoup plus difficile l'exploitation par les attaquants. La technologie blockchain joue un rôle crucial dans cette transformation en fournissant un enregistrement transparent et immuable des transactions tout en garantissant que les informations sensibles restent protégées hors chaîne. Cette approche duale favorise un environnement plus digne de confiance pour les utilisateurs, leur permettant de vérifier les pratiques de gestion des données sans compromettre leur vie privée. Les technologies Web3 ouvrent également la voie à des solutions innovantes qui permettent aux utilisateurs de monétiser leurs données tout en maintenant le contrôle sur leur utilisation. En utilisant des contrats intelligents, les individus peuvent établir des règles claires concernant qui peut accéder à leurs données et dans quelles circonstances. Ce passage de simples utilisateurs à propriétaires de données marque un changement significatif dans l'économie numérique. Avec des outils comme le Privacy Pass d'iExec, les utilisateurs peuvent gagner des jetons tout en gardant leurs informations personnelles confidentielles. En fin de compte, le Web3 ne concerne pas seulement l'amélioration de la confidentialité des données ; il s'agit de donner aux individus les moyens de reprendre possession de leurs données et de bénéficier de leur valeur de manière sécurisée et transparente.
Inscrivez-vous pour les dernières nouvelles et mises à jour de DePIN