Améliorer le rappel de contexte dans la génération augmentée par récupération

vendredi, novembre 22, 2024 12:00 AM

2,697

La génération augmentée par récupération (RAG) est devenue une méthode essentielle pour intégrer de grands modèles de langage (LLM) dans des applications commerciales spécialisées, permettant l’infusion de données propriétaires dans les réponses du modèle. Malgré son efficacité lors de la phase de preuve de concept (POC), les développeurs rencontrent souvent des baisses significatives de précision lors de la transition de RAG vers la production. Ce problème est particulièrement prononcé durant la phase de récupération, où l’objectif est de récupérer avec précision le contexte le plus pertinent pour une requête donnée, une métrique connue sous le nom de rappel de contexte. Cet article explore des stratégies pour améliorer le rappel de contexte en personnalisant et en ajustant les modèles d’embedding, améliorant ainsi les performances de RAG dans des applications réelles.

RAG fonctionne en deux étapes principales : récupération et génération. Dans la phase de récupération, le modèle convertit le texte en vecteurs, indexe, récupère et re-classe ces vecteurs pour identifier les meilleures correspondances. Cependant, des échecs dans cette phase peuvent entraîner des contextes pertinents manqués, ce qui entraîne un rappel de contexte plus faible et des sorties de génération moins précises. Une solution efficace consiste à adapter le modèle d’embedding, qui est conçu pour comprendre les relations entre les données textuelles, afin de produire des embeddings spécifiques au jeu de données utilisé. Cet ajustement permet au modèle de générer des vecteurs similaires pour des phrases similaires, améliorant ainsi sa capacité à récupérer un contexte hautement pertinent pour la requête.

Pour améliorer le rappel de contexte, il est essentiel de préparer un jeu de données sur mesure qui reflète les types de requêtes que le modèle rencontrera. Cela implique d’extraire une gamme diversifiée de questions de la base de connaissances, de les reformuler pour la variabilité et de les organiser par pertinence. De plus, la construction d’un jeu de données d’évaluation aide à évaluer les performances du modèle dans un cadre réaliste. En utilisant un évaluateur de récupération d’information, les développeurs peuvent mesurer des métriques telles que Recall@k et Precision@k pour évaluer la précision de la récupération. En fin de compte, l’ajustement du modèle d’embedding peut entraîner des améliorations substantielles du rappel de contexte, garantissant que RAG reste précis et fiable dans les environnements de production.

Source: spheron.network

Related News

il y a 3 jours

io.net fait état d'une croissance des revenus malgré les défis du marché

Dans le dernier rapport trimestriel, io.net a démontré une croissance significative de ses revenus, atteignant une augmentation impressionnante de 82,6 %, ce qui a porté son chiffre d'affaires total à 5,7 millions de dollars. Cette hausse des revenus est particulièrement remarquable compte tenu de la contraction plus large du marché des cryptomonnaies, où la capitalisation boursière de son jeton IO a chuté de 71,4 % pour atteindre 108 millions de dollars, accompagnée d'une baisse de 74,9 % du prix du jeton. Malgré ces défis, io.net a réussi à s'intégrer à diverses plateformes axées sur l'IA et le calcul, y compris des partenariats avec Zerebro, KREA et Injective, visant à améliorer les capacités de calcul GPU décentralisées pour les applications en IA et DeFi. L'infrastructure d'io.net, qui est construite sur un réseau décentralisé de GPU et de CPU, permet un accès évolutif aux ressources de calcul, notamment pour les applications d'apprentissage automatique et d'IA. La plateforme prend en charge un large éventail de frameworks d'apprentissage automatique, garantissant flexibilité et efficacité dans l'allocation des ressources. Cependant, les ressources de calcul vérifiées moyennes quotidiennes ont connu une baisse, avec des GPU et des CPU vérifiés en baisse de 11,1 % et 4,5 % respectivement. Cette réduction reflète les défis persistants du côté de l'offre et une diminution des incitations liées aux jetons, ce qui a eu un impact sur l'activité globale au sein du réseau. Malgré des indicateurs de performance mitigés, io.net a maintenu un rythme de développement constant, avec de nombreuses collaborations visant à élargir son écosystème. Les partenariats formés au premier trimestre de 2025, y compris ceux avec Alpha Network et Mira Network, soulignent l'engagement d'io.net à améliorer l'infrastructure décentralisée de l'IA. Alors que le projet continue de peaufiner ses modèles économiques et d'élargir ses capacités réseau, il reste un acteur clé dans le paysage en évolution des ressources de calcul décentralisées, même dans un environnement de marché difficile.

IA Financement

il y a 3 jours

Ben Goertzel : Pionnier de l'IA Décentralisée pour un Avenir Meilleur

Ben Goertzel, pionnier de l'intelligence artificielle, plaide en faveur de l'IA décentralisée depuis qu'il a écrit sa première ligne de code il y a 30 ans. Alors que le monde est sur le point d'atteindre l'Intelligence Artificielle Générale (AGI), Goertzel souligne l'importance de la décentralisation pour garantir que cette technologie puissante bénéficie à l'humanité plutôt qu'aux pouvoirs centralisés. Lors de la récente conférence Consensus à Toronto, il a exprimé son optimisme quant à la possibilité de lancer l'AGI dans les un à trois prochaines années grâce à son projet, SingularityNET, qui vise à créer un marché mondial pour les services d'IA. Le projet a réalisé des avancées significatives, y compris des partenariats avec Mind Network et la Filecoin Foundation, un investissement de 53 millions de dollars dans un superordinateur modulaire, et une fusion de jetons avec Ocean Protocol et Fetch.ai. La vision de Goertzel pour l'IA décentralisée est ancrée dans ses premières expériences avec Internet, qu'il a initialement vu comme une plateforme décentralisée. Cependant, il note que la montée des géants de la technologie comme Google et Facebook a conduit à un Internet plus centralisé, ce qui sape les principes fondamentaux de la décentralisation. Il soutient que pour que l'AGI soit une force pour le bien, elle doit être construite sur une architecture décentralisée dès le départ. Cette philosophie se reflète dans la conception de SingularityNET, Hyperon et la future ASI Chain, qui est adaptée aux applications d'IA décentralisées. Goertzel croit que la trajectoire de l'ère post-AGI sera significativement différente en fonction du rôle des écosystèmes décentralisés dans son développement. En plus de son travail dans l'IA, Goertzel a une histoire d'exploration des concepts de monnaie décentralisée remontant aux années 90. Bien qu'il et ses pairs aient initialement rejeté la praticité des transactions décentralisées en raison de préoccupations concernant la vitesse et le coût, l'émergence de Bitcoin a validé certaines de ses idées précoces. Il réfléchit avec humour sur les occasions manquées de cette époque, reconnaissant que leur manque de sens des affaires les a empêchés d'envisager les applications plus sombres de la monnaie décentralisée. Aujourd'hui, l'engagement de Goertzel envers l'IA décentralisée continue de gagner en traction, le positionnant, lui et ses initiatives, comme des acteurs clés dans le paysage évolutif de la technologie et de la gouvernance.

IA Financement

il y a 7 jours

Les investisseurs se tournent vers les tokens crypto GRASS et PI au milieu des liquidations de marché

Les investisseurs se concentrent actuellement sur les tokens crypto GRASS et PI, qui font la une en raison de leurs propositions de valeur uniques. La vente privée en cours de Best Wallet a également attiré l'attention, levant plus de 12 millions de dollars. Au cours des dernières 24 heures, des échanges crypto perpétuels comme Binance, Bybit et OKX ont liquidé plus de 665 millions de dollars de positions à effet de levier, affectant plus de 153 000 traders. Malgré ce tumulte, de nombreux traders restent optimistes quant à GRASS et PI, les considérant comme des tokens potentiels pour un décollage au deuxième trimestre 2025. Notamment, le crypto PI a augmenté de 80 % depuis début avril, tandis que GRASS a augmenté de 140 % depuis son plus bas historique fin octobre 2024. GRASS est une plateforme décentralisée de couche 2 construite sur Solana, soutenue par des capital-risqueurs de renom tels que Polychain Capital et Tribe Capital. Elle permet aux utilisateurs de monétiser la bande passante Internet inutilisée, ce qui est crucial pour l'entraînement des modèles d'IA. La plateforme a facilité le scraping d'une impressionnante quantité de 57 millions de Go de données web publiques rien que pour le premier trimestre 2025. Les participants gagnent des points GRASS, convertibles en tokens GRASS, et la plateforme a connu une augmentation significative du nombre d'opérateurs de nœuds, indiquant un intérêt et une adoption croissants. Les analystes classent GRASS parmi les principales cryptomonnaies à explorer, soulignant son potentiel dans les secteurs de l'IA et du réseau d'infrastructure physique décentralisée (DePIN). D'autre part, Pi Network fait des progrès vers la décentralisation, ayant récemment désactivé son nœud central, donnant ainsi plus de pouvoir à sa communauté de plus de 60 millions d'utilisateurs. Malgré le scepticisme concernant sa légitimité, le mainnet de Pi Network a été lancé en février 2025, et le prix du crypto PI a fluctué de manière significative depuis lors. Alors que GRASS et PI continuent d'évoluer, il est conseillé aux investisseurs de mener des recherches approfondies avant de prendre des décisions d'investissement. De plus, la vente privée de Best Wallet suscite de l'excitation, ses fonctionnalités et ses mesures de sécurité la positionnant comme un concurrent solide dans l'espace des portefeuilles crypto.

Financement IA

il y a 11 jours

Amp et Aethir brillent au milieu du refroidissement du marché des cryptomonnaies

Dans un marché des cryptomonnaies en refroidissement, Amp (AMP) et Aethir (ATH) se sont démarqués en tant que performers exceptionnels, chacun connaissant une augmentation notable de 16 % de sa valeur. Amp est actuellement évalué à 0,0051 $, soutenu par un fort élan haussier appuyé par des moyennes mobiles exponentielles (EMA) clés et des signaux de trading favorables d'indicateurs comme le MACD et le RSI, malgré des avertissements sur des conditions de surachat. Pendant ce temps, Aethir, qui se concentre sur des solutions blockchain alimentées par l'IA, a grimpé à 0,052 $, franchissant des niveaux de résistance significatifs et maintenant un optimisme haussier, bien que le RSI suracheté suggère que les traders doivent rester vigilants. La divergence sur le marché des cryptomonnaies est évidente alors que Helium (HNT) subit une pression à la baisse, se négociant à 4,00 $ et luttant en dessous de l'EMA critique à 200 jours. Cette situation pose un risque de nouvelles baisses si elle franchit le support de l'EMA à 100 jours à 3,83 $. Les trajectoires contrastées d'Amp et d'Aethir par rapport à Helium soulignent la volatilité persistante et l'innovation au sein du marché des actifs numériques, incitant les traders à équilibrer ambition et stratégies de gestion des risques. Alors que les traders naviguent dans ces eaux turbulentes, la résilience d'Amp et d'Aethir souligne le potentiel de croissance même au milieu de la stagnation du marché. Les investisseurs sont encouragés à surveiller de près les indicateurs techniques clés, en particulier les niveaux d'EMA et de RSI, pour identifier les points d'entrée optimaux et gérer les risques de manière efficace. Les développements en cours dans ces projets reflètent la nature dynamique du paysage des cryptomonnaies, où l'innovation continue de susciter l'intérêt et les opportunités d'investissement.

Financement IA

il y a 12 jours

La récupération de Solana et l'essor des projets pilotés par l'IA Bittensor et Unilabs

Solana (SOL) a montré une récupération remarquable, rebondissant de 90 % par rapport à son point le plus bas cette année, mais reste contraint en dessous du niveau de résistance critique de 180 $. Les analystes sont optimistes, suggérant que le prix de Solana pourrait être sur le point d'une rupture significative, en particulier alors que de nombreuses pièces de monnaie mèmes SOL ont récemment augmenté. Le sentiment actuel du marché est soutenu par de solides fondamentaux et une trajectoire à la hausse, SOL se maintenant autour de la barre des 170 $. Un mouvement décisif au-dessus de la résistance de 180 $ pourrait ouvrir la voie à une potentielle hausse vers 200 $ et au-delà, atteignant peut-être des niveaux autour de 250 $. Dans ce contexte, Bittensor (TAO) a émergé comme un acteur notable, maintenant une performance stable tandis que d'autres cryptomonnaies, y compris Bitcoin (BTC), ont rencontré des difficultés. L'intérêt pour Bittensor est largement motivé par son approche innovante de l'IA décentralisée, qui a gagné en traction suite à des événements médiatisés, comme la présence de Donald Trump à un dîner d'innovateurs en crypto et IA. Actuellement échangé autour de 457 $, Bittensor a démontré sa résilience, conservant ses gains et reflétant une confiance croissante du marché dans les projets qui intègrent la technologie blockchain avec l'IA. Pendant ce temps, Unilabs (UNIL) prend de l'ampleur en tant qu'alternative convaincante pour les investisseurs cherchant à se diversifier des réseaux de couche 1 traditionnels comme Solana. Avec un accent sur la fusion de la transparence de la blockchain avec l'infrastructure de l'IA, Unilabs se positionne comme un leader dans l'espace DeFi et IA. Son modèle innovant, qui comprend un système d'incitation basé sur des jetons, vise à attirer à la fois les utilisateurs et les développeurs. Alors que la croissance de Solana stagne, Unilabs présente une opportunité unique pour les traders, redéfinissant potentiellement les normes des plateformes DeFi IA dans un paysage crypto en évolution rapide.

IA Financement

il y a 17 jours

Xangle rejoint le réseau Theta en tant que validateur d'entreprise, renforçant l'infrastructure blockchain

Le 9, la société d'infrastructure blockchain Xangle a annoncé son entrée dans le réseau principal mondial de blockchain Theta Network en tant que validateur d'entreprise. Theta Network est réputé pour fournir une infrastructure cloud décentralisée adaptée à des secteurs tels que l'intelligence artificielle (IA), les médias, le sport et le divertissement. Il dispose d'un cadre robuste soutenu par plus de 30 000 nœuds de périphérie distribués dans le monde, garantissant un fonctionnement et une gouvernance efficaces. Le réseau a attiré des investissements stratégiques de la part d'entités notables telles que Samsung Next, Sony Innovation Fund, Bertelsmann Digital Media Investments et Creative Artists Agency (CAA), avec des géants mondiaux comme Google, Samsung et Binance participant également en tant que validateurs d'entreprise. Dans le cadre de son engagement envers l'écosystème Theta, Xangle va miser un total de 200 000 jetons Theta (THETA), renforçant ainsi considérablement la sécurité et la gouvernance du réseau en tant que nœud validateur. La société vise à contribuer activement à l'expansion du réseau d'infrastructure physique décentralisée (DePIN) et de l'écosystème IA que Theta promeut. Fondée en 2018, Xangle s'est imposée comme un fournisseur de services d'infrastructure web3 et une plateforme de recherche de premier plan en Corée, offrant des hubs communautaires, des explorateurs de blockchain et des rapports d'analyse approfondis sur l'industrie web3. Elle a également servi de validateur pour divers projets mondiaux, notamment Aptos, Babylon, 0G et Initia. Lee Hyun-woo, co-CEO de Xangle, a exprimé son enthousiasme pour ce partenariat, déclarant : "Nous sommes très heureux d'être listés en tant que validateur d'entreprise aux côtés de Google, Samsung et CAA grâce à notre partenariat stratégique avec Theta." Il a souligné que la mise en jeu dans le réseau de validateurs de Theta s'aligne parfaitement avec la mission de Xangle d'améliorer la confiance, la décentralisation et la transparence dans les blockchains de couche 1. Mitch Liu, co-fondateur et CEO de Theta Network, a fait écho à ce sentiment, soulignant les forces de Xangle en matière d'analyse blockchain et de développement d'écosystème, et anticipant des synergies significatives pour promouvoir Theta (THETA) et Theta Fuel (TFUEL), tout en renforçant la sécurité et l'évolutivité globales de la blockchain Theta.

IA Financement

Inscrivez-vous pour les dernières nouvelles et mises à jour de DePIN