Améliorer le rappel de contexte dans la génération augmentée par récupération

vendredi, novembre 22, 2024 12:00 AM
2,688

La génération augmentée par récupération (RAG) est devenue une méthode essentielle pour intégrer de grands modèles de langage (LLM) dans des applications commerciales spécialisées, permettant l’infusion de données propriétaires dans les réponses du modèle. Malgré son efficacité lors de la phase de preuve de concept (POC), les développeurs rencontrent souvent des baisses significatives de précision lors de la transition de RAG vers la production. Ce problème est particulièrement prononcé durant la phase de récupération, où l’objectif est de récupérer avec précision le contexte le plus pertinent pour une requête donnée, une métrique connue sous le nom de rappel de contexte. Cet article explore des stratégies pour améliorer le rappel de contexte en personnalisant et en ajustant les modèles d’embedding, améliorant ainsi les performances de RAG dans des applications réelles.

RAG fonctionne en deux étapes principales : récupération et génération. Dans la phase de récupération, le modèle convertit le texte en vecteurs, indexe, récupère et re-classe ces vecteurs pour identifier les meilleures correspondances. Cependant, des échecs dans cette phase peuvent entraîner des contextes pertinents manqués, ce qui entraîne un rappel de contexte plus faible et des sorties de génération moins précises. Une solution efficace consiste à adapter le modèle d’embedding, qui est conçu pour comprendre les relations entre les données textuelles, afin de produire des embeddings spécifiques au jeu de données utilisé. Cet ajustement permet au modèle de générer des vecteurs similaires pour des phrases similaires, améliorant ainsi sa capacité à récupérer un contexte hautement pertinent pour la requête.

Pour améliorer le rappel de contexte, il est essentiel de préparer un jeu de données sur mesure qui reflète les types de requêtes que le modèle rencontrera. Cela implique d’extraire une gamme diversifiée de questions de la base de connaissances, de les reformuler pour la variabilité et de les organiser par pertinence. De plus, la construction d’un jeu de données d’évaluation aide à évaluer les performances du modèle dans un cadre réaliste. En utilisant un évaluateur de récupération d’information, les développeurs peuvent mesurer des métriques telles que Recall@k et Precision@k pour évaluer la précision de la récupération. En fin de compte, l’ajustement du modèle d’embedding peut entraîner des améliorations substantielles du rappel de contexte, garantissant que RAG reste précis et fiable dans les environnements de production.

Related News

IA : La prochaine frontière du fandom sportif cover
il y a 3 jours
IA : La prochaine frontière du fandom sportif
L'intelligence artificielle (IA) fait des avancées significatives dans divers secteurs, mais selon Mitch Liu, PDG de Theta Labs, le secteur du fandom sportif représente une frontière particulièrement prometteuse. Contrairement à d'autres domaines où l'IA automatise principalement des tâches, le sport offre une opportunité unique pour l'IA d'améliorer l'expérience des fans. Avec des données structurées telles que des statistiques, des horaires et des métriques de performance, l'IA peut analyser et présenter des informations de manière à résonner avec les fans. La nature cyclique des saisons sportives permet une collecte continue de données et des tests de fonctionnalités, ce qui en fait un environnement idéal pour l'intégration de l'IA. Des études récentes indiquent que l'IA transforme déjà le paysage sportif grâce à des analyses améliorées et des interactions personnalisées avec les fans. Par exemple, le programme Digital Athlete de la NFL utilise l'apprentissage automatique pour évaluer les données des joueurs et prédire les risques de blessures, ce qui non seulement protège les athlètes mais enrichit également la compréhension des fans du jeu. De plus, des équipes de la LNH comme les Vegas Golden Knights et les New Jersey Devils se sont associées à Theta Labs pour créer des chatbots alimentés par l'IA qui aident les fans avec des questions sur les jeux, les billets et les nouvelles de l'équipe. Ces innovations améliorent l'expérience des fans en fournissant des informations précises et opportunes via des plateformes interactives. Le potentiel de l'IA dans le sport s'étend au-delà des ligues traditionnelles vers les esports, où des environnements numériques natifs offrent encore plus d'opportunités d'engagement. L'IA peut faciliter des expériences hyper-personnalisées, s'adressant à la fois aux fans occasionnels et dévoués en fournissant des informations adaptées basées sur des données de jeu en temps réel. Cependant, les organisations sportives doivent mettre en œuvre ces technologies de manière réfléchie, en veillant à ce qu'elles complètent plutôt que remplacent les éléments émotionnels fondamentaux du fandom. Alors que l'IA continue d'évoluer, l'industrie du sport se trouve à l'aube d'une ère transformative, avec le potentiel de redéfinir la manière dont les fans interagissent avec leurs équipes préférées et d'améliorer l'expérience globale de la consommation sportive.
Le laboratoire de recherche en IA de Stanford s'associe à Theta EdgeCloud pour améliorer la recherche cover
il y a 7 jours
Le laboratoire de recherche en IA de Stanford s'associe à Theta EdgeCloud pour améliorer la recherche
Le laboratoire de recherche en IA du professeur assistant en ingénierie de Stanford, Ellen Vitercik, va tirer parti de l'infrastructure hybride de cloud de Theta EdgeCloud pour améliorer ses recherches en optimisation discrète et en raisonnement algorithmique. Cette collaboration permettra au laboratoire d'utiliser le GPU décentralisé d'EdgeCloud, qui offre une puissance de calcul évolutive et performante à un coût compétitif. L'intégration de cette technologie devrait accélérer considérablement l'entraînement des modèles d'IA et faciliter les initiatives de recherche avancées. D'autres institutions académiques de renom, telles que l'Université nationale de Séoul, KAIST et l'Université de l'Oregon, utilisent également l'infrastructure d'EdgeCloud pour augmenter leur productivité en recherche IA. Ellen Vitercik se spécialise dans l'apprentissage automatique, le raisonnement algorithmique et l'intersection de la computation et de l'économie. Son laboratoire de recherche se concentre sur plusieurs domaines clés, y compris l'application de grands modèles de langage (LLM) pour l'optimisation, la sélection de contenu algorithmique et la généralisation des algorithmes de clustering à travers différentes tailles de jeux de données. En utilisant les ressources de Theta EdgeCloud, le laboratoire vise à explorer comment l'IA peut améliorer les processus de prise de décision dans des contextes économiques, tels que les stratégies de tarification et le marketing ciblé. L'infrastructure hybride GPU de Theta EdgeCloud est conçue pour fournir une puissance de calcul à la demande qui est à la fois évolutive et rentable, ce qui en fait une solution idéale pour la recherche académique. La collaboration avec le laboratoire de Vitercik illustre la tendance croissante à intégrer des technologies avancées de cloud computing dans la recherche académique, en particulier dans le domaine de l'IA. Ce partenariat promet non seulement d'avancer les objectifs de recherche de Vitercik, mais contribue également au paysage plus large de la recherche en IA à travers plusieurs institutions dans le monde entier.
Phala Network et Streamr s'associent pour révolutionner l'IA décentralisée cover
il y a 14 jours
Phala Network et Streamr s'associent pour révolutionner l'IA décentralisée
Phala Network et Streamr ont annoncé un partenariat passionnant visant à révolutionner le paysage de l'IA décentralisée. Cette collaboration fusionne l'infrastructure de calcul de confiance de Phala avec les capacités de streaming de données décentralisées et en temps réel de Streamr. L'objectif est de créer une nouvelle classe d'agents IA capables de traiter des données en direct de manière sécurisée et privée, sans dépendre d'intermédiaires centralisés. En combinant ces technologies, la vision de l'IA décentralisée en temps réel devient une réalité, ouvrant la voie à des applications innovantes dans divers secteurs. Streamr fonctionne sur un réseau décentralisé spécifiquement conçu pour le streaming de données en temps réel, utilisant une architecture pair-à-pair et un modèle de publication/abonnement. Cette structure permet aux producteurs de données de diffuser des flux qui peuvent être instantanément consommés par des applications et des nœuds, réduisant considérablement la latence et améliorant la résilience. L'intégration de la technologie blockchain au sein de Streamr soutient la monétisation et le contrôle d'accès grâce à son jeton natif DATA, favorisant une économie de données ouvertes robuste pour les applications Web3. Ce partenariat souligne une mission commune de créer un web plus ouvert et contrôlé par les utilisateurs, s'éloignant de la dépendance aux services cloud traditionnels. La collaboration tire parti des Environnements d'Exécution de Confiance (TEE) de Phala et des Contrats Phat, qui fournissent des enclaves sécurisées et cryptées pour les calculs IA. Cela garantit que même le propriétaire de la machine ne peut pas accéder aux données ou à la logique, créant une base solide pour un calcul IA vérifiable. En intégrant la livraison de données en temps réel de Streamr avec la couche de calcul sécurisée de Phala, les développeurs peuvent créer des systèmes IA qui traitent des données en direct tout en préservant la vie privée et en résistant à la censure. Ce partenariat met non seulement en avant le potentiel d'infrastructure décentralisée, mais ouvre également de nouvelles avenues pour les développeurs afin de construire des solutions IA innovantes alignées sur les valeurs fondamentales du Web3 : la vie privée, la transparence et la décentralisation.
Fartcoin : L'ascension surprenante d'un memecoin dans le secteur de l'IA de Solana cover
il y a 16 jours
Fartcoin : L'ascension surprenante d'un memecoin dans le secteur de l'IA de Solana
Dans le paysage en constante évolution des cryptomonnaies, peu de tokens ont suscité autant d'attention que Fartcoin, un memecoin basé sur Solana. Malgré son statut naissant, Fartcoin a établi une présence notable sur les plateformes de médias sociaux, en particulier Twitter, où il est perçu comme un signal d'achat par des investisseurs avisés. Ce memecoin né en Biélorussie s'est rapidement positionné comme un leader au sein de l'écosystème Solana, devançant de nombreux concurrents plus établis. Avec une capitalisation boursière de 455,2 millions de dollars, Fartcoin représente désormais 32,1 % de la capitalisation boursière totale des tokens AI sur Solana, qui s'élève à environ 1,1148 milliard de dollars à travers 772 projets. L'ascension de Fartcoin est particulièrement remarquable compte tenu du fait qu'il manque des revendications typiques d'utilité ou technologiques associées à de nombreux tokens AI. Au lieu de cela, il a tiré parti de l'enthousiasme actuel entourant l'intelligence artificielle pour se tailler une niche significative sur le marché. Sa performance a éclipsé celle de tokens établis comme #ai16z, la capitalisation boursière de Fartcoin dépassant celle de son concurrent le plus proche de près de 250 %. Ce succès inattendu soulève des questions sur l'avenir des tokens AI sur la blockchain Solana, suggérant un potentiel changement d'intérêt des investisseurs vers des projets plus légers et basés sur des mèmes plutôt que vers des solutions technologiques plus traditionnelles. L'attrait de Fartcoin parmi les investisseurs institutionnels, souvent appelés "smart money", est un moteur clé de son succès. Ces investisseurs sont attirés par la position unique de Fartcoin sur le marché, où sa culture de mème et son engagement communautaire se sont révélés être des atouts puissants. Alors que Fartcoin continue d'attirer des investissements et de l'attention significatifs, son avenir reste incertain, mais sa trajectoire actuelle indique qu'il s'est établi comme un acteur redoutable dans le secteur de l'IA sur Solana. En fin de compte, Fartcoin illustre la nature imprévisible du monde des cryptomonnaies, où même un memecoin peut dominer un segment de marché traditionnellement réservé à des projets plus sérieux.
Les cryptomonnaies axées sur l'IA subissent un déclin significatif en raison du ralentissement des centres de données de Microsoft cover
il y a 21 jours
Les cryptomonnaies axées sur l'IA subissent un déclin significatif en raison du ralentissement des centres de données de Microsoft
Le récent déclin du marché des cryptomonnaies, en particulier pour les jetons axés sur l'IA, a été fortement influencé par la décision de Microsoft de ralentir ses plans d'expansion des centres de données. Au cours des dernières 24 heures, le jeton de Bittensor a chuté de 10 %, avec une baisse impressionnante de 24 % au cours de la semaine dernière. Le Render Token (RNDR) et Grass ont également connu des baisses respectives de 10 % et 20 %, contribuant à une diminution de 10 % de la capitalisation boursière globale des jetons AI suivis par CoinGecko. Cette tendance reflète la performance des principales actions liées à l'IA, NVIDIA ayant connu une baisse de plus de 30 % par rapport à son pic de 2024 et AMD ayant chuté de 47 % par rapport à ses sommets cette année. L'impact de l'annonce de Microsoft, qui inclut l'arrêt ou le retard des développements de centres de données dans plusieurs pays, soulève des inquiétudes quant au rythme de croissance du secteur de l'IA. Cette nouvelle est particulièrement frappante compte tenu du rôle central de Microsoft dans la commercialisation de l'IA grâce à sa collaboration avec OpenAI, le créateur de ChatGPT. Des analystes de TD Cowen ont exprimé des inquiétudes concernant un éventuel excès d'offre de centres de données, suggérant que la demande pourrait ne pas suivre le rythme de l'expansion rapide précédemment anticipée. Le boom de l'IA a attiré de nombreux développeurs dans l'espace crypto, avec des projets comme Bittensor offrant des places de marché décentralisées pour les modèles d'apprentissage de l'IA, où les mineurs gagnent des jetons TAO en contribuant des ressources informatiques. Render fonctionne sur Solana, fournissant une plateforme pour que les utilisateurs louent de la puissance GPU, tandis que Grass incite les utilisateurs à gagner des jetons grâce à des installations d'applications. De plus, le déclin des jetons mèmes liés à l'IA, en particulier au sein de l'écosystème Virtuals Protocol, met en évidence la correction plus large du marché, avec des jetons comme GAME voyant leur valorisation chuter de 350 millions de dollars à seulement 13 millions de dollars depuis janvier.
Phoenix mène la croissance et l'innovation du secteur DePIN-AI cover
il y a un mois
Phoenix mène la croissance et l'innovation du secteur DePIN-AI
Le secteur du Réseau d'Infrastructure Physique Décentralisé (DePIN) évolue rapidement, montrant un potentiel significatif dans divers domaines technologiques. Selon un rapport récent de Messari, le DePIN est actuellement dans sa phase de croissance naissante, détenant moins de 0,1 % de la part de marché mais affichant une capitalisation boursière de 50 milliards de dollars, soutenue par plus de 13 millions de dispositifs contribuant quotidiennement. En éliminant les intermédiaires centralisés, le DePIN facilite un partage plus efficace et inclusif des actifs physiques, ce qui est crucial pour le développement et l'exploitation des infrastructures critiques dans l'informatique, l'IA, la technologie sans fil et les services énergétiques. Depuis sa création, le DePIN a attiré l'attention des grandes entreprises technologiques, en particulier en 2023, alors que les fabricants mondiaux ont commencé à intégrer la blockchain dans les infrastructures du monde réel. Le secteur peut être catégorisé en Réseaux de Ressources Physiques, qui se concentrent sur les dispositifs, et Réseaux de Ressources Numériques, qui mettent l'accent sur les ressources informatiques comme les CDN et l'IA. Cette dualité permet aux propriétaires de dispositifs individuels de partager des données et de gagner des récompenses tout en fournissant des ressources informatiques accessibles. Les applications du DePIN s'étendent aux télécommunications, à la gestion des données et au stockage dans le cloud, offrant des alternatives évolutives aux systèmes centralisés traditionnels et améliorant les fonctionnalités de l'IA. À l'avant-garde de cette innovation se trouve Phoenix, un réseau de calcul AI décentralisé qui exploite l'infrastructure DePIN pour offrir des solutions évolutives pour les applications d'IA. La plateforme SkyNet de Phoenix utilise un réseau mondial distribué de GPU haute performance, y compris des modèles NVIDIA et alternatifs, pour optimiser les opérations d'IA. Leurs collaborations avec des entreprises comme TandemAI et Origin Quantum visent à démocratiser l'accès aux ressources informatiques avancées, permettant aux organisations de recherche de réaliser des analyses complexes à des coûts minimes. Alors que le secteur DePIN-AI devrait atteindre une taille de marché de 3,5 billions de dollars d'ici 2028, Phoenix est bien placé pour mener cette vague transformative en fusionnant une infrastructure décentralisée avec des technologies d'IA de pointe.
Inscrivez-vous pour les dernières nouvelles et mises à jour de DePIN