Améliorer le rappel de contexte dans la génération augmentée par récupération

vendredi, novembre 22, 2024 12:00 AM
2,679

La génération augmentée par récupération (RAG) est devenue une méthode essentielle pour intégrer de grands modèles de langage (LLM) dans des applications commerciales spécialisées, permettant l’infusion de données propriétaires dans les réponses du modèle. Malgré son efficacité lors de la phase de preuve de concept (POC), les développeurs rencontrent souvent des baisses significatives de précision lors de la transition de RAG vers la production. Ce problème est particulièrement prononcé durant la phase de récupération, où l’objectif est de récupérer avec précision le contexte le plus pertinent pour une requête donnée, une métrique connue sous le nom de rappel de contexte. Cet article explore des stratégies pour améliorer le rappel de contexte en personnalisant et en ajustant les modèles d’embedding, améliorant ainsi les performances de RAG dans des applications réelles.

RAG fonctionne en deux étapes principales : récupération et génération. Dans la phase de récupération, le modèle convertit le texte en vecteurs, indexe, récupère et re-classe ces vecteurs pour identifier les meilleures correspondances. Cependant, des échecs dans cette phase peuvent entraîner des contextes pertinents manqués, ce qui entraîne un rappel de contexte plus faible et des sorties de génération moins précises. Une solution efficace consiste à adapter le modèle d’embedding, qui est conçu pour comprendre les relations entre les données textuelles, afin de produire des embeddings spécifiques au jeu de données utilisé. Cet ajustement permet au modèle de générer des vecteurs similaires pour des phrases similaires, améliorant ainsi sa capacité à récupérer un contexte hautement pertinent pour la requête.

Pour améliorer le rappel de contexte, il est essentiel de préparer un jeu de données sur mesure qui reflète les types de requêtes que le modèle rencontrera. Cela implique d’extraire une gamme diversifiée de questions de la base de connaissances, de les reformuler pour la variabilité et de les organiser par pertinence. De plus, la construction d’un jeu de données d’évaluation aide à évaluer les performances du modèle dans un cadre réaliste. En utilisant un évaluateur de récupération d’information, les développeurs peuvent mesurer des métriques telles que Recall@k et Precision@k pour évaluer la précision de la récupération. En fin de compte, l’ajustement du modèle d’embedding peut entraîner des améliorations substantielles du rappel de contexte, garantissant que RAG reste précis et fiable dans les environnements de production.

Related News

Les cryptomonnaies axées sur l'IA subissent un déclin significatif en raison du ralentissement des centres de données de Microsoft cover
il y a un jour
Les cryptomonnaies axées sur l'IA subissent un déclin significatif en raison du ralentissement des centres de données de Microsoft
Le récent déclin du marché des cryptomonnaies, en particulier pour les jetons axés sur l'IA, a été fortement influencé par la décision de Microsoft de ralentir ses plans d'expansion des centres de données. Au cours des dernières 24 heures, le jeton de Bittensor a chuté de 10 %, avec une baisse impressionnante de 24 % au cours de la semaine dernière. Le Render Token (RNDR) et Grass ont également connu des baisses respectives de 10 % et 20 %, contribuant à une diminution de 10 % de la capitalisation boursière globale des jetons AI suivis par CoinGecko. Cette tendance reflète la performance des principales actions liées à l'IA, NVIDIA ayant connu une baisse de plus de 30 % par rapport à son pic de 2024 et AMD ayant chuté de 47 % par rapport à ses sommets cette année. L'impact de l'annonce de Microsoft, qui inclut l'arrêt ou le retard des développements de centres de données dans plusieurs pays, soulève des inquiétudes quant au rythme de croissance du secteur de l'IA. Cette nouvelle est particulièrement frappante compte tenu du rôle central de Microsoft dans la commercialisation de l'IA grâce à sa collaboration avec OpenAI, le créateur de ChatGPT. Des analystes de TD Cowen ont exprimé des inquiétudes concernant un éventuel excès d'offre de centres de données, suggérant que la demande pourrait ne pas suivre le rythme de l'expansion rapide précédemment anticipée. Le boom de l'IA a attiré de nombreux développeurs dans l'espace crypto, avec des projets comme Bittensor offrant des places de marché décentralisées pour les modèles d'apprentissage de l'IA, où les mineurs gagnent des jetons TAO en contribuant des ressources informatiques. Render fonctionne sur Solana, fournissant une plateforme pour que les utilisateurs louent de la puissance GPU, tandis que Grass incite les utilisateurs à gagner des jetons grâce à des installations d'applications. De plus, le déclin des jetons mèmes liés à l'IA, en particulier au sein de l'écosystème Virtuals Protocol, met en évidence la correction plus large du marché, avec des jetons comme GAME voyant leur valorisation chuter de 350 millions de dollars à seulement 13 millions de dollars depuis janvier.
Phoenix mène la croissance et l'innovation du secteur DePIN-AI cover
il y a 8 jours
Phoenix mène la croissance et l'innovation du secteur DePIN-AI
Le secteur du Réseau d'Infrastructure Physique Décentralisé (DePIN) évolue rapidement, montrant un potentiel significatif dans divers domaines technologiques. Selon un rapport récent de Messari, le DePIN est actuellement dans sa phase de croissance naissante, détenant moins de 0,1 % de la part de marché mais affichant une capitalisation boursière de 50 milliards de dollars, soutenue par plus de 13 millions de dispositifs contribuant quotidiennement. En éliminant les intermédiaires centralisés, le DePIN facilite un partage plus efficace et inclusif des actifs physiques, ce qui est crucial pour le développement et l'exploitation des infrastructures critiques dans l'informatique, l'IA, la technologie sans fil et les services énergétiques. Depuis sa création, le DePIN a attiré l'attention des grandes entreprises technologiques, en particulier en 2023, alors que les fabricants mondiaux ont commencé à intégrer la blockchain dans les infrastructures du monde réel. Le secteur peut être catégorisé en Réseaux de Ressources Physiques, qui se concentrent sur les dispositifs, et Réseaux de Ressources Numériques, qui mettent l'accent sur les ressources informatiques comme les CDN et l'IA. Cette dualité permet aux propriétaires de dispositifs individuels de partager des données et de gagner des récompenses tout en fournissant des ressources informatiques accessibles. Les applications du DePIN s'étendent aux télécommunications, à la gestion des données et au stockage dans le cloud, offrant des alternatives évolutives aux systèmes centralisés traditionnels et améliorant les fonctionnalités de l'IA. À l'avant-garde de cette innovation se trouve Phoenix, un réseau de calcul AI décentralisé qui exploite l'infrastructure DePIN pour offrir des solutions évolutives pour les applications d'IA. La plateforme SkyNet de Phoenix utilise un réseau mondial distribué de GPU haute performance, y compris des modèles NVIDIA et alternatifs, pour optimiser les opérations d'IA. Leurs collaborations avec des entreprises comme TandemAI et Origin Quantum visent à démocratiser l'accès aux ressources informatiques avancées, permettant aux organisations de recherche de réaliser des analyses complexes à des coûts minimes. Alors que le secteur DePIN-AI devrait atteindre une taille de marché de 3,5 billions de dollars d'ici 2028, Phoenix est bien placé pour mener cette vague transformative en fusionnant une infrastructure décentralisée avec des technologies d'IA de pointe.
Le protocole SFT s'associe à SOLPEN pour faire avancer l'infrastructure décentralisée pilotée par l'IA cover
il y a 9 jours
Le protocole SFT s'associe à SOLPEN pour faire avancer l'infrastructure décentralisée pilotée par l'IA
Le protocole SFT, un acteur majeur du paysage Web3, a annoncé un partenariat stratégique avec SOLPEN, un écosystème DePIN piloté par l'IA basé sur la blockchain Solana. Cette collaboration vise à redéfinir l'interaction entre les réseaux d'IA décentralisés et l'Internet des objets (IoT), renforçant ainsi le lien entre la technologie Web3 et l'infrastructure physique. L'initiative a été révélée par les canaux de médias sociaux officiels du protocole SFT, soulignant l'importance de cette fusion pour faire avancer les capacités des deux plateformes. Le partenariat vise à fusionner les solutions robustes du protocole SFT pour l'infrastructure DePIN avec la technologie portable de pointe pilotée par l'IA de SOLPEN. Cette intégration devrait créer un écosystème décentralisé qui fonctionne avec une faible latence et une grande efficacité. En tirant parti du traitement de données décentralisé et de l'analyse IA, la collaboration promet d'améliorer considérablement les applications du monde réel. Le protocole SFT s'est établi comme un acteur clé de l'écosystème DePIN, se concentrant sur une infrastructure basée sur la blockchain qui soutient des applications du monde réel sans faille, favorisant ainsi l'adoption plus large des technologies Web3. De plus, la collaboration bénéficie de la blockchain haute performance de Solana, qui facilite une intégration sans précédent entre diverses plateformes Web3. En établissant de nouvelles normes pour l'infrastructure décentralisée, le protocole SFT et SOLPEN améliorent la praticité et l'accessibilité de leurs offres. Alors qu'ils continuent d'évoluer, ce partenariat est prêt à mener vers un réseau Web3 plus intelligent, intégré à l'IA, ouvrant la voie à des solutions innovantes dans le paysage décentralisé.
Les Devils du New Jersey lancent le chatbot IA 'Bott Stevens' pour améliorer l'engagement des fans cover
il y a 16 jours
Les Devils du New Jersey lancent le chatbot IA 'Bott Stevens' pour améliorer l'engagement des fans
Les Devils du New Jersey ont introduit un chatbot IA révolutionnaire nommé "Bott Stevens", visant à améliorer l'engagement numérique des fans. Ce chatbot innovant est nommé d'après le légendaire joueur des Devils, Scott Stevens, et est alimenté par l'infrastructure IA décentralisée de Theta EdgeCloud. Prévu pour être lancé lors de la saison NHL 2024-25, Bott Stevens sera accessible sur le site officiel de l'équipe, fournissant aux fans des informations en temps réel sur les horaires des matchs, les ventes de billets, les statistiques et les produits dérivés. En utilisant la technologie de génération augmentée par récupération de Theta, le chatbot garantira l'exactitude des données en s'approvisionnant auprès des canaux officiels de la NHL, minimisant ainsi le risque de désinformation provenant de sources non vérifiées. Bott Stevens possède des capacités de calcul impressionnantes, tirant parti du réseau de plus de 30 000 nœuds de périphérie et de GPU distribués de Theta EdgeCloud, qui offrent collectivement plus de 80 PetaFLOPS de puissance de traitement. Cette infrastructure robuste est conçue pour gérer la demande de pointe, en particulier lors d'événements cruciaux comme les playoffs ou des annonces importantes de l'équipe. En plus de répondre aux questions des fans, le chatbot fournira des moments forts historiques, des résumés de matchs, des informations sur les lieux et des mises à jour sur les événements de l'équipe. Les améliorations futures pourraient inclure des analyses prédictives pour les sports de fantasy et des outils interactifs pour engager davantage les fans. Pour promouvoir Bott Stevens, les Devils prévoient d'intégrer ses capacités sur plusieurs plateformes, encourageant l'interaction et la sensibilisation des fans. Le chatbot ne se contentera pas de fournir des statistiques et des horaires, mais aussi du contenu sélectionné qui enrichit l'expérience des fans, tels que des moments forts historiques et des informations sur les événements à venir. Les indicateurs de succès incluront les taux d'engagement des utilisateurs, l'exactitude des informations et les retours des fans, garantissant que Bott Stevens reste une ressource précieuse pour la communauté des Devils. En se concentrant sur l'apprentissage continu et les interactions personnalisées, l'équipe vise à différencier Bott Stevens des autres agents IA, créant une expérience unique et engageante pour les fans.
Révolutionner l'IA Confidentielle avec Intel TDX et iExec cover
il y a 17 jours
Révolutionner l'IA Confidentielle avec Intel TDX et iExec
Le paysage de l'IA Confidentielle subit une transformation significative, principalement grâce à l'introduction des Extensions de Domaine de Confiance Intel® (Intel® TDX). Pendant des années, les développeurs ont rencontré des défis pour sécuriser les charges de travail d'IA en utilisant Intel SGX, ce qui nécessitait souvent des modifications importantes des applications et entraînait des problèmes de compatibilité. Ce processus fastidieux non seulement faisait perdre du temps, mais freinait également l'adoption réelle des solutions d'IA Confidentielle. Cependant, avec Intel TDX, les développeurs peuvent désormais exécuter des charges de travail d'IA dans des machines virtuelles sécurisées sans avoir besoin de réécrire leur code, simplifiant ainsi le processus de développement et améliorant les performances. Intel TDX est conçu pour créer un environnement d'exécution de confiance (TEE) isolé matériellement qui améliore la confidentialité et l'intégrité des données dans des environnements virtualisés. Intégré dans les processeurs Intel® Xeon® Scalable de 4ème génération, TDX introduit des Domaines de Confiance qui isolent les machines virtuelles du hyperviseur et même des fournisseurs de services cloud. Cette isolation est cruciale pour les applications d'IA qui traitent des ensembles de données sensibles et des modèles propriétaires, car elle réduit considérablement la surface d'attaque tout en maintenant des performances élevées. De plus, TDX est optimisé pour les charges de travail d'IA, tirant parti des capacités avancées des CPU pour accélérer les modèles d'apprentissage profond et d'apprentissage automatique, en faisant un choix robuste pour les développeurs. La collaboration entre Intel TDX et iExec ouvre la voie à une nouvelle ère de l'IA Confidentielle. En tant que membre Gold de l'Intel Partner Alliance, iExec est à l'avant-garde de ce mouvement, fournissant des solutions qui permettent une exécution sécurisée, décentralisée et évolutive des charges de travail d'IA. Ce partenariat améliore non seulement la sécurité des calculs d'IA, mais garantit également la conformité aux réglementations sur la protection des données. Avec des applications pratiques dans des secteurs comme la santé et la finance, iExec permet aux développeurs de créer des applications d'IA préservant la vie privée qui priorisent la propriété des données et le calcul sécurisé, conduisant finalement à un écosystème d'IA plus digne de confiance.
Les cryptomonnaies AI Bittensor et IntelMarkets montrent un potentiel de croissance prometteur cover
il y a 18 jours
Les cryptomonnaies AI Bittensor et IntelMarkets montrent un potentiel de croissance prometteur
Les cryptomonnaies alimentées par l'IA comme Bittensor et IntelMarkets connaissent une forte hausse, avec une impressionnante augmentation de 40 % le mois dernier attirant l'attention des analystes. L'adoption croissante de l'intelligence artificielle et de l'intelligence décentralisée a positionné les tokens TAO et INTL pour une croissance potentiellement substantielle. Les investisseurs se demandent si cela n'est que le début d'un mouvement plus large dans l'espace crypto, en particulier alors que les récents développements de Bittensor suggèrent un avenir prometteur. Le token TAO de Bittensor a récemment gagné en traction dans le secteur DeFi AI, bien qu'il reste dans un canal de prix descendant. Un léger motif d'englobement haussier est apparu, laissant entrevoir une possible rupture. Les facteurs contribuant à cet optimisme incluent le plan d'investissement substantiel du président Trump pour l'IA, qui, malgré son accent sur des solutions centralisées, pourrait élever les discussions autour de l'IA décentralisée, où Bittensor progresse. De plus, un partenariat entre Zuvu AI et Vana vise à améliorer l'IA décentralisée au sein de Bittensor, ouvrant potentiellement la voie pour que le TAO atteigne l'ambitieux seuil de 1 000 $ dans des conditions de marché favorables. D'autre part, IntelMarkets démocratise l'accès aux outils d'IA pour les traders quotidiens, auparavant réservés aux fonds spéculatifs. En fournissant des bots de trading avancés et des alertes en temps réel, IntelMarkets permet aux petits traders de prendre des décisions éclairées. La plateforme met également l'accent sur l'éducation, offrant des ressources pour simplifier des stratégies d'investissement complexes. Avec son système de sécurité robuste, Codeum, IntelMarkets garantit la protection des actifs des utilisateurs. Actuellement à la phase 10 de sa prévente, le token INTL est proposé à un prix attractif de 0,092 $, avec des prévisions suggérant qu'il pourrait rivaliser avec la capitalisation boursière de Bittensor, offrant aux investisseurs précoces un potentiel de retour sur investissement de 20 000 %.
Inscrivez-vous pour les dernières nouvelles et mises à jour de DePIN