Verbesserung des Kontextabrufs in der retrieval-unterstützten Generierung

Freitag, November 22, 2024 12:00 AM

2,697

Die retrieval-unterstützte Generierung (RAG) hat sich als eine entscheidende Methode zur Integration großer Sprachmodelle (LLMs) in spezialisierte Geschäftsanwendungen etabliert, die es ermöglicht, proprietäre Daten in die Modellantworten einzufügen. Trotz ihrer Effektivität in der Konzeptnachweisphase (POC) sehen sich Entwickler oft erheblichen Genauigkeitsverlusten gegenüber, wenn sie RAG in die Produktion überführen. Dieses Problem ist insbesondere in der Abrufphase ausgeprägt, in der es darum geht, den relevantesten Kontext für eine gegebene Anfrage genau abzurufen, ein Maß, das als Kontextabruf bekannt ist. Dieser Artikel befasst sich mit Strategien zur Verbesserung des Kontextabrufs durch Anpassung und Feinabstimmung von Einbettungsmodellen, um letztendlich die Leistung von RAG in realen Anwendungen zu verbessern.

RAG funktioniert in zwei Hauptschritten: Abruf und Generierung. In der Abrufphase wandelt das Modell Text in Vektoren um, indiziert, ruft diese Vektoren ab und sortiert sie neu, um die besten Übereinstimmungen zu identifizieren. Misserfolge in dieser Phase können jedoch zu verpassten relevanten Kontexten führen, was zu einem niedrigeren Kontextabruf und weniger genauen Generierungsergebnissen führt. Eine effektive Lösung besteht darin, das Einbettungsmodell anzupassen, das darauf ausgelegt ist, Beziehungen zwischen Textdaten zu verstehen, um Einbettungen zu erzeugen, die spezifisch für den verwendeten Datensatz sind. Diese Feinabstimmung ermöglicht es dem Modell, ähnliche Vektoren für ähnliche Sätze zu generieren, wodurch seine Fähigkeit verbessert wird, Kontexte abzurufen, die für die Anfrage hochrelevant sind.

Um den Kontextabruf zu verbessern, ist es wichtig, einen maßgeschneiderten Datensatz vorzubereiten, der die Arten von Anfragen widerspiegelt, mit denen das Modell konfrontiert wird. Dies umfasst das Extrahieren einer Vielzahl von Fragen aus der Wissensdatenbank, deren Paraphrasierung zur Variabilität und die Organisation nach Relevanz. Darüber hinaus hilft der Aufbau eines Evaluierungsdatensatzes, die Leistung des Modells in einer realistischen Umgebung zu bewerten. Durch den Einsatz eines Informationsabrufevaluators können Entwickler Metriken wie Recall@k und Precision@k messen, um die Abrufgenauigkeit zu beurteilen. Letztendlich kann die Feinabstimmung des Einbettungsmodells zu erheblichen Verbesserungen des Kontextabrufs führen und sicherstellen, dass RAG in Produktionsumgebungen genau und zuverlässig bleibt.

Source: spheron.network

Related News

vor 2 Tagen

io.net berichtet über Umsatzwachstum trotz Marktherausforderungen

Im neuesten Quartalsbericht hat io.net ein signifikantes Umsatzwachstum gezeigt und einen beeindruckenden Anstieg von 82,6 % erzielt, was den Gesamtumsatz auf 5,7 Millionen USD brachte. Dieser Anstieg des Umsatzes ist besonders bemerkenswert angesichts der breiteren Kontraktion im Kryptowährungsmarkt, wo die Marktkapitalisierung des IO-Tokens um 71,4 % auf 108 Millionen USD gefallen ist, während der Tokenpreis um 74,9 % gesunken ist. Trotz dieser Herausforderungen hat io.net erfolgreich mit verschiedenen AI- und rechenzentrierten Plattformen integriert, darunter Partnerschaften mit Zerebro, KREA und Injective, die darauf abzielen, die dezentralen GPU-Computing-Fähigkeiten für Anwendungen in AI und DeFi zu verbessern. Die Infrastruktur von io.net, die auf einem dezentralen Netzwerk von GPUs und CPUs basiert, ermöglicht einen skalierbaren Zugang zu Rechenressourcen, insbesondere für maschinelles Lernen und AI-Anwendungen. Die Plattform unterstützt eine Vielzahl von Frameworks für maschinelles Lernen und gewährleistet Flexibilität und Effizienz bei der Ressourcenzuteilung. Allerdings haben die durchschnittlichen täglich verifizierten Rechenressourcen einen Rückgang erfahren, wobei die verifizierten GPUs und CPUs um 11,1 % bzw. 4,5 % gesunken sind. Diese Reduzierung spiegelt anhaltende Herausforderungen auf der Angebotsseite und einen Rückgang der Tokenanreize wider, was die gesamte Aktivität innerhalb des Netzwerks beeinträchtigt hat. Trotz der gemischten Leistungskennzahlen hat io.net ein stetiges Entwicklungstempo beibehalten, mit zahlreichen Kooperationen, die darauf abzielen, sein Ökosystem zu erweitern. Die im ersten Quartal 2025 geschlossenen Partnerschaften, darunter die mit Alpha Network und Mira Network, unterstreichen das Engagement von io.net zur Verbesserung der dezentralen AI-Infrastruktur. Während das Projekt weiterhin seine Wirtschaftsmodelle verfeinert und seine Netzwerkfähigkeiten erweitert, bleibt es ein wichtiger Akteur im sich entwickelnden Umfeld dezentraler Rechenressourcen, selbst in einem herausfordernden Marktumfeld.

KI Finanzierung

vor 2 Tagen

Ben Goertzel: Pionier der dezentralen KI für eine bessere Zukunft

Ben Goertzel, ein Pionier der künstlichen Intelligenz, setzt sich seit er vor 30 Jahren seinen ersten Code geschrieben hat, für dezentrale KI ein. Während die Welt am Rande steht, künstliche allgemeine Intelligenz (AGI) zu erreichen, betont Goertzel die Bedeutung der Dezentralisierung, um sicherzustellen, dass diese mächtige Technologie der Menschheit zugutekommt und nicht zentralisierten Mächten dient. Auf der kürzlich stattgefundenen Consensus-Konferenz in Toronto äußerte er Optimismus, dass AGI innerhalb der nächsten ein bis drei Jahre durch sein Projekt SingularityNET gestartet werden könnte, das darauf abzielt, einen globalen Marktplatz für KI-Dienste zu schaffen. Das Projekt hat bedeutende Fortschritte gemacht, darunter Partnerschaften mit Mind Network und der Filecoin Foundation, eine Investition von 53 Millionen Dollar in einen modularen Supercomputer und eine Token-Verschmelzung mit Ocean Protocol und Fetch.ai. Goertzel's Vision für dezentrale KI basiert auf seinen frühen Erfahrungen mit dem Internet, das er ursprünglich als dezentrale Plattform sah. Er merkt jedoch an, dass der Aufstieg von Technologiegiganten wie Google und Facebook zu einem zentralisierteren Internet geführt hat, das die grundlegenden Prinzipien der Dezentralisierung untergräbt. Er argumentiert, dass AGI eine Kraft für das Gute sein muss, wenn sie von Anfang an auf einer dezentralen Architektur basiert. Diese Philosophie spiegelt sich im Design von SingularityNET, Hyperon und der kommenden ASI Chain wider, die für dezentrale KI-Anwendungen maßgeschneidert ist. Goertzel glaubt, dass der Verlauf der Post-AGI-Ära erheblich davon abhängen wird, welche Rolle dezentrale Ökosysteme in ihrer Entwicklung spielen. Neben seiner Arbeit in der KI hat Goertzel eine Geschichte in der Erforschung von Konzepten für dezentrales Geld, die bis in die 90er Jahre zurückreicht. Obwohl er und seine Kollegen anfangs die Praktikabilität dezentraler Transaktionen aufgrund von Bedenken hinsichtlich Geschwindigkeit und Kosten abtaten, hat das Aufkommen von Bitcoin einige seiner frühen Ideen validiert. Er reflektiert humorvoll über die verpassten Chancen dieser Ära und erkennt an, dass ihr Mangel an Geschäftssinn sie daran hinderte, die dunkleren Anwendungen von dezentralem Geld zu erkennen. Heute gewinnt Goertzel's Engagement für dezentrale KI weiterhin an Bedeutung und positioniert ihn und seine Initiativen als Schlüsselakteure in der sich entwickelnden Landschaft von Technologie und Governance.

KI Finanzierung

vor 6 Tagen

Investoren richten ihr Augenmerk auf GRASS- und PI-Kryptotoken amid Marktliquidationen

Investoren konzentrieren sich derzeit auf die GRASS- und PI-Kryptotoken, die aufgrund ihrer einzigartigen Wertangebote in den Schlagzeilen stehen. Der laufende Vorverkauf von Best Wallet hat ebenfalls Aufmerksamkeit erregt und über 12 Millionen Dollar gesammelt. In den letzten 24 Stunden haben perpetual Krypto-Börsen wie Binance, Bybit und OKX über 665 Millionen Dollar an gehebelten Positionen liquidiert, was mehr als 153.000 Trader betroffen hat. Trotz dieses Tumults bleiben viele Trader optimistisch in Bezug auf GRASS und PI und betrachten sie als potenzielle Durchbruchstoken für das zweite Quartal 2025. Bemerkenswert ist, dass der PI-Krypto seit Anfang April um 80 % gestiegen ist, während GRASS seit seinem Allzeittief Ende Oktober 2024 um 140 % zugenommen hat. GRASS ist eine dezentrale Layer-2-Plattform, die auf Solana basiert und von prominenten Risikokapitalgebern wie Polychain Capital und Tribe Capital unterstützt wird. Sie ermöglicht es Nutzern, ungenutzte Internetbandbreite zu monetarisieren, was entscheidend für das Training von KI-Modellen ist. Die Plattform hat allein im ersten Quartal 2025 das Scraping von beeindruckenden 57 Millionen GB öffentlicher Webdaten ermöglicht. Teilnehmer verdienen GRASS-Punkte, die in GRASS-Token umgewandelt werden können, und die Plattform hat einen signifikanten Anstieg der Knotenbetreiber verzeichnet, was auf wachsendes Interesse und Akzeptanz hinweist. Analysten ranken GRASS unter den Top-Kryptowährungen, die es zu erkunden gilt, und heben ihr Potenzial in den Bereichen KI und dezentrale physische Infrastrukturnetzwerke (DePIN) hervor. Auf der anderen Seite macht das Pi Network Fortschritte in Richtung Dezentralisierung, nachdem kürzlich sein zentraler Knoten deaktiviert wurde, wodurch die Gemeinschaft von über 60 Millionen Nutzern gestärkt wird. Trotz Skepsis hinsichtlich seiner Legitimität wurde das Mainnet des Pi Networks im Februar 2025 gestartet, und der Preis von PI-Krypto hat sich seitdem erheblich verändert. Während sowohl GRASS als auch PI weiterhin wachsen, wird Investoren geraten, gründliche Recherchen durchzuführen, bevor sie Investitionsentscheidungen treffen. Darüber hinaus erzeugt der Vorverkauf von Best Wallet Aufregung, da seine Funktionen und Sicherheitsmaßnahmen es als starken Konkurrenten im Bereich der Krypto-Wallets positionieren.

Finanzierung KI

vor 10 Tagen

Amp und Aethir glänzen trotz Abkühlung des Kryptomarktes

In einem abkühlenden Kryptomarkt haben Amp (AMP) und Aethir (ATH) als herausragende Performer hervorgetan, wobei beide einen bemerkenswerten Anstieg von 16 % im Wert verzeichneten. Amp wird derzeit mit 0,0051 $ bewertet, gestützt durch starke bullische Momentum, unterstützt von wichtigen exponentiellen gleitenden Durchschnitten (EMAs) und günstigen Handelssignalen von Indikatoren wie MACD und RSI, trotz Warnungen vor überkauften Bedingungen. Unterdessen ist Aethir, das sich auf KI-gesteuerte Blockchain-Lösungen konzentriert, auf 0,052 $ gestiegen, hat bedeutende Widerstandsniveaus durchbrochen und hält einen bullischen Optimismus aufrecht, obwohl der überkaufte RSI darauf hinweist, dass Händler wachsam bleiben sollten. Die Divergenz im Kryptomarkt ist offensichtlich, da Helium (HNT) unter Druck steht, bei 4,00 $ handelt und unter dem kritischen 200-Tage-EMA kämpft. Diese Situation birgt das Risiko weiterer Rückgänge, wenn die Unterstützung des 100-Tage-EMA bei 3,83 $ durchbrochen wird. Die kontrastierenden Trajektorien von Amp und Aethir im Vergleich zu Helium heben die anhaltende Volatilität und Innovation im digitalen Vermögensmarkt hervor und fordern die Händler auf, Ambitionen mit Risikomanagementstrategien in Einklang zu bringen. Während die Händler durch diese turbulenten Gewässer navigieren, unterstreicht die Widerstandsfähigkeit von Amp und Aethir das Wachstumspotenzial, selbst in Zeiten der Marktsättigung. Investoren werden ermutigt, wichtige technische Indikatoren genau zu beobachten, insbesondere EMAs und RSI-Niveaus, um optimale Einstiegspunkte zu identifizieren und Risiken effektiv zu managen. Die laufenden Entwicklungen in diesen Projekten spiegeln die dynamische Natur der Kryptowährungslandschaft wider, in der Innovation weiterhin Interesse und Investitionsmöglichkeiten antreibt.

Finanzierung KI

vor 11 Tagen

Solanas Erholung und der Aufstieg von KI-gesteuerten Projekten Bittensor und Unilabs

Solana (SOL) hat eine bemerkenswerte Erholung gezeigt und sich um 90 % von seinem tiefsten Punkt in diesem Jahr erholt, bleibt jedoch unter dem kritischen Widerstandsniveau von 180 $. Analysten sind optimistisch und deuten darauf hin, dass der Solana-Preis kurz vor einem signifikanten Ausbruch stehen könnte, insbesondere da viele SOL-Meme-Coins kürzlich gestiegen sind. Die aktuelle Marktstimmung wird durch starke Fundamentaldaten und eine aufwärts gerichtete Tendenz gestützt, wobei SOL um die 170 $ schwebt. Ein entscheidender Schritt über den Widerstand von 180 $ könnte den Weg für einen potenziellen Anstieg auf 200 $ und darüber hinaus ebnen, möglicherweise bis zu Niveaus um 250 $. Inmitten dessen hat sich Bittensor (TAO) als bemerkenswerter Akteur etabliert und zeigt eine stabile Leistung, während andere Kryptowährungen, einschließlich Bitcoin (BTC), Schwierigkeiten hatten. Das Interesse an Bittensor wird größtenteils durch seinen innovativen Ansatz zur dezentralen KI angetrieben, der nach hochkarätigen Veranstaltungen, wie Donald Trumps Teilnahme an einem Dinner für Krypto- und KI-Innovatoren, an Bedeutung gewonnen hat. Derzeit wird Bittensor um 457 $ gehandelt und hat Resilienz gezeigt, indem es Gewinne gehalten hat und das wachsende Marktvertrauen in Projekte widerspiegelt, die Blockchain-Technologie mit KI integrieren. In der Zwischenzeit gewinnt Unilabs (UNIL) an Dynamik als überzeugende Alternative für Investoren, die sich von traditionellen Layer-1-Netzwerken wie Solana diversifizieren möchten. Mit dem Fokus auf die Verschmelzung von Blockchain-Transparenz mit KI-Infrastruktur positioniert sich Unilabs als führend im DeFi- und KI-Bereich. Ihr innovatives Modell, das ein tokenbasiertes Anreizsystem umfasst, zielt darauf ab, sowohl Benutzer als auch Entwickler anzuziehen. Während das Wachstum von Solana ins Stocken gerät, bietet Unilabs eine einzigartige Gelegenheit für Händler und könnte die Standards für DeFi-KI-Plattformen in einer sich schnell entwickelnden Krypto-Landschaft neu definieren.

KI Finanzierung

vor 16 Tagen

Xangle tritt dem Theta-Netzwerk als Unternehmensvalidator bei und verbessert die Blockchain-Infrastruktur

Am 9. kündigte das Blockchain-Infrastrukturunternehmen Xangle seinen Eintritt in das globale Blockchain-Mainnet Theta Network als Unternehmensvalidator an. Das Theta Network ist bekannt für die Bereitstellung einer dezentralen Cloud-Infrastruktur, die auf Sektoren wie künstliche Intelligenz (KI), Medien, Sport und Unterhaltung zugeschnitten ist. Es verfügt über ein robustes Framework, das von über 30.000 verteilten Edge-Knoten weltweit unterstützt wird und einen effizienten Betrieb und Governance gewährleistet. Das Netzwerk hat strategische Investitionen von namhaften Unternehmen wie Samsung Next, Sony Innovation Fund, Bertelsmann Digital Media Investments und Creative Artists Agency (CAA) erhalten, wobei auch globale Giganten wie Google, Samsung und Binance als Unternehmensvalidatoren teilnehmen. Im Rahmen seines Engagements für das Theta-Ökosystem wird Xangle insgesamt 200.000 Theta (THETA) Tokens staken, was die Netzwerksicherheit und Governance als Validator-Knoten erheblich verbessert. Das Unternehmen hat sich zum Ziel gesetzt, aktiv zur Erweiterung des dezentralen physischen Infrastruktur-Netzwerks (DePIN) und des KI-Ökosystems, das Theta fördert, beizutragen. Gegründet im Jahr 2018 hat sich Xangle als führender Anbieter von Web3-Infrastruktur-Services und Forschungsplattformen in Korea etabliert und bietet Community-Hubs, Blockchain-Explorer und umfassende Analysen der Web3-Branche an. Es hat auch als Validator für verschiedene globale Projekte wie Aptos, Babylon, 0G und Initia gedient. Lee Hyun-woo, Co-CEO von Xangle, äußerte sich begeistert über die Partnerschaft und sagte: "Wir freuen uns sehr, als Unternehmensvalidator neben Google, Samsung und CAA durch unsere strategische Partnerschaft mit Theta gelistet zu werden." Er betonte, dass das Staken im Validator-Netzwerk von Theta perfekt mit Xangles Mission übereinstimmt, Vertrauen, Dezentralisierung und Transparenz in Layer-1-Blockchains zu verbessern. Mitch Liu, Mitbegründer und CEO des Theta-Netzwerks, teilte diese Ansicht und hob Xangles Stärken in der Blockchain-Analyse und der Entwicklung von Ökosystemen hervor und erwartete bedeutende Synergien bei der Förderung von Theta (THETA) und Theta Fuel (TFUEL) sowie bei der Verbesserung der allgemeinen Sicherheit und Skalierbarkeit der Theta-Blockchain.

KI Finanzierung

Melden Sie sich für die neuesten DePIN-Nachrichten und Updates an