情報検索強化生成におけるコンテキストリコールの向上

金曜日, 11月 22, 2024 12:00 午前

2,697

情報検索強化生成（RAG）は、大規模言語モデル（LLM）を専門的なビジネスアプリケーションに統合するための重要な手法として浮上しており、モデルの応答に独自のデータを注入することを可能にします。概念実証（POC）フェーズでの効果的な実施にもかかわらず、開発者はRAGを本番環境に移行する際に、しばしば大幅な精度の低下に直面します。この問題は特に、与えられたクエリに対して最も関連性の高いコンテキストを正確に取得することを目的とする検索フェーズで顕著であり、このメトリックはコンテキストリコールとして知られています。本記事では、埋め込みモデルをカスタマイズおよび微調整することによってコンテキストリコールを向上させるための戦略を掘り下げ、RAGの実際のアプリケーションにおけるパフォーマンスを改善する方法について説明します。

RAGは主に2つのステップで動作します：検索と生成。検索フェーズでは、モデルがテキストをベクトルに変換し、インデックスを作成し、これらのベクトルを取得して再ランク付けして、トップマッチを特定します。しかし、このフェーズでの失敗は、関連するコンテキストの見逃しにつながり、コンテキストリコールの低下と生成出力の精度の低下を引き起こす可能性があります。効果的な解決策の1つは、テキストデータ間の関係を理解するように設計された埋め込みモデルを調整し、使用されるデータセットに特有の埋め込みを生成することです。この微調整により、モデルは類似の文に対して類似のベクトルを生成できるようになり、クエリに対して非常に関連性の高いコンテキストを取得する能力が向上します。

コンテキストリコールを改善するためには、モデルが遭遇するクエリの種類を反映した特注のデータセットを準備することが不可欠です。これには、知識ベースから多様な質問を抽出し、変動性のためにそれらを言い換え、関連性に基づいて整理することが含まれます。さらに、評価データセットを構築することで、モデルのパフォーマンスを現実的な設定で評価するのに役立ちます。情報検索評価者を使用することで、開発者はRecall@kやPrecision@kなどのメトリックを測定し、検索の精度を評価できます。最終的に、埋め込みモデルの微調整はコンテキストリコールの大幅な改善につながり、RAGが本番環境で正確かつ信頼できるものであり続けることを保証します。

Source: spheron.network

Related News

2日前

io.net、市場の課題にもかかわらず収益成長を報告

最新の四半期報告書で、io.netは収益の大幅な成長を示し、82.6%の印象的な増加を達成し、総収益は570万ドルに達しました。この収益の急増は、暗号通貨市場全体の収縮を考慮すると特に注目に値します。IOトークンの時価総額は71.4%減少し、1億800万ドルにまで落ち込み、トークン価格も74.9%下落しました。これらの課題にもかかわらず、io.netはZerebro、KREA、Injectiveとのパートナーシップを含む、さまざまなAIおよび計算に焦点を当てたプラットフォームとの統合に成功し、AIおよびDeFiアプリケーション向けの分散型GPU計算能力を向上させることを目指しています。 io.netのインフラストラクチャは、GPUとCPUの分散型ネットワークに基づいて構築されており、特に機械学習やAIアプリケーション向けに計算リソースへのスケーラブルなアクセスを可能にします。このプラットフォームは、さまざまな機械学習フレームワークをサポートしており、リソースの割り当てにおける柔軟性と効率性を確保しています。しかし、平均的な日次確認済み計算リソースは減少しており、確認済みのGPUとCPUはそれぞれ11.1%と4.5%の減少を示しています。この減少は、供給側の課題とトークンインセンティブの減少を反映しており、ネットワーク内の全体的な活動に影響を与えています。混合したパフォーマンス指標にもかかわらず、io.netはエコシステムを拡大するための多くのコラボレーションを通じて、安定した開発ペースを維持しています。2025年第1四半期に形成されたパートナーシップ、Alpha NetworkやMira Networkとの提携は、分散型AIインフラストラクチャの強化に対するio.netのコミットメントを強調しています。プロジェクトが経済モデルを洗練し、ネットワークの能力を拡大し続ける中で、困難な市場環境の中でも分散型計算リソースの進化する風景において重要なプレーヤーであり続けています。

AI 資金調達

2日前

ベン・ゴートゼル：より良い未来のための分散型AIの先駆者

人工知能の先駆者であるベン・ゴートゼルは、30年前に最初のコードを書いて以来、分散型AIを推進してきました。世界が人工一般知能（AGI）を達成しようとしている今、ゴートゼルは、この強力な技術が中央集権的な権力に奉仕するのではなく、人類に利益をもたらすために分散化が重要であると強調しています。最近のトロントでのコンセンサス会議では、彼は、彼のプロジェクトであるシンギュラリティネットを通じて、AGIが今後1〜3年以内に立ち上げられる可能性に楽観的であると表明しました。このプロジェクトは、AIサービスのためのグローバルマーケットプレイスを作ることを目指しています。プロジェクトは、マインドネットワークやファイルコイン財団とのパートナーシップ、5300万ドルのモジュラースーパーコンピュータへの投資、オーシャンプロトコルやフェッチ.aiとのトークン合併など、重要な進展を遂げています。ゴートゼルの分散型AIに対するビジョンは、彼が最初にインターネットを分散型プラットフォームとして見た初期の経験に根ざしています。しかし、彼は、GoogleやFacebookのようなテクノロジーの巨人の台頭が、分散化の基本原則を損なうより中央集権的なインターネットをもたらしたと指摘しています。AGIが善の力となるためには、最初から分散型アーキテクチャに基づいて構築される必要があると彼は主張しています。この哲学は、シンギュラリティネット、ハイペロン、そして分散型AIアプリケーションに特化した今後のASIチェーンの設計に反映されています。ゴートゼルは、AGI後の時代の軌道は、その発展における分散型エコシステムの役割に基づいて大きく異なると信じています。 AIの仕事に加えて、ゴートゼルは90年代にさかのぼる分散型マネーの概念を探求してきた歴史があります。彼と彼の仲間たちは、スピードやコストに関する懸念から、当初は分散型取引の実用性を否定していましたが、ビットコインの登場は彼の初期のアイデアのいくつかを検証しました。彼はその時代の機会を逃したことをユーモラスに振り返り、ビジネスセンスの欠如が分散型マネーのより暗い用途を想像することを妨げたと認めています。今日、ゴートゼルの分散型AIへのコミットメントはますます注目を集めており、彼と彼の取り組みは、技術とガバナンスの進化する風景における重要なプレーヤーとしての地位を確立しています。

AI 資金調達

6日前

市場の清算の中でGRASSとPI暗号トークンに注目する投資家たち

投資家たちは現在、ユニークな価値提案により注目を集めているGRASSとPI暗号トークンに焦点を当てています。Best Walletの進行中のプレセールも注目を集めており、1200万ドル以上を調達しています。過去24時間で、Binance、Bybit、OKXなどの永久暗号取引所は、153,000人以上のトレーダーに影響を与え、665百万ドル以上のレバレッジポジションを清算しました。この混乱にもかかわらず、多くのトレーダーはGRASSとPIに楽観的であり、2025年第2四半期のブレイクアウトトークンとして期待しています。特に、PI暗号は4月初旬以来80％急増し、GRASSは2024年10月末の過去最低値から140％増加しています。 GRASSは、Polychain CapitalやTribe Capitalなどの著名なベンチャーキャピタリストに支えられた、Solana上に構築された分散型レイヤー2プラットフォームです。これは、AIモデルのトレーニングに重要なアイドルインターネット帯域幅を収益化することを可能にします。このプラットフォームは、2025年第1四半期だけで5700万GBの公共ウェブデータのスクレイピングを実現しました。参加者はGRASSポイントを獲得し、これをGRASSトークンに変換でき、プラットフォームはノードオペレーターの大幅な増加を見ており、関心と採用が高まっています。アナリストはGRASSを探求すべき主要な暗号通貨の一つとしてランク付けしており、AIと分散型物理インフラネットワーク（DePIN）セクターにおけるその潜在能力を強調しています。一方、Pi Networkは最近中央ノードを無効にし、6000万人以上のユーザーのコミュニティに権限を与えることで、分散化に向けて前進しています。その正当性に関する懐疑的な見方にもかかわらず、Pi Networkのメインネットは2025年2月に立ち上げられ、以来PI暗号の価格は大きく変動しています。GRASSとPIが進化し続ける中、投資家には投資判断を下す前に徹底的な調査を行うことが推奨されます。さらに、Best Walletのプレセールは興奮を生み出しており、その機能とセキュリティ対策が暗号ウォレット分野での強力な競争相手としての地位を確立しています。

資金調達 AI

10日前

暗号市場の冷却の中で輝くAmpとAethir

冷却中の暗号市場において、Amp（AMP）とAethir（ATH）は際立ったパフォーマーとして浮上し、それぞれ16％の価値の顕著な増加を経験しています。Ampは現在0.0051ドルで評価されており、主要な指数移動平均（EMA）によって支えられた強い強気の勢いと、MACDやRSIなどの指標からの好意的な取引信号によって後押しされていますが、過剰買いの条件に対する警告もあります。一方、AI駆動のブロックチェーンソリューションに焦点を当てるAethirは、0.052ドルに急上昇し、重要な抵抗レベルを突破し、強気の楽観主義を維持していますが、過剰買いのRSIはトレーダーが警戒を怠らないように示唆しています。暗号市場の乖離は明らかで、Helium（HNT）は下向きの圧力に直面し、4.00ドルで取引されており、重要な200日EMAの下で苦しんでいます。この状況は、100日EMAのサポートである3.83ドルを突破するとさらなる下落のリスクをもたらします。AmpとAethirのHeliumに対する対照的な軌道は、デジタル資産市場内の持続的なボラティリティと革新を強調し、トレーダーに野心とリスク管理戦略のバランスを取るよう促しています。トレーダーがこれらの turbulent watersを航行する中で、AmpとAethirのレジリエンスは、市場の停滞の中でも成長の可能性を強調しています。投資家は、最適なエントリーポイントを特定し、リスクを効果的に管理するために、特にEMAやRSIレベルなどの主要なテクニカル指標を注意深く監視することが推奨されます。これらのプロジェクトにおける進展は、暗号通貨の風景の動的な性質を反映しており、革新が引き続き関心と投資機会を生み出しています。

資金調達 AI

11日前

ソラナの回復とAI駆動プロジェクトBittensorおよびUnilabsの台頭

ソラナ（SOL）は驚異的な回復を見せており、今年の最安値から90％回復しましたが、依然として180ドルの重要な抵抗レベルの下に制約されています。アナリストたちは楽観的で、ソラナの価格が重要なブレイクアウトの瀬戸際にある可能性があると示唆しています。特に最近、多くのSOLミームコインが急騰したためです。現在の市場のセンチメントは、強固なファンダメンタルズと上昇傾向によって支えられており、SOLは170ドル前後で推移しています。180ドルの抵抗を越える決定的な動きは、200ドル以上への潜在的な上昇の道を開く可能性があり、250ドル前後に達することも考えられます。この中で、Bittensor（TAO）は注目すべきプレーヤーとして浮上しており、ビットコイン（BTC）を含む他の暗号通貨が苦しむ中でも安定したパフォーマンスを維持しています。Bittensorへの関心は、ドナルド・トランプが暗号とAIの革新者の夕食会に出席したなどの注目を集めたイベントに続いて、分散型AIへの革新的なアプローチによって大きく高まっています。現在457ドル前後で取引されているBittensorは、利益を保持し、ブロックチェーン技術とAIを統合するプロジェクトへの市場の信頼が高まっていることを反映しています。一方、Unilabs（UNIL）は、ソラナのような従来のレイヤー1ネットワークからの多様化を目指す投資家にとって魅力的な代替手段として勢いを増しています。ブロックチェーンの透明性とAIインフラストラクチャの融合に焦点を当てているUnilabsは、DeFiおよびAI分野のリーダーとしての地位を確立しています。トークンベースのインセンティブシステムを含むその革新的なモデルは、ユーザーと開発者の両方を引き付けることを目指しています。ソラナの成長が停滞する中、Unilabsはトレーダーにとってユニークな機会を提供し、急速に進化する暗号の風景の中でDeFi AIプラットフォームの基準を再定義する可能性があります。

AI 資金調達

16日前

Xangle、エンタープライズバリデーターとしてTheta Networkに参加し、ブロックチェーンインフラを強化

9日、ブロックチェーンインフラ企業Xangleは、エンタープライズバリデーターとしてグローバルブロックチェーンメインネットTheta Networkへの参加を発表しました。Theta Networkは、人工知能（AI）、メディア、スポーツ、エンターテインメントなどの分野に特化した分散型クラウドインフラを提供することで知られています。世界中に30,000以上の分散エッジノードを持つ強力なフレームワークを誇り、効率的な運用とガバナンスを確保しています。このネットワークは、Samsung Next、Sony Innovation Fund、Bertelsmann Digital Media Investments、Creative Artists Agency（CAA）などの著名な企業からの戦略的投資を受けており、Google、Samsung、Binanceなどのグローバル企業もエンタープライズバリデーターとして参加しています。 Thetaエコシステムへのコミットメントの一環として、Xangleは合計200,000のTheta（THETA）トークンをステークし、バリデーターノードとしてネットワークのセキュリティとガバナンスを大幅に強化します。同社は、Thetaが推進する分散型物理インフラネットワーク（DePIN）とAIエコシステムの拡大に積極的に貢献することを目指しています。2018年に設立されたXangleは、韓国における主要なWeb3インフラサービスプロバイダーおよび研究プラットフォームとして確立されており、コミュニティハブ、ブロックチェーンエクスプローラー、包括的なWeb3業界分析レポートを提供しています。また、Aptos、Babylon、0G、Initiaなどのさまざまなグローバルプロジェクトのバリデーターとしても活動しています。 Xangleの共同CEOであるイ・ヒョンウは、パートナーシップについての期待を表明し、「私たちは、Thetaとの戦略的パートナーシップを通じて、Google、Samsung、CAAとともにエンタープライズバリデーターとしてリストされることを非常に嬉しく思っています」と述べました。彼は、Thetaのバリデーターネットワークへのステーキングが、レイヤー1ブロックチェーンにおける信頼性、分散化、透明性を向上させるというXangleの使命と完全に一致していると強調しました。Theta Networkの共同創設者兼CEOであるミッチ・リウもこの意見に同意し、Xangleのブロックチェーン分析およびエコシステム開発における強みを強調し、Theta（THETA）およびTheta Fuel（TFUEL）の促進、ならびにThetaブロックチェーン全体のセキュリティとスケーラビリティの向上において重要なシナジーを期待しています。

AI 資金調達

最新のDePINニュースとアップデートにサインアップしてください