Enhancing Context Recall in Retrieval-Augmented Generation

금요일, 11월 22, 2024 12:00 오전
22

Retrieval-augmented generation (RAG) has emerged as a pivotal method for integrating large language models (LLMs) into specialized business applications, enabling the infusion of proprietary data into model responses. Despite its effectiveness during the proof of concept (POC) phase, developers often face significant accuracy drops when transitioning RAG into production. This issue is particularly pronounced during the retrieval phase, where the aim is to accurately fetch the most relevant context for a given query, a metric known as context recall. This article delves into strategies for enhancing context recall by customizing and fine-tuning embedding models, ultimately improving RAG’s performance in real-world applications.

RAG operates in two main steps: retrieval and generation. In the retrieval phase, the model converts text into vectors, indexes, retrieves, and re-ranks these vectors to identify the top matches. However, failures in this phase can lead to missed relevant contexts, resulting in lower context recall and less accurate generation outputs. One effective solution is to adapt the embedding model, which is designed to understand relationships between text data, to produce embeddings that are specific to the dataset being used. This fine-tuning allows the model to generate similar vectors for similar sentences, enhancing its ability to retrieve context that is highly relevant to the query.

To improve context recall, it is essential to prepare a tailored dataset that reflects the types of queries the model will encounter. This involves extracting a diverse range of questions from the knowledge base, paraphrasing them for variability, and organizing them by relevance. Additionally, constructing an evaluation dataset helps assess the model’s performance in a realistic setting. By employing an Information Retrieval Evaluator, developers can measure metrics like Recall@k and Precision@k to gauge retrieval accuracy. Ultimately, fine-tuning the embedding model can lead to substantial improvements in context recall, ensuring that RAG remains accurate and reliable in production environments.

Related News

벤처마인드 AI, AI 및 로봇 기술 강화를 위해 세타 엣지클라우드와 파트너십 체결 cover
2일 전
벤처마인드 AI, AI 및 로봇 기술 강화를 위해 세타 엣지클라우드와 파트너십 체결
AI와 블록체인의 교차점에서 흥미로운 발전이 이루어졌습니다. 벤처마인드 AI는 세타 엣지클라우드와의 파트너십을 발표했습니다. 이 협력은 세타의 분산형 저지연 컴퓨팅 및 스트리밍 자원을 활용하여 벤처마인드 AI의 능력을 강화하는 것을 목표로 하고 있습니다. 엣지클라우드를 통합함으로써 벤처마인드 AI는 AI 도구를 확장하고, 비디오 렌더링을 최적화하며, 실시간 로봇 제어를 제공할 수 있어 건설 및 보안과 같은 분야에서 서비스 제공을 크게 개선할 수 있습니다. 이 파트너십은 AI 혁신과 분산 금융 및 고급 로봇 기술을 결합하는 포괄적인 생태계를 만드는 데 중요한 이정표가 됩니다. 벤처마인드 AI는 사용자가 AI 도구를 NFT로 생성, 발행 및 거래할 수 있는 선구적인 플랫폼으로, 독특한 소유권 및 수익 잠재력을 제공합니다. 이 플랫폼은 사용자들이 토큰화된 커뮤니티를 시작하고 시장 조성 활동을 관리할 수 있도록 하는 맞춤형 자율 에이전트 빌더도 제공합니다. 2023년 6월 출범 이후, 엣지클라우드는 서울대학교와 GenAI 검색 라인과 같은 기관들이 AI 연구 및 응용을 발전시키기 위해 그 인프라를 활용하면서 학계와 기업 환경에서 주목받고 있습니다. 세타 엣지클라우드와의 통합을 통해 벤처마인드 AI는 AI, 로봇 및 웹3 분야에서 가능성을 재정의할 준비가 되어 있습니다. 이 파트너십은 AI 혁신을 위한 확장 가능한 컴퓨팅, 신뢰할 수 있는 로봇 제어, 비용 효율적인 비디오 처리 및 NFT 및 자율 도구에 대한 향상된 통합을 촉진할 것입니다. Jermaine Anugwom이 설립한 벤처마인드 AI는 전문 AI 도구의 집합에서 블록체인 기술과 토큰 경제를 통합한 강력한 플랫폼으로 빠르게 발전하여 신흥 웹3 환경에서 선두주자로 자리 잡고 있습니다.
IoT 기술로 농업 혁신하기 cover
2일 전
IoT 기술로 농업 혁신하기
농업에 IoT 기술을 통합하는 것은 이 분야를 변화시키고 있으며, 농부들이 생산성과 지속 가능성을 향상시키는 데이터 기반의 정보에 입각한 결정을 내릴 수 있도록 하고 있습니다. 전 세계 스마트 농업 시장은 2026년까지 200억 달러에 이를 것으로 예상되며, 이는 농장에서 IoT 솔루션의 채택이 증가함에 따라 추진되고 있습니다. 이러한 기술들은 작물 및 가축 관리의 다양한 측면을 최적화하여 농부들이 비용을 절감하면서 수확량과 환경 관리 능력을 향상시킬 수 있도록 돕습니다. IoT 장치가 확산됨에 따라 자원 관리의 자동화 및 날씨와 토양 조건과 같은 중요한 요소에 대한 실시간 데이터 수집을 포함한 상당한 이점을 제공합니다. 날씨 관측소와 토양 센서와 같은 IoT 장치는 스마트 농업에서 중요한 역할을 합니다. 날씨 관측소는 온도, 습도 및 강수량에 대한 필수 데이터를 제공하여 농부들이 관개 및 파종 일정에 적시에 조정할 수 있도록 합니다. 토양 센서는 수분 수준에 대한 실시간 통찰력을 제공하여 물 사용 및 비료 전략을 최적화합니다. 또한, 가축 모니터링 칼라는 동물 건강 및 위치의 사전 관리를 보장합니다. 실시간 데이터를 기반으로 관개 및 자원 분배를 자동화함으로써 농부들은 자원을 절약하고 작물 건강을 향상시켜 궁극적으로 수익성을 증가시킬 수 있습니다. Chirp의 플랫폼은 이러한 IoT 장치의 효과를 향상시키기 위해 이를 단일 대시보드에서 관리되는 통합 시스템으로 통합합니다. 블록체인 기술의 도입은 데이터 관리의 강화를 더욱 촉진하여 IoT 장치에서 생성되는 방대한 양의 정보를 안전하고 변조가 불가능한 방식으로 저장하고 추적할 수 있도록 합니다. Chirp의 블랙버드 마이너는 이러한 장치에 장거리 연결성을 제공하여 개별 인터넷 연결 없이도 넓은 지역에서 신뢰할 수 있는 데이터 전송을 용이하게 합니다. IoT 기술의 이러한 원활한 통합은 Chirp를 농부들에게 중요한 파트너로 자리매김하게 하여 그들이 도전 과제에 대응하고 변화하는 농업 환경에서 새로운 기회를 활용할 수 있도록 합니다.
Theta, 서울대학교와 AI 연구 강화 파트너십 체결 cover
2일 전
Theta, 서울대학교와 AI 연구 강화 파트너십 체결
Theta는 한국의 주요 학술 기관인 서울대학교(SNU)와 AI 연구를 강화하기 위한 중요한 파트너십을 발표했습니다. 이 협력은 Ambient AI 및 IoT 시스템에 대한 전문 지식으로 유명한 김형신 부교수가 이끄는 SNU의 AIoT 연구실에 특히 혜택을 줄 것입니다. 이 파트너십은 Theta의 고급 하이브리드 클라우드 GPU 자원을 활용하여 AI 기반 헬스케어 혁신 및 실시간 데이터 처리와 같은 분야에서 연구를 가속화하는 것을 목표로 합니다. 1946년에 설립된 SNU는 다양한 분야에서 우수성을 인정받고 있으며 아시아의 상위 대학 중 하나로 지속적으로 평가받고 있습니다. 6월에 EdgeCloud가 출시된 이후, Theta는 미국과 한국의 학술계에서 주목받으며 오리건 대학교 및 KAIST와 같은 여러 저명한 기관과 파트너십을 체결했습니다. SNU의 AIoT 연구실은 이미 여러 상과 고-impact 연구 기금을 수상하는 등 이 분야에 주목할 만한 기여를 해왔습니다. 최근 성과로는 주요 회의 및 대회에서의 수상이 포함되어 있으며, 이는 연구실의 AI 및 IoT 기술 발전에 대한 헌신을 보여줍니다. Theta의 인프라 통합은 데이터 프라이버시와 실시간 건강 통찰력을 우선시하는 적응형 모델 개발에 있어 연구실의 역량을 더욱 강화할 것으로 기대됩니다. 김 교수는 협력에 대한 열정을 표현하며, Theta의 분산형 AI 인프라가 GPU 환경을 재정의하고 Ambient AI 및 IoT 응용 프로그램에서 혁신적인 발전을 가능하게 할 것이라고 강조했습니다. 이 파트너십은 세계적 수준의 AI 연구를 지원하려는 Theta의 헌신을 강화할 뿐만 아니라, 아시아와 북미의 더 많은 최상위 기관을 유치하려는 회사의 목표를 달성하는 데 중요한 역할을 합니다. Theta가 영향력을 계속 확장함에 따라, SNU와의 협력은 AI 및 IoT 분야에서 혁신적인 실제 응용 프로그램을 촉진하는 중요한 단계로 자리 잡고 있습니다.
DIMO, AI 및 AV 개발을 강화하기 위해 MATT3R와 파트너십 체결 cover
3일 전
DIMO, AI 및 AV 개발을 강화하기 위해 MATT3R와 파트너십 체결
DIMO 재단은 현대 차량 생태계의 상호 운용성과 분산화를 강화하기 위한 중요한 파트너십을 MATT3R와 체결했다고 발표했습니다. 이 협력은 데이터 수집, 검증 및 접근성을 개선하여 인공지능(AI) 및 자율주행차(AV) 모델 개발을 가속화할 예정입니다. MATT3R는 Digital Infrastructure Inc. 이후 DIMO 생태계에 완전히 통합되는 첫 번째 회사로, DIMO SDK를 활용하고 독특한 비디오 데이터 세트를 수집하기 위한 새로운 하드웨어 장치를 도입할 것입니다. 이 이니셔티브는 다양한 데이터 유형을 용이하게 하고 개발자들을 위한 보다 상호 연결된 환경을 조성하기 위해 설계된 DIMO 프로토콜을 확장하는 중요한 단계입니다. 컴퓨터 비전 분야에서 시각 데이터를 해석하는 능력은 자율주행차의 발전에 필수적입니다. 그러나 AI 모델 훈련에 필요한 방대한 고품질 데이터 세트를 수집하는 것이 주요 도전 과제입니다. MATT3R는 K3Y 장치를 통해 사용자가 차량에서 데이터를 수집하고 공유할 수 있도록 함으로써 이 문제를 해결합니다. 이 장치는 시각 및 센서 데이터를 집계할 수 있게 해주며, 이는 개발자가 사용할 수 있도록 분류되고 레이블이 붙여집니다. 크라우드소싱 접근 방식을 활용함으로써 MATT3R는 개발자에게 다양한 실제 시나리오에 대한 접근을 제공하여 AI 및 AV 모델의 강건성을 개선하고 사용자 개인 데이터에 대한 프라이버시와 통제를 보장합니다. 파트너십에는 MATT3R의 Consol3 모바일 애플리케이션에 DIMO SDK를 통합하는 것도 포함되어 있어 기존 DIMO 사용자와 신규 사용자 모두에게 원활한 접근을 제공합니다. 이 통합은 사용자 경험을 향상시킬 뿐만 아니라 개발자와 사용자 간의 상호 이익이 되는 관계를 촉진합니다. MATT3R가 11월에 K3Y 장치의 사전 판매를 시작할 준비를 하면서, 이 협력은 AI 및 AV 모델 훈련의 효율성과 품질을 전 세계적으로 향상시키는 신뢰할 수 있는 데이터 생태계를 창출할 것을 약속합니다. DIMO 프로토콜의 검증 프레임워크는 수집된 데이터의 무결성을 보장하여 자동차 기술의 분산된 미래를 위한 길을 열 것입니다.
디지털 통화 그룹, 비텐서의 분산형 AI 네트워크에서 혁신을 위한 유마 출시 cover
3일 전
디지털 통화 그룹, 비텐서의 분산형 AI 네트워크에서 혁신을 위한 유마 출시
디지털 통화 그룹(DCG)은 배리 실버트의 지도 아래 비텐서 분산형 AI 네트워크 내에서 혁신을 촉진하기 위한 새로운 자회사 유마를 공식 출시했습니다. 유마의 사명은 스타트업과 기업에 분산형 프레임워크에서 인공지능을 개발, 훈련 및 활용하는 데 필요한 자원을 제공하는 것입니다. 비텐서 생태계의 중심에는 $TAO 토큰이 있으며, 이는 기여자에게 컴퓨팅 파워와 작업의 질에 대한 보상을 통해 참여를 유도합니다. 이 모델은 효율성을 장려할 뿐만 아니라 사용자 간의 협업을 촉진하여 주요 기술 회사가 지배하는 전통적인 중앙 집중형 AI 시스템에 대한 매력적인 대안을 제공합니다. 유마는 비텐서 네트워크를 통해 보상을 받을 수 있는 다양한 AI 기반 프로젝트를 지원하도록 설계되었습니다. 이 회사는 스타트업 및 기존 기업을 위한 액셀러레이터 프로그램과 새로운 프로젝트의 기초부터 시작할 수 있도록 돕는 서브넷 인큐베이터라는 두 가지 독특한 파트너십 모델을 제공합니다. 유마는 초기 서브넷 인큐베이터 프로그램을 통해 Sturdy, Masa, Score, Infinite Games 등 여러 회사와 파트너십을 형성했습니다. 또한 Foundry와 협력하여 S&P 500 오라클 서브넷을 출시하여 분산형 AI 주위에 강력한 생태계를 구축하겠다는 의지를 보여주었습니다. 비텐서 공동 창립자 제이콥 스티브스가 언급했듯이, 이 플랫폼은 고급 AI 기능에 대한 접근을 제한하는 전통적인 상향식 접근 방식에 대한 경쟁적인 대안을 제공하기 위해 만들어졌습니다. DCG의 비텐서와의 관계는 2021년으로 거슬러 올라가며, 그 자산 관리 부문인 그레이스케일은 이후 비텐서 신탁과 분산형 AI 펀드를 도입했으며, 비텐서는 후자의 21%를 차지하고 있습니다. 이 전략적 투자는 인공지능과 디지털 소유권의 미래에서 분산형 네트워크의 중요성이 커지고 있음을 강조합니다.
DCG, Bittensor와 함께 분산형 AI를 가속화하기 위해 Yuma를 출시하다 cover
3일 전
DCG, Bittensor와 함께 분산형 AI를 가속화하기 위해 Yuma를 출시하다
디지털 통화 그룹(DCG)의 CEO인 배리 실버트는 Bittensor가 비트코인만큼 혁신적일 수 있다고 믿고 있습니다. 이러한 비전을 지원하기 위해 DCG는 Bittensor 생태계를 탐색하는 데 관심이 있는 스타트업을 위한 가속기 역할을 할 새로운 회사 Yuma를 출범했습니다. Bittensor 자체는 다양한 AI 작업을 위한 데이터 및 컴퓨팅 파워의 기여를 장려하는 분산형 네트워크로, 텍스트 번역에서 복잡한 단백질 구조 예측에 이르기까지 다양한 작업을 포함합니다. 실버트는 Bittensor를 AI의 월드 와이드 웹에 비유하며, AI 기술을 민주화하고 주요 기술 기업의 지배력을 줄일 수 있는 잠재력을 강조했습니다. Yuma는 분산형 AI를 활용하는 비즈니스를 인큐베이팅하고 구축하는 것을 목표로 하며, Bittensor 프레임워크 내에서 자신의 서브넷을 시작하는 스타트업과 기업을 지원할 계획입니다. 실버트는 Yuma의 CEO 역할을 맡게 되며, 이 회사는 약 25명의 직원으로 시작할 것으로 예상됩니다. Yuma는 Y Combinator와 유사한 모델로 운영되며, 가속기 및 인큐베이터 파트너십을 위한 자원과 지원을 제공합니다. 현재 Yuma는 다섯 개의 활성 서브넷을 운영하고 있으며, 봇 탐지, 시계열 예측 및 AI 연구를 포함한 다양한 응용 프로그램을 보여주는 추가 프로젝트가 개발 중입니다. 분산형 AI에 대한 관심은 DCG에 최근의 발전이 아니며, 그들은 2021년에 Bittensor에 대한 첫 번째 투자를 했습니다. Grayscale을 통해 AI에 전념하는 자금을 추가함으로써 DCG는 이 새로운 기술의 최전선에 자리 잡고 있습니다. Bittensor의 네이티브 암호화폐인 $TAO는 컴퓨팅 서비스를 제공하는 채굴자이든 품질 기여를 보장하는 검증자이든 분산형 작업자에게 인센티브를 제공하는 데 중요한 역할을 합니다. Yuma가 계속 성장함에 따라, Bittensor 생태계 내에서 혁신과 협업을 촉진하여 분산형 AI 응용 프로그램의 새로운 시대를 열어갈 것입니다.