검색 보강 생성에서 맥락 회상 향상

금요일, 11월 22, 2024 12:00 오전
2,690

검색 보강 생성(RAG)은 대규모 언어 모델(LLM)을 전문 비즈니스 애플리케이션에 통합하는 중요한 방법으로 부상하였으며, 모델 응답에 독점 데이터를 주입할 수 있게 해줍니다. 개념 증명(POC) 단계에서의 효과에도 불구하고, 개발자들은 RAG를 프로덕션으로 전환할 때 종종 상당한 정확도 저하에 직면합니다. 이 문제는 주어진 쿼리에 대해 가장 관련성 높은 맥락을 정확하게 가져오는 것을 목표로 하는 검색 단계에서 특히 두드러지며, 이를 맥락 회상(context recall)이라고 합니다. 이 기사는 임베딩 모델을 사용자 정의하고 미세 조정하여 맥락 회상을 향상시키는 전략을 탐구하며, 궁극적으로 RAG의 실제 애플리케이션에서의 성능을 개선합니다.

RAG는 검색과 생성의 두 가지 주요 단계에서 작동합니다. 검색 단계에서 모델은 텍스트를 벡터로 변환하고, 인덱싱하며, 이러한 벡터를 검색하고 재순위하여 상위 일치를 식별합니다. 그러나 이 단계에서의 실패는 관련 맥락을 놓치게 되어 맥락 회상이 낮아지고 생성 출력이 덜 정확해질 수 있습니다. 효과적인 해결책 중 하나는 텍스트 데이터 간의 관계를 이해하도록 설계된 임베딩 모델을 조정하여 사용 중인 데이터 세트에 특정한 임베딩을 생성하는 것입니다. 이 미세 조정은 모델이 유사한 문장에 대해 유사한 벡터를 생성할 수 있게 하여, 쿼리에 대해 매우 관련성 높은 맥락을 검색하는 능력을 향상시킵니다.

맥락 회상을 개선하기 위해서는 모델이 마주칠 쿼리 유형을 반영하는 맞춤형 데이터 세트를 준비하는 것이 필수적입니다. 이는 지식 기반에서 다양한 질문을 추출하고, 변동성을 위해 이를 패러프레이징하며, 관련성에 따라 정리하는 것을 포함합니다. 또한, 평가 데이터 세트를 구성하여 모델의 성능을 현실적인 환경에서 평가하는 데 도움이 됩니다. 정보 검색 평가기를 사용하여 개발자는 Recall@k 및 Precision@k와 같은 메트릭을 측정하여 검색 정확도를 평가할 수 있습니다. 궁극적으로 임베딩 모델을 미세 조정하면 맥락 회상에서 상당한 개선을 가져올 수 있으며, RAG가 프로덕션 환경에서 정확하고 신뢰할 수 있도록 보장합니다.

Related News

CUDOS 인터클라우드: AI를 위한 지속 가능한 컴퓨팅의 선구자 cover
2일 전
CUDOS 인터클라우드: AI를 위한 지속 가능한 컴퓨팅의 선구자
CUDOS 인터클라우드는 인공지능 초지능 동맹의 일환으로 지속 가능한 컴퓨팅의 새로운 시대를 선도하고 있습니다. 이 회사는 친환경 컴퓨팅 관행에 중점을 두어 AI 인프라의 지형을 재정의하는 것을 목표로 하고 있습니다. 2025년 4월 24일, CUDOS는 Peace One Day #Ai2Peace 행사에 참여하여 CEO 매트 호킨스와 영업 부사장 피트 힐이 평화롭고 지속 가능한 미래를 조성하는 데 있어 분산 AI 인프라의 중요성에 대해 논의할 것입니다. 이 이니셔티브는 환경 책임을 우선시하는 공정하고 개방적인 AI 생태계를 구축할 필요성을 강조합니다. 전통적인 클라우드 컴퓨팅은 상당한 환경 영향을 미치며, 단일 1MW 데이터 센터는 매년 수백만 킬로와트시의 전기와 방대한 양의 물을 소비합니다. 이러한 중앙 집중식 인프라의 탄소 발자국은 막대하며, 구글의 데이터 운영이 2024년 단독으로 27 테라와트시의 에너지를 소비한 사실이 이를 입증합니다. CUDOS 인터클라우드는 기존 데이터 센터를 활용하고 추가 자원 없이 용량을 최적화하여 이러한 비효율성을 해결합니다. 이 접근 방식은 비용을 절감할 뿐만 아니라 새로운 인프라 개발과 관련된 탄소 발자국을 최소화합니다. CUDOS 인터클라우드는 100% 재생 가능 에너지로 운영되며, GPU 중심 클러스터가 지속 가능한 관행을 활용하도록 보장하여 지속 가능성에 전념하고 있습니다. 이 회사는 기존 데이터 센터의 효율성을 극대화하고 낭비된 에너지를 생산적으로 활용함으로써 상당한 비용을 절감했습니다. Stripe Climate 프로그램과 같은 이니셔티브에 참여하고 탄소 제거 프로젝트에 자원을 할당함으로써 CUDOS는 지속 가능성에 대한 주장을 하는 것에 그치지 않고 실제로 더 푸른 미래를 위해 노력하고 있습니다. 이러한 헌신은 CUDOS를 전통적인 빅테크에 대한 실행 가능한 대안으로 자리매김하게 하여 분산되고 환경 친화적인 클라우드 컴퓨팅 접근 방식을 촉진합니다.
Theta Labs와 휴스턴 로켓츠, AI 기반 마스코트 '클러치봇' 출시 cover
2일 전
Theta Labs와 휴스턴 로켓츠, AI 기반 마스코트 '클러치봇' 출시
Theta Labs는 분산 클라우드 인프라의 주요 제공업체로, 휴스턴 로켓츠와 협력하여 '클러치봇'이라는 혁신적인 AI 기반 마스코트를 소개합니다. 이 디지털 마스코트는 게임 일정, 티켓 세부사항, 선수 통계 및 경기장 정보 등 팀에 대한 실시간 정보를 제공하여 팬 참여를 향상시키도록 설계되었습니다. 팬들은 공식 휴스턴 로켓츠 웹사이트를 통해 클러치봇과 상호작용하며 '다음 게임은 언제인가요?' 또는 '로켓츠가 몇 번의 챔피언십을 우승했나요?'와 같은 질문을 할 수 있습니다. AI는 방대한 로켓츠 및 NBA 데이터를 기반으로 훈련되어 정확하고 시의적절한 응답을 보장합니다. Theta Labs와 휴스턴 로켓츠 간의 협력은 전통적인 참여 방법을 초월하는 보다 몰입감 있는 팬 경험을 창출하는 것을 목표로 하고 있습니다. Theta의 최첨단 EdgeCloud 기술을 활용하여 클러치봇은 스포츠 팀이 팬들과 지속적이고 개인화된 상호작용을 유지할 수 있는 방법에서 중요한 발전을 나타냅니다. 이 이니셔티브는 팬들에게 디지털 경험을 향상시킬 뿐만 아니라, 프로 스포츠 전반에 걸쳐 팬 참여의 새로운 기준을 설정하여 지지자들이 좋아하는 팀과 더 연결될 수 있도록 합니다. 2025년 가을 출시 예정인 클러치봇은 전 세계 팬들이 접근할 수 있게 되어 스포츠와 AI 기술의 교차점에서 중요한 순간을 의미합니다. 휴스턴 로켓츠의 회장 그레첸 셰어에 따르면, 이 파트너십은 팀이 디지털 플랫폼을 통해 보다 매력적이고 개인화된 경험을 제공할 수 있도록 할 것입니다. 산업 거대 기업들의 지원과 강력한 분산 인프라를 바탕으로, Theta Labs는 AI 및 미디어 분야에서 선도적인 역할을 계속하며 스포츠 기술의 미래 혁신을 위한 길을 열어가고 있습니다.
AI: 스포츠 팬덤의 다음 경계 cover
4일 전
AI: 스포츠 팬덤의 다음 경계
인공지능(AI)은 다양한 산업에 중요한 진전을 이루고 있지만, Theta Labs의 CEO인 Mitch Liu에 따르면 스포츠 팬덤 분야는 특히 유망한 경계를 나타냅니다. AI가 주로 작업을 자동화하는 다른 분야와 달리, 스포츠는 AI가 팬 경험을 향상시킬 수 있는 독특한 기회를 제공합니다. 통계, 일정 및 성과 지표와 같은 구조화된 데이터를 통해 AI는 팬들과 공감할 수 있는 방식으로 정보를 분석하고 제시할 수 있습니다. 스포츠 시즌의 순환적 특성은 지속적인 데이터 수집과 기능 테스트를 가능하게 하여 AI 통합에 이상적인 환경을 제공합니다. 최근 연구에 따르면 AI는 개선된 분석 및 개인화된 팬 상호작용을 통해 이미 스포츠 환경을 변화시키고 있습니다. 예를 들어, NFL의 디지털 운동선수 프로그램은 기계 학습을 활용하여 선수 데이터를 평가하고 부상 위험을 예측하는데, 이는 운동선수를 보호할 뿐만 아니라 팬들이 게임을 이해하는 데 도움을 줍니다. 또한, NHL 팀인 Vegas Golden Knights와 New Jersey Devils는 Theta Labs와 협력하여 게임, 티켓 및 팀 뉴스에 대한 문의를 도와주는 AI 기반 챗봇을 만들었습니다. 이러한 혁신은 상호작용 플랫폼을 통해 적시의 정확한 정보를 제공함으로써 팬 경험을 향상시키고 있습니다. 스포츠에서 AI의 잠재력은 전통적인 리그를 넘어 e스포츠로 확장되며, 디지털 환경은 참여를 위한 더 큰 기회를 제공합니다. AI는 실시간 게임 데이터를 기반으로 맞춤형 통찰력을 제공하여 일반 팬과 열성 팬 모두에게 하이퍼 개인화된 경험을 촉진할 수 있습니다. 그러나 스포츠 조직은 이러한 기술을 신중하게 구현해야 하며, 팬덤의 핵심 감정 요소를 대체하기보다는 보완하도록 해야 합니다. AI가 계속 발전함에 따라 스포츠 산업은 팬들이 좋아하는 팀과 상호작용하는 방식을 재정의하고 스포츠 소비의 전반적인 경험을 향상시킬 수 있는 변혁의 시대에 서 있습니다.
스탠포드 AI 연구소, 향상된 연구를 위해 Theta EdgeCloud와 파트너십 체결 cover
8일 전
스탠포드 AI 연구소, 향상된 연구를 위해 Theta EdgeCloud와 파트너십 체결
스탠포드 공학부의 조교수 엘렌 비터칙의 AI 연구소는 이산 최적화 및 알고리즘적 추론에 대한 연구를 강화하기 위해 Theta EdgeCloud의 하이브리드 클라우드 인프라를 활용할 예정입니다. 이 협력은 연구소가 경쟁력 있는 비용으로 확장 가능하고 고성능의 컴퓨팅 파워를 제공하는 EdgeCloud의 분산 GPU를 활용할 수 있게 합니다. 이 기술의 통합은 AI 모델의 훈련을 크게 가속화하고 고급 연구 이니셔티브를 촉진할 것으로 예상됩니다. 서울대학교, KAIST, 오리건 대학교와 같은 다른 저명한 학술 기관들도 AI 연구 생산성을 높이기 위해 EdgeCloud의 인프라를 활용하고 있습니다. 엘렌 비터칙은 머신러닝, 알고리즘적 추론, 그리고 계산과 경제학의 교차점에 전문성을 가지고 있습니다. 그녀의 연구소는 최적화를 위한 대형 언어 모델(LLM)의 적용, 알고리즘적 콘텐츠 선택, 다양한 데이터셋 크기에서 클러스터링 알고리즘의 일반화 등 여러 핵심 분야에 집중하고 있습니다. Theta EdgeCloud의 자원을 활용함으로써 연구소는 AI가 가격 전략 및 타겟 마케팅과 같은 경제적 맥락에서 의사 결정 과정을 어떻게 향상시킬 수 있는지를 탐구하는 것을 목표로 하고 있습니다. Theta EdgeCloud의 하이브리드 GPU 인프라는 확장 가능하고 비용 효율적인 온디맨드 컴퓨팅 파워를 제공하도록 설계되어 있어 학술 연구에 이상적인 솔루션입니다. 비터칙 연구소와의 협력은 AI 분야에서 학술 연구에 고급 클라우드 컴퓨팅 기술을 통합하는 성장하는 추세를 보여줍니다. 이 파트너십은 비터칙의 연구 목표를 발전시킬 뿐만 아니라 전 세계 여러 기관의 AI 연구의 광범위한 환경에도 기여합니다.
팔라 네트워크와 스트리머, 분산형 AI 혁신을 위한 협력 cover
15일 전
팔라 네트워크와 스트리머, 분산형 AI 혁신을 위한 협력
팔라 네트워크와 스트리머가 분산형 AI의 지형을 혁신하기 위한 흥미로운 새로운 파트너십을 발표했습니다. 이 협력은 팔라의 신뢰할 수 있는 컴퓨팅 인프라와 스트리머의 분산형 실시간 데이터 스트리밍 기능을 결합합니다. 목표는 중앙 집중식 중개자에 의존하지 않고 실시간 데이터를 안전하고 비공개로 처리할 수 있는 새로운 유형의 AI 에이전트를 만드는 것입니다. 이러한 기술을 결합함으로써 실시간 분산형 AI의 비전이 현실이 되고 있으며, 다양한 분야에서 혁신적인 애플리케이션을 위한 길을 열고 있습니다. 스트리머는 실시간 데이터 스트리밍을 위해 특별히 설계된 분산형 네트워크에서 운영되며, 피어 투 피어 아키텍처와 게시/구독 모델을 활용합니다. 이 구조는 데이터 생산자가 애플리케이션과 노드가 즉시 소비할 수 있는 스트림을 방송할 수 있게 하여 지연 시간을 크게 줄이고 회복력을 향상시킵니다. 스트리머 내의 블록체인 기술 통합은 본래의 DATA 토큰을 통해 수익화 및 접근 제어를 지원하여 Web3 애플리케이션을 위한 강력한 오픈 데이터 경제를 촉진합니다. 이 파트너십은 전통적인 클라우드 서비스에 대한 의존도를 줄이며 보다 개방적이고 사용자 중심의 웹을 만들기 위한 공동의 사명을 강조합니다. 이 협력은 AI 계산을 위한 안전하고 암호화된 공간을 제공하는 팔라의 신뢰 실행 환경(TEE)과 팔라 계약을 활용합니다. 이는 기계 소유자조차 데이터나 논리에 접근할 수 없도록 하여 검증 가능한 AI 계산을 위한 강력한 기반을 만듭니다. 스트리머의 실시간 데이터 전달을 팔라의 안전한 컴퓨팅 레이어와 통합함으로써 개발자는 개인 정보를 보호하고 검열에 저항하면서 실시간 데이터를 처리하는 AI 시스템을 만들 수 있습니다. 이 파트너십은 분산형 인프라의 잠재력을 보여줄 뿐만 아니라, Web3의 핵심 가치인 개인 정보 보호, 투명성 및 분산화에 부합하는 혁신적인 AI 솔루션을 구축할 수 있는 새로운 길을 열어줍니다.
펑크코인: 솔라나 AI 분야에서의 놀라운 메모코인의 부상 cover
17일 전
펑크코인: 솔라나 AI 분야에서의 놀라운 메모코인의 부상
끊임없이 진화하는 암호화폐 환경에서, 펑크코인만큼 많은 주목을 받은 토큰은 드물다. 솔라나 기반의 AI 메모코인인 펑크코인은 초기 단계에도 불구하고 소셜 미디어 플랫폼, 특히 트위터에서 눈에 띄는 존재감을 확립했다. 이 벨라루스 출신의 메모코인은 빠르게 솔라나 생태계 내에서 선두주자로 자리 잡았으며, 많은 기존 경쟁자들을 제치고 앞서 나가고 있다. 현재 시장 가치가 4억 5천 5백 20만 달러에 달하는 펑크코인은 솔라나의 AI 토큰 총 시장 가치인 약 11억 1천 480만 달러 중 32.1%를 차지하고 있다. 펑크코인의 부상은 많은 AI 토큰과 관련된 전형적인 유틸리티나 기술적 주장 없이 이루어졌다는 점에서 특히 주목할 만하다. 대신, 현재 인공지능에 대한 열정을 활용하여 시장에서 상당한 틈새를 차지하고 있다. 펑크코인의 성과는 #ai16z와 같은 기존 토큰의 성과를 초월했으며, 펑크코인의 시장 가치는 가장 가까운 경쟁자를 거의 250% 초과하고 있다. 이러한 예기치 않은 성공은 솔라나 블록체인에서 AI 토큰의 미래에 대한 질문을 제기하며, 더 전통적인 기술 중심 솔루션보다 가벼운 메모 기반 프로젝트에 대한 투자자의 관심이 이동할 가능성을 시사한다. 기관 투자자들, 흔히 "스마트 머니"라고 불리는 이들은 펑크코인의 성공을 이끄는 주요 요인 중 하나이다. 이들은 펑크코인이 시장에서 독특한 위치를 차지하고 있으며, 그 메모 문화와 커뮤니티 참여가 강력한 자산으로 입증되었다는 점에 매력을 느끼고 있다. 펑크코인이 지속적으로 상당한 투자와 주목을 끌면서 그 미래는 불확실하지만, 현재의 궤적은 펑크코인이 솔라나의 AI 분야에서 강력한 플레이어로 자리 잡았음을 나타낸다. 궁극적으로, 펑크코인은 심각한 프로젝트에 전통적으로 할당된 시장 세그먼트를 지배할 수 있는 메모코인의 예측 불가능한 본질을 보여준다.
최신 DePIN 뉴스와 업데이트를 위해 가입하세요