Q-LoRA를 이용한 추출적 질문 응답을 위한 Llama 3.2 11B 미세 조정

화요일, 11월 26, 2024 12:00 오전

251

대형 언어 모델(LLM)은 자연어 처리에서 필수 도구가 되었으며, 다양한 작업을 처리할 수 있습니다. 그러나 광범위한 훈련으로 인해 특정 응용 프로그램에서 추가적인 적응 없이는 뛰어난 성능을 발휘하지 못할 수 있습니다. Q-LoRA와 같은 미세 조정 기술은 연구자들이 Llama 3.2 11B와 같은 사전 훈련된 모델을 추출적 질문 응답과 같은 특정 작업에 맞게 조정할 수 있도록 합니다. 이 기사는 SQuAD v2 데이터셋에서 Q-LoRA를 사용하여 Llama 3.2 11B를 미세 조정하는 과정을 설명하며, 이 방법을 통해 달성된 성능 향상을 보여줍니다.

LoRA 또는 저순위 적응은 기존 모델에 새로운 가중치를 도입하여 원래 매개변수를 변경하지 않는 기술입니다. 특정 레이어의 출력을 조정하는 어댑터 가중치를 추가함으로써, LoRA는 모델이 사전 훈련된 지식을 유지하면서 특정 작업에 맞게 새로운 기능을 습득할 수 있도록 합니다. 이 실험에서는 Llama 3.2 11B를 추출적 질문 응답을 위해 미세 조정하는 데 중점을 두고, 사용자 쿼리에 직접적으로 답변하는 정확한 텍스트 세그먼트를 추출하는 것을 목표로 합니다. 이 실험은 A100 GPU를 활용한 Google Colab 플랫폼에서 수행되었으며, Hugging Face Transformers 라이브러리가 구현을 지원했습니다.

미세 조정 과정의 결과는 유망했으며, 검증 세트에서 모델 성능이 크게 향상되었습니다. BERT 점수는 0.6469에서 0.7505로 개선되었고, 정확한 일치 점수는 0.116에서 0.418로 상승했습니다. 이러한 향상은 Q-LoRA 기술이 Llama 3.2 11B 모델을 추출적 질문 응답 작업에 효과적으로 적응시킨다는 것을 나타냅니다. 이 기사는 유사한 방법을 다른 모델과 작업에 적용하고자 하는 연구자들을 위한 가이드 역할을 하며, 자연어 처리 분야에서 미세 조정의 잠재력을 강조합니다.

Source: spheron.network

Related News

3일 전

io.net, 시장 도전 속에서 수익 성장 보고

최신 분기 보고서에서 io.net은 수익에서 상당한 성장을 보여주었으며, 인상적인 82.6% 증가를 달성하여 총 수익이 570만 달러에 이르렀습니다. 이러한 수익 급증은 암호화폐 시장의 전반적인 축소를 고려할 때 특히 주목할 만합니다. IO 토큰의 시장 가치가 71.4% 감소하여 1억 800만 달러로 떨어졌고, 토큰 가격도 74.9% 하락했습니다. 이러한 도전에도 불구하고 io.net은 Zerebro, KREA, Injective와 같은 다양한 AI 및 컴퓨팅 중심 플랫폼과 성공적으로 통합하여 AI 및 DeFi 애플리케이션을 위한 분산 GPU 컴퓨팅 기능을 향상시키는 것을 목표로 하고 있습니다. io.net의 인프라는 분산된 GPU 및 CPU 네트워크에 구축되어 있어 기계 학습 및 AI 애플리케이션을 위한 컴퓨팅 자원에 대한 확장 가능한 접근을 가능하게 합니다. 이 플랫폼은 다양한 기계 학습 프레임워크를 지원하여 자원 할당의 유연성과 효율성을 보장합니다. 그러나 평균 일일 검증된 컴퓨팅 자원은 감소세를 보였으며, 검증된 GPU와 CPU는 각각 11.1% 및 4.5% 감소했습니다. 이러한 감소는 지속적인 공급 측 문제와 토큰 인센티브 감소를 반영하며, 이는 네트워크 내 전체 활동에 영향을 미쳤습니다. 혼합된 성과 지표에도 불구하고 io.net은 생태계를 확장하기 위한 수많은 협업을 통해 안정적인 개발 속도를 유지하고 있습니다. 2025년 1분기에 체결된 Alpha Network 및 Mira Network와의 파트너십은 분산 AI 인프라를 향상시키려는 io.net의 의지를 강조합니다. 프로젝트가 경제 모델을 다듬고 네트워크 기능을 확장함에 따라, 도전적인 시장 환경 속에서도 분산 컴퓨팅 자원의 진화하는 환경에서 핵심 플레이어로 남아 있습니다.

AI 자금 조달

3일 전

벤 거르첼: 더 나은 미래를 위한 분산형 AI의 선구자

인공지능의 선구자인 벤 거르첼은 30년 전 첫 번째 코드를 작성한 이후로 분산형 AI를 옹호해 왔습니다. 인류가 인공지능 일반(AGI)을 달성하기 직전에 서 있는 지금, 거르첼은 이 강력한 기술이 중앙집권적 권력을 섬기는 것이 아니라 인류에게 혜택을 주도록 보장하는 데 있어 분산화의 중요성을 강조합니다. 최근 토론토에서 열린 컨센서스 회의에서 그는 그의 프로젝트인 싱귤래리티넷을 통해 AGI가 향후 1~3년 내에 출시될 수 있다는 낙관적인 전망을 밝혔습니다. 이 프로젝트는 AI 서비스의 글로벌 시장을 창출하는 것을 목표로 하고 있으며, 마인드 네트워크 및 파일코인 재단과의 파트너십, 모듈형 슈퍼컴퓨터에 대한 5,300만 달러 투자, 오션 프로토콜 및 펫치.ai와의 토큰 합병 등 중요한 진전을 이루었습니다. 거르첼의 분산형 AI에 대한 비전은 그가 처음 인터넷을 경험했을 때의 경험에 뿌리를 두고 있습니다. 그는 처음에 인터넷을 분산형 플랫폼으로 보았지만, 구글과 페이스북과 같은 기술 대기업의 출현으로 인해 더 중앙집권적인 인터넷으로 변모하게 되었다고 지적합니다. 그는 AGI가 선의의 힘이 되기 위해서는 처음부터 분산형 아키텍처 위에 구축되어야 한다고 주장합니다. 이러한 철학은 싱귤래리티넷, 하이퍼온, 그리고 분산형 AI 애플리케이션을 위해 설계된 다가오는 ASI 체인에 반영되어 있습니다. 거르첼은 AGI 이후 시대의 경로가 분산형 생태계의 역할에 따라 크게 달라질 것이라고 믿고 있습니다. AI 분야에서의 작업 외에도 거르첼은 90년대부터 분산형 화폐 개념을 탐구해 온 역사를 가지고 있습니다. 비록 그와 그의 동료들은 속도와 비용에 대한 우려로 인해 분산형 거래의 실용성을 처음에는 무시했지만, 비트코인의 출현은 그의 초기 아이디어 중 일부를 검증해 주었습니다. 그는 그 시대의 놓친 기회에 대해 유머러스하게 회상하며, 그들이 비즈니스 감각이 부족했기 때문에 분산형 화폐의 어두운 응용 프로그램을 상상하지 못했다고 인정합니다. 오늘날, 거르첼의 분산형 AI에 대한 헌신은 계속해서 주목받고 있으며, 그와 그의 이니셔티브는 기술 및 거버넌스의 진화하는 환경에서 주요 플레이어로 자리 잡고 있습니다.

AI 자금 조달

7일 전

투자자들이 시장 청산 속에서 GRASS 및 PI 암호화 토큰에 주목하다

현재 투자자들은 독특한 가치 제안으로 주목받고 있는 GRASS 및 PI 암호화 토큰에 집중하고 있습니다. Best Wallet의 진행 중인 사전 판매는 1,200만 달러 이상을 모금하며 주목을 받고 있습니다. 지난 24시간 동안 Binance, Bybit 및 OKX와 같은 영구 암호화 거래소는 6억 6,500만 달러 이상의 레버리지 포지션을 청산하였으며, 153,000명 이상의 트레이더에게 영향을 미쳤습니다. 이러한 혼란 속에서도 많은 트레이더들은 GRASS와 PI에 대해 낙관적인 시각을 유지하고 있으며, 이들을 2025년 2분기의 잠재적인 돌파 토큰으로 보고 있습니다. 특히, PI 암호화는 4월 초 이후 80% 상승했으며, GRASS는 2024년 10월 말의 최저점 이후 140% 증가했습니다. GRASS는 Solana에 구축된 분산형 레이어-2 플랫폼으로, Polychain Capital 및 Tribe Capital과 같은 저명한 벤처 자본가들에 의해 지원받고 있습니다. 이 플랫폼은 사용자가 유휴 인터넷 대역폭을 수익화할 수 있게 해주며, 이는 AI 모델 훈련에 필수적입니다. 이 플랫폼은 2025년 1분기 동안 5,700만 GB의 공개 웹 데이터를 수집하는 데 성공했습니다. 참가자들은 GRASS 포인트를 획득하며, 이는 GRASS 토큰으로 전환할 수 있습니다. 또한, 플랫폼의 노드 운영자가 크게 증가하여 관심과 채택이 증가하고 있음을 나타냅니다. 분석가들은 GRASS를 탐색할 최고의 암호화폐 중 하나로 평가하고 있으며, AI 및 분산형 물리적 인프라 네트워크(DePIN) 분야에서의 잠재력을 강조하고 있습니다. 반면, Pi Network는 최근 중앙 노드를 비활성화하여 6천만 명 이상의 사용자 커뮤니티에 권한을 부여하며 분산화로 나아가고 있습니다. 그 정당성에 대한 회의론에도 불구하고, Pi Network의 메인넷은 2025년 2월에 출시되었으며, 그 이후 PI 암호화의 가격은 크게 변동했습니다. GRASS와 PI가 계속 발전함에 따라, 투자자들은 투자 결정을 내리기 전에 철저한 조사를 수행할 것을 권장합니다. 또한, Best Wallet의 사전 판매는 그 기능과 보안 조치로 인해 암호화 지갑 분야에서 강력한 경쟁자로 자리 잡고 있습니다.

자금 조달 AI

11일 전

암프와 에이시르, 암호화폐 시장 냉각 속에서 빛나다

냉각되고 있는 암호화폐 시장에서 암프(AMP)와 에이시르(ATH)가 두드러진 성과를 보이며 각각 16%의 가치 상승을 경험했습니다. 암프는 현재 $0.0051로 평가되며, 주요 지수 이동 평균(EMA)과 MACD 및 RSI와 같은 지표에서의 유리한 거래 신호에 의해 강력한 상승 모멘텀을 유지하고 있지만, 과매수 상태에 대한 경고가 있습니다. 한편, AI 기반 블록체인 솔루션에 초점을 맞춘 에이시르는 $0.052로 급등하며 중요한 저항 수준을 돌파하고 낙관적인 상승세를 유지하고 있지만, 과매수 RSI는 트레이더들이 경계를 유지해야 함을 시사합니다. 암호화폐 시장의 분열은 헬륨(HNT)이 하락 압력을 받으며 $4.00에 거래되고 200일 EMA 아래에서 고전하는 상황에서 분명하게 드러납니다. 이 상황은 100일 EMA 지원선인 $3.83를 하회할 경우 추가 하락의 위험을 초래합니다. 암프와 에이시르의 헬륨과의 대조적인 궤적은 디지털 자산 시장 내 지속적인 변동성과 혁신을 강조하며, 트레이더들이 야망과 위험 관리 전략 간의 균형을 맞추도록 촉구합니다. 트레이더들이 이러한 격동의 물결을 헤쳐 나가는 동안, 암프와 에이시르의 회복력은 시장 침체 속에서도 성장 가능성을 강조합니다. 투자자들은 최적의 진입점을 식별하고 효과적으로 위험을 관리하기 위해 주요 기술 지표, 특히 EMA와 RSI 수준을 면밀히 모니터링할 것을 권장합니다. 이러한 프로젝트의 지속적인 발전은 혁신이 관심과 투자 기회를 계속해서 이끄는 암호화폐 환경의 역동적인 특성을 반영합니다.

자금 조달 AI

12일 전

솔라나의 회복과 AI 기반 프로젝트 비텐서 및 유니랩스의 부상

솔라나(SOL)는 올해 최저점에서 90% 회복하며 놀라운 반등을 보여주었지만, 여전히 $180의 중요한 저항 수준 아래에 제한되어 있습니다. 분석가들은 솔라나 가격이 특히 최근 많은 SOL 밈 코인이 급등하면서 중요한 돌파를 앞두고 있을 것이라고 낙관하고 있습니다. 현재 시장 심리는 강력한 펀더멘털과 상승 추세에 의해 부양되고 있으며, SOL은 약 $170에서 머물고 있습니다. $180 저항선을 넘는 결정적인 움직임은 $200 및 그 이상으로의 잠재적인 상승을 위한 길을 열 수 있으며, $250 수준에 도달할 가능성도 있습니다. 이 가운데 비텐서(TAO)는 주목할 만한 플레이어로 부상하며, 비트코인(BTC)을 포함한 다른 암호화폐들이 어려움을 겪는 동안 안정적인 성과를 유지하고 있습니다. 비텐서에 대한 관심은 주로 분산형 AI에 대한 혁신적인 접근 방식에 의해 촉진되었으며, 이는 도널드 트럼프가 암호화폐 및 AI 혁신가 저녁에 참석한 것과 같은 고프로필 이벤트 이후 주목받고 있습니다. 현재 약 $457에 거래되고 있는 비텐서는 회복력을 보여주며, 이익을 유지하고 있으며 블록체인 기술과 AI를 통합하는 프로젝트에 대한 시장 신뢰가 증가하고 있음을 반영하고 있습니다. 한편, 유니랩스(UNIL)는 솔라나와 같은 전통적인 레이어-1 네트워크에서 다각화를 원하는 투자자들에게 매력적인 대안으로 모멘텀을 얻고 있습니다. 블록체인 투명성과 AI 인프라의 융합에 중점을 두고 있는 유니랩스는 DeFi 및 AI 분야의 선두주자로 자리매김하고 있습니다. 사용자와 개발자를 유치하기 위한 토큰 기반 인센티브 시스템을 포함한 혁신적인 모델을 가지고 있으며, 솔라나의 성장세가 둔화됨에 따라 유니랩스는 거래자들에게 독특한 기회를 제공하며 빠르게 진화하는 암호화폐 환경에서 DeFi AI 플랫폼의 기준을 재정의할 가능성이 있습니다.

AI 자금 조달

17일 전

엑상글, 기업 검증자로서 세타 네트워크에 합류하여 블록체인 인프라 강화

9일, 블록체인 인프라 기업 엑상글이 글로벌 블록체인 메인넷 세타 네트워크에 기업 검증자로서 진입한다고 발표했다. 세타 네트워크는 인공지능(AI), 미디어, 스포츠 및 엔터테인먼트와 같은 분야에 맞춘 분산형 클라우드 인프라를 제공하는 것으로 유명하다. 전 세계에 30,000개 이상의 분산 엣지 노드로 지원되는 강력한 프레임워크를 자랑하며, 효율적인 운영과 거버넌스를 보장한다. 이 네트워크는 삼성 넥스트, 소니 혁신 펀드, 베르텔스만 디지털 미디어 투자 및 크리에이티브 아티스트 에이전시(CAA)와 같은 저명한 기관으로부터 전략적 투자를 받았으며, 구글, 삼성 및 바이낸스와 같은 글로벌 대기업도 기업 검증자로 참여하고 있다. 세타 생태계에 대한 헌신의 일환으로, 엑상글은 총 200,000개의 세타(THETA) 토큰을 스테이킹하여 검증자 노드로서 네트워크 보안과 거버넌스를 크게 강화할 예정이다. 이 회사는 세타가 촉진하는 분산형 물리적 인프라 네트워크(DePIN)와 AI 생태계의 확장에 적극적으로 기여할 계획이다. 2018년에 설립된 엑상글은 한국에서 웹3 인프라 서비스 제공업체이자 연구 플랫폼으로 자리 잡았으며, 커뮤니티 허브, 블록체인 탐색기 및 포괄적인 웹3 산업 분석 보고서를 제공하고 있다. 또한, 엑상글은 Aptos, Babylon, 0G 및 Initia와 같은 다양한 글로벌 프로젝트의 검증자로도 활동해왔다. 엑상글의 공동 CEO인 이현우는 파트너십에 대한 기대감을 표명하며, "구글, 삼성 및 CAA와 함께 기업 검증자로 등록된 것을 매우 기쁘게 생각합니다"라고 말했다. 그는 세타의 검증자 네트워크에 스테이킹하는 것이 엑상글의 신뢰, 분산화 및 투명성을 강화하는 사명과 완벽하게 일치한다고 강조했다. 세타 네트워크의 공동 창립자이자 CEO인 미치 리우는 이 같은 의견에 동의하며, 블록체인 분석 및 생태계 개발에 대한 엑상글의 강점을 강조하고, 세타(THETA) 및 세타 연료(TFUEL)를 홍보하는 데 있어 중요한 시너지를 기대한다고 말했다.

AI 자금 조달

최신 DePIN 뉴스와 업데이트를 위해 가입하세요