Q-LoRA를 이용한 추출적 질문 응답을 위한 Llama 3.2 11B 미세 조정

화요일, 11월 26, 2024 12:00 오전
193

대형 언어 모델(LLM)은 자연어 처리에서 필수 도구가 되었으며, 다양한 작업을 처리할 수 있습니다. 그러나 광범위한 훈련으로 인해 특정 응용 프로그램에서 추가적인 적응 없이는 뛰어난 성능을 발휘하지 못할 수 있습니다. Q-LoRA와 같은 미세 조정 기술은 연구자들이 Llama 3.2 11B와 같은 사전 훈련된 모델을 추출적 질문 응답과 같은 특정 작업에 맞게 조정할 수 있도록 합니다. 이 기사는 SQuAD v2 데이터셋에서 Q-LoRA를 사용하여 Llama 3.2 11B를 미세 조정하는 과정을 설명하며, 이 방법을 통해 달성된 성능 향상을 보여줍니다.

LoRA 또는 저순위 적응은 기존 모델에 새로운 가중치를 도입하여 원래 매개변수를 변경하지 않는 기술입니다. 특정 레이어의 출력을 조정하는 어댑터 가중치를 추가함으로써, LoRA는 모델이 사전 훈련된 지식을 유지하면서 특정 작업에 맞게 새로운 기능을 습득할 수 있도록 합니다. 이 실험에서는 Llama 3.2 11B를 추출적 질문 응답을 위해 미세 조정하는 데 중점을 두고, 사용자 쿼리에 직접적으로 답변하는 정확한 텍스트 세그먼트를 추출하는 것을 목표로 합니다. 이 실험은 A100 GPU를 활용한 Google Colab 플랫폼에서 수행되었으며, Hugging Face Transformers 라이브러리가 구현을 지원했습니다.

미세 조정 과정의 결과는 유망했으며, 검증 세트에서 모델 성능이 크게 향상되었습니다. BERT 점수는 0.6469에서 0.7505로 개선되었고, 정확한 일치 점수는 0.116에서 0.418로 상승했습니다. 이러한 향상은 Q-LoRA 기술이 Llama 3.2 11B 모델을 추출적 질문 응답 작업에 효과적으로 적응시킨다는 것을 나타냅니다. 이 기사는 유사한 방법을 다른 모델과 작업에 적용하고자 하는 연구자들을 위한 가이드 역할을 하며, 자연어 처리 분야에서 미세 조정의 잠재력을 강조합니다.

Related News

히벨로, 노사나와 통합하여 GPU 수익 증대 및 DePIN 기회 확대 cover
3일 전
히벨로, 노사나와 통합하여 GPU 수익 증대 및 DePIN 기회 확대
히벨로 홀딩스 Ltd는 GPU 자원을 활용하는 사용자에게 수동 소득 기회를 향상시키기 위한 중요한 조치로 노사나 네트워크와의 통합을 발표했습니다. 이 파트너십은 생성적 AI 애플리케이션의 급속한 성장으로 인해 분산 GPU 파워에 대한 수요가 증가하고 있는 시점에서 특히 시의적절합니다. 블록메이트 벤처스의 CEO인 저스틴 로젠버그는 이 통합이 분산 컴퓨팅의 중요한 공급 격차를 해소할 뿐만 아니라 GPU 노드 참여를 촉진하여 사용자가 투자에서 더 높은 수익을 올릴 수 있도록 할 것이라고 강조했습니다. 노사나와의 협력은 히벨로가 GPU 기반 컴퓨팅을 위한 가장 수익성 높은 분산 물리적 인프라 네트워크(DePIN)에 접근할 수 있도록 합니다. 사용자는 이제 유휴 GPU 파워를 기여하여 AI 모델 훈련 및 소프트웨어 개발을 지원함으로써 수익을 극대화할 수 있습니다. 이 통합은 사용자가 자원을 손쉽게 연결하고 광범위한 기술 지식 없이도 성장하는 분산 생태계의 혜택을 누릴 수 있도록 프로세스를 간소화합니다. 히벨로의 공동 창립자이자 회장인 도메닉 카로사는 분산 인프라의 변혁적 잠재력을 강조하며, 노사나와의 통합이 GPU 기반 컴퓨팅을 보다 접근 가능하고 확장 가능하게 만드는 단계라고 말했습니다. 히벨로는 제공을 계속 확장하면서 사용자가 DePIN 환경에 참여하고 기여의 보상을 받을 수 있도록 힘을 실어주는 것을 목표로 하고 있습니다. 이 전략적 조치는 수익 기회를 향상시킬 뿐만 아니라 분산 애플리케이션의 성장을 지원하여 히벨로를 진화하는 기술 환경의 최전선에 위치시킵니다.
Hivello가 Nosana와 통합하여 수동 소득 기회를 향상시키다 cover
3일 전
Hivello가 Nosana와 통합하여 수동 소득 기회를 향상시키다
Blockmate Ventures는 Hivello Holdings와 Nosana 네트워크 간의 중요한 통합을 발표했으며, 이는 사용자에게 수동 소득 기회를 향상시키기 위한 것입니다. 이 협력은 인공지능(AI) 및 소프트웨어 개발에 대한 높은 수요가 있는 GPU 기반 컴퓨팅 자원을 활용하는 데 중점을 두고 있습니다. Nosana는 분산 물리 인프라 네트워크(DePIN) 분야에서 선도적인 플랫폼 중 하나로 인정받고 있으며, Hivello 사용자가 자신의 유휴 GPU 전력을 분산 생태계에 기여할 수 있도록 합니다. 이 파트너십은 GPU 노드 참여를 증가시키고, 사용자가 컴퓨팅 집계를 통해 자동으로 수익을 얻을 수 있는 기회를 제공할 것으로 예상됩니다. Hivello의 공동 창립자이자 의장인 Domenic Carosa에 따르면, 이 통합은 GPU 기반 컴퓨팅을 보다 접근 가능하고 보람 있게 만드는 중요한 단계라고 합니다. Nosana와의 파트너십은 사용자에게 수익 잠재력을 높일 뿐만 아니라 분산 인프라의 성장을 지원합니다. 생성적 AI 애플리케이션이 계속해서 주목받음에 따라, 분산 GPU 전력에 대한 수요가 증가할 것으로 예상되며, 이는 Hivello 사용자가 GPU 자원에서 더 높은 수익을 추구하는 데 있어 시기적절하고 유익한 통합입니다. Nosana와의 통합은 GPU 소유자에게 새로운 수동 소득 흐름을 창출할 예정이며, Hivello를 확장하는 AI 인프라 시장 내에서 더욱 자리잡게 될 것입니다. 이제 자동화된 컴퓨팅 집계 기능이 강화되어, 사용자는 자신의 유휴 GPU 전력을 쉽게 연결하고 수익을 극대화하면서 AI 모델 훈련 및 소프트웨어 개발을 지원하는 인프라에 기여할 수 있습니다. 이 전략적 움직임은 DePIN 네트워크 참여를 간소화하려는 Hivello의 사명과 일치하며, 광범위한 기술 지식 없이도 누구나 수동 소득을 얻을 수 있도록 합니다.
베리다, 개인 정보 중심의 AI 플랫폼 베타 출시 cover
3일 전
베리다, 개인 정보 중심의 AI 플랫폼 베타 출시
베리다가 개인 데이터 프라이버시와 사용자 제어의 중요한 발전을 의미하는 AI 플랫폼의 베타 버전을 공식 출시했습니다. 베리다 AI 솔루션은 사용자가 자신의 데이터 소유권을 유지하면서 안전하고 기밀한 API를 통해 강력한 AI 통합을 가능하게 합니다. 베리다 네트워크에서 데이터가 완전히 암호화되어 있어 사용자는 처리 중에도 자신의 정보가 비공개로 유지됨을 알고 AI 애플리케이션에 자신 있게 참여할 수 있습니다. 이 베타 출시 는 사용자 동의를 재정의하고 AI 기술의 혁신을 주도하는 중요한 단계입니다. 베리다 AI 베타의 주요 기능으로는 사용자 소유의 암호화된 데이터를 AI 애플리케이션에 원활하게 통합할 수 있는 개발자 API가 포함되어 있어 개인화 및 맥락화를 향상시킵니다. 이 플랫폼은 동의 기반 데이터 접근을 강조하여 사용자가 자신의 개인 데이터를 AI 추론에 연결하면서도 자신의 정보에 대한 완전한 제어를 유지할 수 있도록 합니다. 데이터 커넥터의 성장하는 생태계에는 Google 및 Telegram과 같은 인기 플랫폼이 포함되어 있으며, 더 많은 통합이 계획되어 있습니다. 또한, 'Connect Verida' 버튼의 도입으로 사용자 인증 및 데이터 접근이 간소화되어 AI 경험에서 프라이버시를 보존하는 개인화가 보장됩니다. 베리다 토큰(VDA)은 플랫폼을 지원하며 API 요청을 용이하게 하고 개발자를 위한 지속 가능한 생태계를 보장합니다. 베리다는 애플리케이션 통합 및 데이터 커넥터 개발을 목표로 하는 개발자 보조금을 통해 혁신을 촉진하는 데 전념하고 있습니다. 사용자가 자신의 데이터를 관리할 수 있도록 권한을 부여함으로써 베리다는 데이터 소유권 및 수익화에서 대기업의 지배에 도전하는 것을 목표로 하고 있습니다. 이 베타 출시는 사용자 제어를 강화할 뿐만 아니라 개인의 프라이버시를 침해하지 않고 하이퍼 개인화된 AI 솔루션을 창출할 수 있는 새로운 길을 열어주며, 프라이버시를 보존하는 AI 기술의 새로운 시대를 예고합니다.
Theta Labs, 강원대학교와 AI 연구 강화 파트너십 체결 cover
4일 전
Theta Labs, 강원대학교와 AI 연구 강화 파트너십 체결
Theta Labs는 최근 강원대학교를 Theta EdgeCloud 분산 GPU 네트워크에 환영하며 AI 연구 파트너십을 확장했습니다. 이 협력은 강원대학교가 Theta EdgeCloud의 23번째 학술 고객이 되는 중요한 이정표를 의미합니다. 이 파트너십은 AI 연구 능력을 강화하는 것을 목표로 하며, Theta의 글로벌 네트워크에서 85% 이상의 인상적인 GPU 활용률을 달성하고, Elite Booster 노드 운영자에 의해 2억 3천만 TFUEL 이상이 잠금됩니다. EdgeCloud 플랫폼은 이미 NHL 팀과 유명 대학을 포함한 다양한 기업 및 학술 기관을 지원하고 있어 AI 연구 및 실제 응용 프로그램을 발전시키는 역할을 강화하고 있습니다. 강원대학교의 데이터 분석 및 기계 지능(DAMI) 연구소를 이끄는 강경필 교수는 자연어 처리, 기계 학습 및 데이터 마이닝을 전문으로 합니다. DAMI 연구소는 대규모 AI 연구에 중점을 두고 있으며, 대형 언어 모델(LLM)의 미세 조정, 특정 도메인을 위한 기계 학습 솔루션, 사회 과학 및 의료 AI와 같은 분야에서 AI 기반 통찰력을 탐구합니다. Theta EdgeCloud와의 협력은 연구자들이 혁신적인 실험을 수행하고 고급 AI 응용 프로그램을 개발할 수 있도록 하이브리드 클라우드-엣지 GPU 컴퓨팅 플랫폼에 접근할 수 있게 합니다. 파트너십이 진행됨에 따라 강 교수와 Theta Labs의 공동 창립자이자 CEO인 미치 리우는 이 협력의 잠재력에 대한 기대감을 표명합니다. 리우는 증가하는 수요를 충족하면서 비용 효율성을 유지하기 위해 GPU 인프라를 확장하는 것의 중요성을 강조합니다. 2025년 목표는 고객 기반을 10배로 늘리고, 95% 이상의 GPU 활용률을 달성하며, 엘리트 엣지 노드 운영자를 통해 20억 TFUEL 이상을 잠금하는 것입니다. 이 파트너십은 DAMI 연구소의 역량을 강화할 뿐만 아니라 AI 및 기계 학습을 위한 분산 클라우드 인프라 공간에서 Theta Labs의 입지를 강화합니다.
CUDIS, 웰빙 추적 향상을 위한 에너지 저널 기능 출시 cover
5일 전
CUDIS, 웰빙 추적 향상을 위한 에너지 저널 기능 출시
CUDIS는 최근 앱의 1.3.10 버전을 출시하며 에너지 저널이라는 혁신적인 기능을 도입했습니다. 이 새로운 기능은 사용자가 블록체인에 일일 에너지 및 기분 수준을 기록할 수 있게 하여, 감정 연구 및 개인 웰빙 알고리즘을 크게 향상시킬 수 있는 영구 기록을 생성합니다. 에너지 수준을 추적함으로써 사용자는 정신적 및 신체적 웰빙에 대한 통찰을 얻을 수 있으며, 이는 삶의 긍정적인 변화를 이끌어낼 수 있습니다. 데이터는 체인 상에 안전하게 저장되어 변조 불가능성을 보장하며, CUDIS 생태계의 확장에 기여합니다. 에너지 수준을 추적하는 것은 수면 질 및 스트레스 모니터링과 유사하게 자신의 정신 건강을 이해하는 데 필수적입니다. CUDIS AI 에이전트는 자가 보고된 데이터를 다른 건강 지표와 함께 분석하여 개인화된 통찰과 실행 가능한 조언을 제공합니다. 사용자는 에너지 수준을 일관되게, 정직하게 기록하고 긍정적 및 부정적 유발 요인을 인식하도록 권장됩니다. 이 실천은 자기 인식을 촉진할 뿐만 아니라 사용자가 추첨 응모 및 SALUS 포인트와 같은 앱 내 보상을 받을 수 있게 하여 추적 루틴을 유지하도록 유도합니다. CUDIS는 에너지 수준 기록에 대한 사용자들의 헌신에 보상을 제공하며, 일관된 추적의 연속성에 따라 다양한 인센티브를 제공합니다. 예를 들어, 7일 연속 기록하면 2개의 추첨 응모권과 100 SALUS 포인트를 얻을 수 있으며, 60일 연속 기록하면 7개의 추첨 응모권과 1,000 SALUS 포인트를 얻을 수 있습니다. 추첨은 Edamame NFT 및 USDC 상품을 포함한 흥미로운 보상을 받을 수 있는 보장된 기회를 제공합니다. 또한, SALUS 포인트는 CUDIS 마켓플레이스 내에서 사용 가능하며, 다가오는 CUDIS 토큰 생성 이벤트(TGE) 동안 초기 사용자 채택 에어드랍과 연결되어 있습니다. 이 독특한 접근 방식은 사용자 참여를 향상시킬 뿐만 아니라 블록체인 기술의 힘을 통해 더 건강한 라이프스타일을 촉진합니다.
데이터 법안: 새로운 데이터 경제를 위한 촉매 cover
6일 전
데이터 법안: 새로운 데이터 경제를 위한 촉매
2025년 9월 12일 발효 예정인 데이터 법안은 EU 전역에서 데이터 접근, 사용 및 공유 방식에 중대한 변화를 가져올 것입니다. 이 법안은 기존의 데이터 사일로를 해체하고 소비자와 기업이 자신의 데이터에 대한 소유권과 통제권을 부여받도록 하는 것을 목표로 합니다. 유럽연합 집행위원회는 데이터 법안이 2028년까지 2,700억 유로에 이를 것으로 예상되는 새로운 데이터 경제를 촉진할 것이라고 기대하고 있습니다. 소비자에게는 자신의 장치에서 생성된 데이터에 접근할 수 있는 기회가 주어지며, IoT 제조업체는 판매 시점에서 데이터 생성 및 접근 권리에 대해 사용자에게 알릴 새로운 책임을 지게 됩니다. 데이터 법안의 집행은 소비자와 개발자 사이에서 질문을 불러일으킨 중요한 측면입니다. 각 EU 회원국은 마감일까지 데이터 법안을 자국의 법률에 통합해야 하며, 불이행에 대한 처벌을 설정해야 합니다. 예를 들어, 핀란드의 초안 제안은 GDPR에 맞춘 처벌을 제안하며, 최대 100,000유로의 벌금과 회사의 전 세계 매출의 최대 4%에 해당하는 벌금을 부과할 수 있도록 하고 있습니다. 네덜란드와 같은 다른 국가들도 위반에 대한 상당한 벌금을 고려하고 있어 데이터 법안이 단순한 이론적 틀에 그치지 않고 실제 규제로서 불이행에 대한 실질적인 결과를 가져오도록 하고 있습니다. 데이터 법안은 또한 주요 기술 회사를 '게이트키퍼'로 지정하여 이들이 법안에 따라 제3자 데이터에 접근하는 것을 제한함으로써 공정한 경쟁의 장을 만들고자 합니다. 이 규제는 이러한 지배적인 플레이어가 새로운 데이터 환경을 독점하는 것을 방지하여, 소규모 기업과 Web3 프로젝트가 효과적으로 경쟁할 수 있도록 합니다. 특히 AI 및 AI 에이전트와 같은 신기술은 데이터 법안의 혜택을 크게 받을 수 있으며, 이는 연결된 장치에서 기계 판독 가능한 데이터에 대한 접근을 열어줍니다. Streamr는 실시간 데이터 제공자와 구독자를 연결하는 기술을 통해 이 새로운 데이터 경제를 촉진할 수 있는 위치에 있으며, AI 시스템과 실시간 데이터 소스 간의 격차를 해소하고 다양한 산업에서 혁신적인 애플리케이션을 위한 길을 열고 있습니다.
최신 DePIN 뉴스와 업데이트를 위해 가입하세요