Soru-Cevaplama için Q-LoRA ile Llama 3.2 11B'nin İnce Ayarı

Salı, Kasım 26, 2024 12:00 AM
219

Büyük Dil Modelleri (LLM’ler), doğal dil işleme alanında çeşitli görevleri yerine getirebilen temel araçlar haline gelmiştir. Ancak, geniş kapsamlı eğitimleri nedeniyle, belirli uygulamalarda daha fazla uyarlama olmadan mükemmel sonuçlar veremeyebilirler. Q-LoRA gibi ince ayar teknikleri, araştırmacıların Llama 3.2 11B gibi önceden eğitilmiş modelleri, ekstrektif soru-cevaplama gibi belirli görevler için özelleştirmelerine olanak tanır. Bu makale, Q-LoRA kullanarak Llama 3.2 11B’nin SQuAD v2 veri setinde ince ayar sürecini özetlemekte ve bu yöntemle elde edilen performans artışlarını sergilemektedir.

LoRA, ya da Düşük Sıralı Adaptasyon, mevcut bir modele yeni ağırlıklar ekleyen bir tekniktir ve orijinal parametreleri değiştirmeden çalışır. Belirli katmanların çıktısını ayarlayan adaptör ağırlıkları ekleyerek, LoRA modellerin önceden eğitilmiş bilgilerini korurken belirli görevlere özel yeni yetenekler kazanmalarını sağlar. Bu deneyde, Llama 3.2 11B’nin ekstrektif soru-cevaplama için ince ayarı üzerine odaklanılmıştır; amaç, kullanıcı sorgularına doğrudan yanıt veren kesin metin parçalarını çıkarmaktır, içeriği özetlemek veya yeniden ifade etmek yerine. Deney, Google Colab platformunda A100 GPU kullanılarak gerçekleştirilmiş ve uygulama Hugging Face Transformers kütüphanesi ile kolaylaştırılmıştır.

İnce ayar sürecinin sonuçları umut verici olup, modelin doğrulama setindeki performansında önemli bir artış göstermiştir. BERT skoru 0.6469’dan 0.7505’e yükselirken, tam eşleşme skoru 0.116’dan 0.418’e çıkmıştır. Bu iyileştirmeler, Q-LoRA tekniğinin Llama 3.2 11B modelini ekstrektif soru-cevaplama görevlerine etkili bir şekilde uyarladığını göstermektedir. Bu makale, benzer yöntemleri diğer modeller ve görevler için uygulamak isteyen araştırmacılar için bir rehber niteliğindedir ve doğal dil işleme alanında ince ayarın potansiyelini vurgulamaktadır.

Related News

Fartcoin: Solana'nın AI Sektöründe Bir Memecoin'in Şaşırtıcı Yükselişi cover
bir gün önce
Fartcoin: Solana'nın AI Sektöründe Bir Memecoin'in Şaşırtıcı Yükselişi
Sürekli değişen kripto para manzarasında, Fartcoin kadar dikkat çeken çok az token var. Solana tabanlı bir AI memecoin olan Fartcoin, henüz başlangıç aşamasında olmasına rağmen, sosyal medya platformlarında, özellikle Twitter'da önemli bir varlık oluşturdu ve deneyimli yatırımcılar tarafından bir alım sinyali olarak algılanıyor. Belarus kökenli bu memecoin, Solana ekosisteminde hızla öne çıkmayı başardı ve birçok daha köklü rakibini geride bıraktı. 455,2 milyon dolarlık piyasa değeri ile Fartcoin, şu anda Solana'daki AI tokenlarının toplam piyasa değerinin %32,1'ini elinde bulunduruyor; bu değer yaklaşık 1,1148 milyar dolar ve 772 projeye yayılmış durumda. Fartcoin'in yükselişi, birçok AI tokenıyla ilişkilendirilen tipik fayda veya teknolojik iddialardan yoksun olduğu göz önüne alındığında özellikle dikkat çekicidir. Bunun yerine, mevcut yapay zeka etrafındaki heyecanı kullanarak piyasada önemli bir niş oluşturdu. Performansı, #ai16z gibi köklü tokenların performansını geride bıraktı ve Fartcoin'in piyasa değeri, en yakın rakibinin piyasa değerini neredeyse %250 oranında aşıyor. Bu beklenmedik başarı, Solana blok zincirindeki AI tokenlarının geleceği hakkında sorular ortaya çıkarıyor ve yatırımcıların daha geleneksel teknoloji ağırlıklı çözümler yerine daha hafif, meme tabanlı projelere yönelme olasılığını öne sürüyor. Fartcoin'in kurumsal yatırımcılar arasında, sıkça "akıllı para" olarak adlandırılan yatırımcılar arasında çekiciliği, başarısının ana itici güçlerinden biridir. Bu yatırımcılar, Fartcoin'in piyasadaki benzersiz konumuna çekiliyor; burada meme kültürü ve topluluk katılımı güçlü varlıklar olarak kendini kanıtladı. Fartcoin önemli yatırımlar ve dikkat çekmeye devam ederken, geleceği belirsizliğini koruyor, ancak mevcut gidişatı, AI sektöründe Solana'da kendisini sağlam bir oyuncu olarak kurduğunu gösteriyor. Sonuç olarak, Fartcoin, kripto para dünyasının öngörülemez doğasını örneklendiriyor; burada bir memecoin bile, genellikle daha ciddi projelere ayrılmış bir pazar segmentinde hakim olabilir.
Yapay Zeka Odaklı Kripto Paralar, Microsoft Veri Merkezi Yavaşlaması Ortasında Önemli Bir Düşüşle Karşılaşıyor cover
6 gün önce
Yapay Zeka Odaklı Kripto Paralar, Microsoft Veri Merkezi Yavaşlaması Ortasında Önemli Bir Düşüşle Karşılaşıyor
Kripto para piyasasındaki son düşüş, özellikle yapay zeka odaklı tokenler için, Microsoft'un veri merkezi genişleme planlarını yavaşlatma kararından önemli ölçüde etkilenmiştir. Son 24 saatte Bittensor'un tokeni %10 düşerken, son bir haftada %24'lük bir düşüş yaşadı. Render Token (RNDR) ve Grass da sırasıyla %10 ve %20'lik düşüşlerle karşılaştı ve CoinGecko tarafından takip edilen yapay zeka tokenlerinin toplam piyasa değerinde %10'luk bir azalmaya katkıda bulundu. Bu eğilim, büyük yapay zeka ile ilgili hisse senetlerinin performansını yansıtıyor; NVIDIA, 2024 zirvesinden %30'dan fazla düşüş yaşarken, AMD bu yılki zirvelerinden %47 düştü. Microsoft'un birden fazla ülkede veri merkezi geliştirmelerini durdurma veya erteleme kararının etkisi, yapay zeka sektöründeki büyüme hızına dair endişeleri artırıyor. Bu haber, Microsoft'un ChatGPT'nin yaratıcısı OpenAI ile işbirliği yoluyla yapay zekanın ticarileştirilmesindeki merkezi rolü göz önüne alındığında özellikle çarpıcıdır. TD Cowen'den analistler, veri merkezlerinin aşırı arzı konusunda endişelerini dile getirerek, talebin daha önce beklenen hızlı genişlemeyi karşılamayabileceğini öne sürdüler. Yapay zeka patlaması, kripto alanında birçok geliştiriciyi çekti; Bittensor gibi projeler, madencilerin hesaplama kaynakları sağlayarak TAO tokenleri kazandığı yapay zeka öğrenme modelleri için merkeziyetsiz pazarlar sunuyor. Render, kullanıcıların GPU gücünü kiraladığı bir platform sağlayarak Solana üzerinde çalışıyor, Grass ise kullanıcıları uygulama yüklemeleri yoluyla token kazanmaya teşvik ediyor. Ayrıca, özellikle Virtuals Protocol ekosisteminde yapay zeka meme coinlerindeki düşüş, daha geniş bir piyasa düzeltmesini vurguluyor; GAME gibi tokenler, Ocak ayından bu yana değerlerinin 350 milyon dolardan sadece 13 milyon dolara düştüğünü gördü.
Phoenix, DePIN-AI Sektörünün Büyüme ve İnovasyonuna Öncülük Ediyor cover
13 gün önce
Phoenix, DePIN-AI Sektörünün Büyüme ve İnovasyonuna Öncülük Ediyor
Merkeziyetsiz Fiziksel Altyapı Ağı (DePIN) sektörü hızla gelişiyor ve çeşitli teknolojik alanlarda önemli bir potansiyel sergiliyor. Messari'nin son raporuna göre, DePIN şu anda başlangıç aşamasında olup, pazar payının %0,1'inden daha azını elinde bulundurmakta, ancak günlük katkıda bulunan 13 milyondan fazla cihazla desteklenen 50 milyar dolarlık bir piyasa değerine sahip. Merkezi aracıları ortadan kaldırarak, DePIN fiziksel varlıkların daha verimli ve kapsayıcı bir şekilde paylaşımını kolaylaştırıyor; bu, bilişim, yapay zeka, kablosuz teknoloji ve enerji hizmetleri için kritik altyapıların geliştirilmesi ve işletilmesi açısından hayati önem taşıyor. DePIN, kuruluşundan bu yana, özellikle 2023'te, dünya çapındaki üreticilerin blok zincirini gerçek dünya altyapılarına entegre etmeye başlamasıyla büyük teknoloji şirketlerinin dikkatini çekti. Sektör, cihazlara odaklanan Fiziksel Kaynak Ağları ve CDN'ler ve yapay zeka gibi bilişim kaynaklarına vurgu yapan Dijital Kaynak Ağları olarak ikiye ayrılabilir. Bu ikilik, bireysel cihaz sahiplerinin veri paylaşmasına ve ödüller kazanmasına olanak tanırken, erişilebilir bilişim kaynakları sunar. DePIN'in uygulamaları, telekomünikasyon, veri yönetimi ve bulut depolama alanlarına uzanarak, geleneksel merkezi sistemlere ölçeklenebilir alternatifler sunmakta ve yapay zeka işlevselliğini artırmaktadır. Bu yeniliğin öncüsü, DePIN altyapısını kullanarak yapay zeka uygulamaları için ölçeklenebilir çözümler sunan merkeziyetsiz bir yapay zeka hesaplama ağı olan Phoenix'tir. Phoenix'in SkyNet platformu, yapay zeka operasyonlarını optimize etmek için NVIDIA ve alternatif modeller dahil olmak üzere yüksek performanslı GPU'ların küresel olarak dağıtılmış bir ağını kullanmaktadır. TandemAI ve Origin Quantum gibi firmalarla yaptıkları iş birlikleri, araştırma kuruluşlarının düşük maliyetlerle karmaşık analizler yapabilmesini sağlamak amacıyla ileri düzey bilişim kaynaklarına erişimi demokratikleştirmeyi hedefliyor. DePIN-AI sektörünün 2028 yılına kadar 3,5 trilyon dolarlık bir piyasa büyüklüğüne ulaşması beklenirken, Phoenix, merkeziyetsiz altyapıyı en son yapay zeka teknolojileriyle birleştirerek bu dönüşüm dalgasına öncülük etmeye hazır.
SFT Protokolü, AI Destekli Dağıtık Altyapıyı İlerletmek İçin SOLPEN ile Ortaklık Kurdu cover
14 gün önce
SFT Protokolü, AI Destekli Dağıtık Altyapıyı İlerletmek İçin SOLPEN ile Ortaklık Kurdu
Web3 alanında önde gelen bir oyuncu olan SFT Protokolü, Solana blok zinciri üzerinde kurulu AI destekli DePIN ekosistemi SOLPEN ile stratejik bir ortaklık kurduğunu duyurdu. Bu iş birliği, merkeziyetsiz AI ağları ile Nesnelerin İnterneti (IoT) arasındaki etkileşimi yeniden tanımlamayı amaçlayarak, Web3 teknolojisi ile fiziksel altyapı arasındaki bağı güçlendirmeyi hedefliyor. İnisiyatif, SFT Protokolü'nün resmi sosyal medya kanalları aracılığıyla duyuruldu ve bu birleşmenin her iki platformun yeteneklerini ilerletmedeki önemini vurguladı. Ortaklık, SFT Protokolü'nün DePIN altyapısı için sağlam çözümlerini, SOLPEN'in öncü AI destekli giyilebilir teknolojisi ile birleştirmeyi hedefliyor. Bu entegrasyonun, düşük gecikme süresi ve yüksek verimlilikle çalışan merkeziyetsiz bir ekosistem yaratması bekleniyor. Merkeziyetsiz veri işleme ve AI analitiğinden faydalanarak, iş birliği gerçek dünya uygulamalarını önemli ölçüde geliştirmeyi vaat ediyor. SFT Protokolü, sorunsuz gerçek dünya uygulamalarını destekleyen blok zinciri tabanlı altyapıya odaklanarak DePIN ekosisteminde önemli bir oyuncu olarak kendini kanıtladı ve böylece Web3 teknolojilerinin daha geniş bir şekilde benimsenmesini sağladı. Ayrıca, iş birliği, çeşitli Web3 platformları arasında eşsiz entegrasyonu sağlayan Solana'nın yüksek performanslı blok zincirinden faydalanıyor. Dağıtık altyapı için yeni standartlar belirleyerek, hem SFT Protokolü hem de SOLPEN, sundukları hizmetlerin pratikliğini ve erişilebilirliğini artırıyor. Gelişmeye devam ederken, bu ortaklık daha akıllı, AI entegreli bir Web3 ağına doğru yol alıyor ve merkeziyetsiz alanda yenilikçi çözümler için zemin hazırlıyor.
New Jersey Devils, Dijital Taraftar Etkileşimini Artırmak İçin 'Bott Stevens' İAI Sohbet Botunu Başlattı cover
21 gün önce
New Jersey Devils, Dijital Taraftar Etkileşimini Artırmak İçin 'Bott Stevens' İAI Sohbet Botunu Başlattı
New Jersey Devils, dijital taraftar etkileşimini artırmayı amaçlayan "Bott Stevens" adında çığır açan bir İAI sohbet botu tanıttı. Bu yenilikçi sohbet botu, efsanevi Devils oyuncusu Scott Stevens'ın adını taşıyor ve Theta EdgeCloud'un merkeziyetsiz İAI altyapısı tarafından destekleniyor. 2024-25 NHL sezonunda lansmanı planlanan Bott Stevens, takımın resmi web sitesinde erişilebilir olacak ve taraftarlara maç programları, bilet satışları, istatistikler ve ürünler hakkında gerçek zamanlı bilgi sağlayacak. Theta'nın Retrieval Augmented Generation teknolojisini kullanarak, sohbet botu resmi NHL kanallarından bilgi alarak veri doğruluğunu sağlayacak ve böylece doğrulanmamış kaynaklardan yanlış bilgi riskini en aza indirecek. Bott Stevens, Theta EdgeCloud'un 30.000'den fazla kenar düğümü ve dağıtılmış GPU'lar ağı sayesinde etkileyici hesaplama yeteneklerine sahiptir ve bu ağ toplamda 80 PetaFLOPS'tan fazla işlem gücü sunmaktadır. Bu sağlam altyapı, özellikle playoff'lar veya önemli takım duyuruları gibi yüksek riskli etkinlikler sırasında zirve talebini karşılamak için tasarlanmıştır. Taraftarların sorularını yanıtlama dışında, sohbet botu tarihi anekdotlar, maç özetleri, mekan bilgileri ve takım etkinlikleri hakkında güncellemeler sağlayacaktır. Gelecek geliştirmeler, fantezi sporları için öngörücü analizler ve taraftarları daha fazla etkileşimde bulunmaya teşvik eden etkileşimli araçlar içerebilir. Bott Stevens'ı tanıtmak için Devils, yeteneklerini birden fazla platformda entegre etmeyi planlıyor ve taraftar etkileşimini ve farkındalığını teşvik ediyor. Sohbet botu sadece istatistikler ve programlar sunmakla kalmayacak, aynı zamanda tarihi anekdotlar ve yaklaşan etkinlikler hakkında bilgi gibi taraftar deneyimini zenginleştiren küratörlü içerikler de sağlayacaktır. Başarı ölçütleri, kullanıcı etkileşim oranları, bilgi doğruluğu ve taraftarlardan gelen geri bildirimleri içerecek ve Bott Stevens'ın Devils topluluğu için değerli bir kaynak olmasını sağlayacaktır. Sürekli öğrenme ve kişiselleştirilmiş etkileşimlere odaklanarak, takım Bott Stevens'ı diğer İAI ajanlarından ayırmayı ve taraftarlar için benzersiz ve ilgi çekici bir deneyim yaratmayı hedefliyor.
Intel TDX ve iExec ile Gizli AI'yi Devrim Yapmak cover
22 gün önce
Intel TDX ve iExec ile Gizli AI'yi Devrim Yapmak
Gizli AI alanı, esasen Intel® Trust Domain Extensions (Intel® TDX) tanıtımıyla önemli bir dönüşüm geçiriyor. Yıllardır, geliştiriciler, uygulamalarda kapsamlı değişiklikler gerektiren ve uyumluluk sorunlarına yol açan Intel SGX kullanarak AI iş yüklerini güvence altına almaya çalışırken zorluklarla karşılaştılar. Bu zahmetli süreç, yalnızca zaman kaybına neden olmakla kalmadı, aynı zamanda Gizli AI çözümlerinin gerçek dünyada benimsenmesini de engelledi. Ancak Intel TDX ile geliştiriciler artık kodlarını yeniden yazmadan güvenli sanal makinelerde AI iş yüklerini çalıştırabiliyor, böylece geliştirme sürecini kolaylaştırıyor ve performansı artırıyor. Intel TDX, sanallaştırılmış ortamlarda veri gizliliğini ve bütünlüğünü artıran donanım izoleli güvenilir yürütme ortamı (TEE) oluşturmak için tasarlanmıştır. Intel'in 4. Nesil Xeon® Scalable işlemcilerine entegre edilen TDX, sanal makineleri hipervizörden ve hatta bulut hizmet sağlayıcılarından izole eden Güvenilir Alanlar tanıtır. Bu izolasyon, hassas veri setleri ve özel modellerle çalışan AI uygulamaları için kritik öneme sahiptir, çünkü saldırı yüzeyini önemli ölçüde azaltırken yüksek performansı korur. Ayrıca, TDX, derin öğrenme ve makine öğrenimi modellerini hızlandırmak için gelişmiş CPU yeteneklerini kullanarak AI iş yükleri için optimize edilmiştir, bu da onu geliştiriciler için sağlam bir seçim haline getirir. Intel TDX ve iExec arasındaki iş birliği, Gizli AI'nın yeni bir çağına zemin hazırlıyor. Intel Partner Alliance'ın Altın Üyesi olan iExec, bu hareketin ön saflarında yer alıyor ve güvenli, merkeziyetsiz ve ölçeklenebilir AI iş yüklerinin yürütülmesini sağlayan çözümler sunuyor. Bu ortaklık, yalnızca AI hesaplamalarının güvenliğini artırmakla kalmaz, aynı zamanda veri koruma düzenlemelerine uyumu da sağlar. Sağlık ve finans gibi sektörlerde pratik uygulamalarla, iExec, geliştiricilerin veri sahipliğine ve güvenli hesaplamaya öncelik veren gizlilik koruyucu AI uygulamaları oluşturmalarını sağlıyor ve nihayetinde daha güvenilir bir AI ekosistemine yol açıyor.
En son DePIN haberleri ve güncellemeleri için kaydolun