Meta, Yapay Zeka Dil Modelleriyle Küçülmek İstiyor

Büyük dil AI modelleri manşetlere çıkmaya devam ederken, aksiyonun olduğu yer küçük dil modelleridir. En azından, araştırma bilim insanlarından oluşan bir ekip tarafından yakın zamanda yayınlanan bir makaleye göre Meta'nın bahse girdiği şey bu gibi görünüyor.

ChatGPT, Gemini ve Llama gibi büyük dil modelleri, sonuçlarını elde etmek için milyarlarca, hatta trilyonlarca parametre kullanabilir. Bu modellerin boyutu, mobil cihazlarda çalıştırılamayacak kadar büyük olmalarına neden olur. Bu nedenle, Meta bilim insanları araştırmalarında, mobil cihazlarda verimli büyük dil modellerine yönelik artan bir ihtiyaç olduğunu belirttiler; bu ihtiyaç, artan bulut maliyetleri ve gecikme endişeleriyle yönlendiriliyor.

Bilim insanları araştırmalarında, bir milyardan az parametreyle yüksek kaliteli büyük dil modelleri nasıl oluşturduklarını ve bunun mobil dağıtım için iyi bir boyut olduğunu nasıl savunduklarını açıkladılar.

Model kalitesini belirlemede veri ve parametre miktarının oynadığı önemli role vurgu yapan yaygın inancın aksine, bilim insanları küçük dil modeliyle bazı alanlarda Meta'nın Llama LLM programına benzer sonuçlar elde ettiler.

New York City merkezli, yapay zeka destekli bir e-ticaret tedarik zinciri platformu olan Bucephalus'un CEO'su Nick DeGiacomo, "Daha büyük olanın daha iyi olduğu yönünde yaygın bir paradigma var, ancak bu, asıl meselenin parametrelerin nasıl kullanıldığıyla ilgili olduğunu gösteriyor" dedi .

TechNewsWorld'e yaptığı açıklamada, "Bu, cihaz içi yapay zekanın daha yaygın bir şekilde benimsenmesinin önünü açıyor" dedi.

Kritik Bir Adım

San Francisco merkezli bir girişim sermayesi şirketi olan FutureFund'un CEO'su ve kurucusu Darian Shimy, Meta'nın araştırmasının, verilerin genellikle uzak veri merkezlerinde işlendiği bulut tabanlı yapay zeka normuna meydan okuması bakımından önemli olduğunu açıkladı .

TechNewsWorld'e verdiği demeçte, "Yapay zeka işlemeyi cihazın kendisine getirerek Meta senaryoyu tersine çeviriyor; büyük, enerji tüketen veri merkezlerinde veri iletimi ve işlenmesiyle ilişkili karbon ayak izini azaltma potansiyeli taşıyor ve cihaz tabanlı yapay zekayı teknoloji ekosisteminde önemli bir oyuncu haline getiriyor" dedi.

Oregon, Eagle Point'te uçtan uca güvenlik yazılımı geliştiricisi olan Pvotal Technologies'in CEO'su Yashin Manraj, "Bu araştırma, bu büyüklükteki ilk kapsamlı ve kamuoyuyla paylaşılan çabadır" diye ekledi .

TechNewsWorld'e verdiği demeçte, "Geliştiricilerin bulut ve cihaz içi veri işleme arasında doğru dengeyi bulabilecekleri bir SLM-LLM uyumlu yaklaşımına ulaşmada kritik bir ilk adımdır," dedi. "Yapay zeka destekli uygulamaların vaatlerinin son yıllarda pazarlanan ancak bu vizyonları destekleyecek mühendislik kapasitesinden yoksun olan destek, otomasyon ve yardım seviyesine ulaşabileceği zemini hazırlıyor."

Meta bilim insanları da bir dil modelinin boyutunu küçültmede önemli bir adım attılar. "Bir modelin büyüklük sırasına göre küçültülmesini ve giyilebilir, işitilebilir ve mobil telefonlar için daha erişilebilir hale getirilmesini öneriyorlar," diyor Kaliforniya, Westlake Village'daki bir yarı iletken şirketi olan Skyworks Solutions'ın mobil pazarlama kıdemli direktörü Nishant Neekhra.

TechNewsWorld'e verdiği demeçte, "Yapay zeka için yepyeni bir uygulama seti sunarken, yapay zekanın gerçek dünyada etkileşime girmesi için yeni yollar sağlıyorlar," dedi. "Küçülerek, LLM'leri etkileyen büyük bir büyüme zorluğunu da çözüyorlar, bu da uç cihazlarda konuşlandırılabilme yetenekleridir."

Sağlık Bakımı Üzerinde Yüksek Etki

Küçük dil modellerinin anlamlı etki yaratabileceği alanlardan biri tıptır.

Küresel bir tıbbi yazılım geliştirme şirketi olan IT Medical'da hekim danışmanı olan Danielle Kelvas, TechNewsWorld'e yaptığı açıklamada, "Araştırma, günümüz sağlık sektöründe uzaktan izleme ve biyometrik değerlendirmeler için yaygın olarak kullanılan mobil cihazları içeren uygulamalar için üretken yapay zekanın potansiyelini açığa çıkarmayı vaat ediyor." dedi.

Araştırmacılar, etkili SLM'lerin bir milyardan az parametreye sahip olabileceğini ve yine de belirli görevlerde daha büyük modellerle karşılaştırılabilir performans gösterebileceğini göstererek, günlük sağlık izleme ve kişiselleştirilmiş hasta bakımında yapay zekanın yaygın olarak benimsenmesinin kapısını açıyorlar.

Kelvas, SLM'lerin kullanılmasının hassas sağlık verilerinin bir cihazda güvenli bir şekilde işlenebilmesini sağlayarak hasta gizliliğini artırabileceğini açıkladı. Ayrıca kronik rahatsızlıkları olan veya sürekli bakıma ihtiyaç duyan hastalar için kritik olan gerçek zamanlı sağlık izleme ve müdahaleyi de kolaylaştırabilirler.

Ayrıca, modellerin sağlık hizmetleri alanında yapay zekanın kullanımında teknolojik ve finansal engelleri azaltabileceğini ve gelişmiş sağlık izleme teknolojilerinin daha geniş kesimlere ulaşmasını sağlayabileceğini sözlerine ekledi.

Sektör Trendlerini Yansıtmak

Meta'nın mobil cihazlar için küçük AI modellerine odaklanması, verimlilik ve erişilebilirlik için AI'yı optimize etmeye yönelik daha geniş bir endüstri eğilimini yansıtıyor, diye açıkladı CUNY LaGuardia Community College'da yeni medya teknolojisi profesörü olan Caridad Muñoz . TechNewsWorld'e verdiği demeçte, "Bu değişim yalnızca pratik zorlukları ele almakla kalmıyor, aynı zamanda büyük ölçekli AI operasyonlarının çevresel etkisiyle ilgili artan endişelerle de örtüşüyor." dedi.

Muñoz, "Daha küçük ve daha verimli modelleri destekleyerek Meta, sürdürülebilir ve kapsayıcı yapay zeka gelişimi için bir emsal oluşturuyor" diye ekledi.

Küçük dil modelleri, AI yeteneklerini kullanıcılara daha yakın hale getirmeye odaklanan uç bilişim trendine de uyuyor. DeGiacomo, "OpenAI, Anthropic ve diğerlerinden gelen büyük dil modelleri genellikle aşırıya kaçıyor - 'elinizde sadece bir çekiç varsa, her şey çivi gibi görünür'" dedi.

"Özel, ayarlanmış modeller belirli görevler için daha verimli ve uygun maliyetli olabilir," diye belirtti. "Birçok mobil uygulama son teknoloji yapay zeka gerektirmez. Kısa mesaj göndermek için bir süper bilgisayara ihtiyacınız yoktur."

"Bu yaklaşım, cihazın SLM kullanılarak yanıtlanabilen sorular ile uzmanlaşmış kullanım durumları arasındaki yönlendirmeyi, pratisyen hekimler ile uzman hekimler arasındaki ilişkiye benzer şekilde ele almasına olanak tanır" diye ekledi.

Küresel Bağlantı Üzerinde Derin Etki

Shimy, SLM'lerin küresel bağlantı üzerinde derin etkileri olabileceğini savundu.

"Cihazdaki AI daha yetenekli hale geldikçe, sürekli internet bağlantısına olan ihtiyaç azalıyor ve bu da internet erişiminin tutarsız veya maliyetli olduğu bölgelerde teknoloji manzarasını önemli ölçüde değiştirebilir," diye gözlemledi. "Bu, gelişmiş teknolojilere erişimi demokratikleştirebilir ve çeşitli küresel pazarlarda en son AI araçlarını kullanılabilir hale getirebilir."

Meta, SLM'lerin geliştirilmesine öncülük ederken Manraj, gelişmekte olan ülkelerin AI geliştirme maliyetlerini kontrol altında tutmak için durumu agresif bir şekilde izlediğini belirtti. "Çin, Rusya ve İran, özellikle son teknoloji AI donanım çipleri ambargo altında olduğunda veya kolayca erişilemediğinde, yerel cihazlarda hesaplamaları erteleme yeteneğine büyük ilgi duymuş gibi görünüyor" dedi.

"Bunun bir gecede veya köklü bir değişiklik olmasını beklemiyoruz," diye tahmin etti, "çünkü karmaşık, çok dilli sorgular, son kullanıcılara en son teknolojiyi sunmak için bulut tabanlı LLM'ler gerektirecek. Ancak, cihazda 'son mil' modeline izin verme yönündeki bu değişim, LLM'lerin daha küçük görevleri ele alma, geri bildirim döngülerini azaltma ve yerel veri zenginleştirme sağlama yükünü azaltmaya yardımcı olabilir."

"Sonuç olarak," diye devam etti, "son kullanıcı açıkça kazanan olacak, çünkü bu, cihazlarında yeni nesil yeteneklere ve ön uç uygulamalarının ve insanların dünyayla etkileşim kurma biçiminin daha umut verici bir şekilde elden geçirilmesine olanak tanıyacak."

"Her zamanki şüpheliler, herkesin günlük yaşamları üzerinde umut verici bir potansiyel etkiyle bu sektörde inovasyonu yönlendirirken," diye ekledi, "SLM'ler, verileri ve meta verileri benzeri görülmemiş bir düzeyde toplayabilen modellere sahip olarak günlük yaşamlarımıza müdahalede yeni bir karmaşıklık düzeyi sağlayan bir Truva Atı da olabilir. Uygun güvenlik önlemleriyle bu çabaları üretken bir sonuca yönlendirebileceğimizi umuyoruz."