Yapay zekada küçük dil modellerinden büyük kâr dönemi

Microsoft, Meta ve Google, daha az parametreye sahip, oluşturulması ve eğitilmesi daha ucuz olan yeni sürümler yayınladı. Şirketler bu küçük dil modellerinden büyük kârlar elde ediyor.

Ekonomi

Yapay zeka ürünlerini güçlendirmek amacıyla büyük dil modelleri oluşturmak için milyarlarca dolar harcayan yapay zeka şirketleri artık gelirlerini artırmak için küçük dil modellerine yöneldi.

Apple, Microsoft, Meta ve Google kısa bir süre önce daha az parametre içeren ancak yine de güçlü yeteneklere sahip yeni yapay zeka modellerini piyasaya sürdü.

Genel olarak, parametre sayısı ne kadar yüksek olursa, yapay zeka yazılımının performansı o kadar iyi olur ve görevleri o kadar karmaşık ve incelikli olabilir. OpenAI’nin en son modeli GPT-4o ve Google’ın bu hafta duyurduğu Gemini 1.5 Pro’nun 1 milyondan fazla parametreye sahip olduğu tahmin ediliyor ve Meta, açık kaynaklı Llama modelinin 400 milyar parametreli bir versiyonunu eğitiyor.

PAHALI BULUNUNCA UCUZ VERSİYONUNU YAPTILAR

Ancak şirketler, kurumsal müşterileri üretken yapay zeka ürünlerini çalıştırmak için gereken büyük meblağları ödemeye ikna etmekte zorlanmaya başladı.

Bu durum Meta ve Google gibi teknoloji gruplarını, sadece birkaç milyar parametreye sahip küçük dil modelleri üretmeye itti. Şirketler küçük dil modellerini, hassas verileri de koruyabilen daha ucuz, enerji tasarruflu, özelleştirilebilir alternatifler olarak sunmaya başladı.

Google, Meta, Microsoft ve Fransız start-up Mistral, ilerleyen yetenekler gösteren ve belirli uygulamalara daha iyi odaklanabilen küçük dil modelleri de yayınladı.

Meta’nın küresel ilişkiler başkanı Nick Clegg, Llama 3’ün yeni 8 milyar parametreli modelinin GPT-4 ile karşılaştırılabilir olduğunu söyleyerek “Bence aklınıza gelebilecek hemen hemen her ölçümde üstün performans görüyorsunuz” dedi.

Microsoft ise 7 milyar parametreye sahip Phi-3-küçük modelinin OpenAI modelinin önceki bir versiyonu olan GPT-3.5’ten daha iyi performans gösterdiğini söyledi.

CEP TELEFONLARINDA DA ÇALIŞIYOR

Daha küçük modeller aynı zamanda yapay zeka özelliklerinin cep telefonu gibi cihazlarda çalışmasına da olanak tanıyor. Microsoft’tan Boyd, daha küçük modellerin “telefonlara ve dizüstü bilgisayarlara kadar ilginç uygulamalara” yol açacağını söyledi.

Ayrıca Apple da en çok satan iPhone’unda çalışacak yapay zeka modelleri geliştirdiğini ima etti. Geçtiğimiz ay Silikon Vadisi devi, metin tabanlı görevleri yerine getirmek üzere tasarlanmış küçük bir model olan OpenELM modelini piyasaya sürdü.

OpenAI başkanı Sam Altman kasım ayında yaptığı açıklamada San Francisco merkezli start-up’ın müşterilerine “ayrı amaçlara hizmet eden” farklı boyutlarda yapay zeka modelleri sunduğunu ve bu seçenekleri oluşturmaya ve satmaya devam edeceğini söyledi. Atman, “Daha küçük modellerin gerçekten iyi çalışacağı bazı şeyler var” diye ekledi.

Bununla birlikte Altman, OpenAI’nin akıl yürütme, görevleri planlama ve yürütme ve nihayetinde insan düzeyinde zekaya ulaşma yeteneği de dahil olmak üzere ölçeklendirilmiş yeteneklere sahip daha büyük yapay zeka modelleri oluşturmaya odaklanmaya devam edeceğini de söyledi.

ETİKETLER:

BU KONUYU SOSYAL MEDYA HESAPLARINDA PAYLAŞ