AI Alanında Kaos: Büyük Model Çağında Yüzlerce Model Savaşı
Geçen ay, AI dünyasında bir "hayvan savaşı" yaşandı. Bir taraf, geliştiriciler tarafından oldukça beğenilen Meta'nın Llama modeli, diğer taraf ise Falcon adlı büyük modeldi. Falcon-40B'nin piyasaya sürülmesiyle Llama'yı geride bırakıp açık kaynaklı LLM sıralamasında zirveye çıktı ve taraflar sırasıyla sıralamayı yükseltti. İlginçtir ki, Falcon'un geliştiricisi bir teknoloji şirketi değil, Birleşik Arap Emirlikleri'nde bulunan bir araştırma enstitüsü.
Artık AI alanı, birçok rakibin bulunduğu bir aşamaya girdi. Birçok ülke ve şirket kendi büyük dil modellerini oluşturuyor, Körfez bölgesinde birden fazla oyuncu var. Bazıları, yüksek zorlukta bir teknoloji olan büyük model girişimlerinin, "her ülkenin bir modeli var ve her biri on binlerce ton verim sağlıyor" durumuna dönüştüğünü eleştiriyor.
Bu AI heyecanının kaynağı, 2017'de yayınlanan Transformer algoritmasına kadar uzanıyor. Bu, makinelerin uzun metinleri anlaması sorununu çözdü ve büyük modellerin akademik araştırmadan mühendislik sorununa dönüşmesini sağladı. Yeterli hesaplama gücü ve veri olduğu sürece, teknik beceriye sahip herhangi bir şirket büyük modeller geliştirebilir.
Ancak, girişin kolay olması başarıyı da kolaylaştırmaz. Açık kaynak büyük modellerin temel rekabet gücü, yalnızca performans artışından ziyade aktif bir geliştirici topluluğundadır. Aynı zamanda, çoğu büyük modelin çıkarım yetenekleri hala GPT-4'ün seviyesine ulaşmakta zorlanıyor.
Büyük bir zorluk, iş modelidir. Sınırlı istisnalar dışında, çoğu AI şirketi kârlılık yolunu henüz bulamadı. Yüksek hesaplama maliyetleri sektörün gelişiminde bir engel haline geldi. Microsoft ve Adobe gibi teknoloji devleri bile, AI ürünlerinde kârlılık sağlamakta zorlanıyor.
Genel olarak, büyük model çağının geldiği görülüyor, ancak bunu nasıl paraya çevireceğimiz hâlâ bir muamma. Gelecekte, gerçek değer belki de modelin kendisinde değil, model temelinde geliştirilen uygulamalarda yatıyor. Tıpkı iPhone 4'ün başarısının yalnızca işlemciden değil, aynı zamanda zengin uygulama ekosisteminden kaynaklandığı gibi.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
8 Likes
Reward
8
4
Share
Comment
0/400
PumpingCroissant
· 23h ago
Her firma birbirini öldürmeye çalışıyor ama sonunda hepsi para harcıyor.
View OriginalReply0
¯\_(ツ)_/¯
· 07-19 23:52
Para kazanamazsan kimse oynamaz.
View OriginalReply0
RektButSmiling
· 07-19 23:45
Ne para kazandırıyor, diğer her şey boşuna.
View OriginalReply0
PositionPhobia
· 07-19 23:45
Paraları saymaktan ellerim yumuşadı! Hala Açık Kaynak mı?
Büyük model döneminde rekabet: AI yarışması artıyor, ticarileşme hala aşılması gereken bir engel.
AI Alanında Kaos: Büyük Model Çağında Yüzlerce Model Savaşı
Geçen ay, AI dünyasında bir "hayvan savaşı" yaşandı. Bir taraf, geliştiriciler tarafından oldukça beğenilen Meta'nın Llama modeli, diğer taraf ise Falcon adlı büyük modeldi. Falcon-40B'nin piyasaya sürülmesiyle Llama'yı geride bırakıp açık kaynaklı LLM sıralamasında zirveye çıktı ve taraflar sırasıyla sıralamayı yükseltti. İlginçtir ki, Falcon'un geliştiricisi bir teknoloji şirketi değil, Birleşik Arap Emirlikleri'nde bulunan bir araştırma enstitüsü.
Artık AI alanı, birçok rakibin bulunduğu bir aşamaya girdi. Birçok ülke ve şirket kendi büyük dil modellerini oluşturuyor, Körfez bölgesinde birden fazla oyuncu var. Bazıları, yüksek zorlukta bir teknoloji olan büyük model girişimlerinin, "her ülkenin bir modeli var ve her biri on binlerce ton verim sağlıyor" durumuna dönüştüğünü eleştiriyor.
Bu AI heyecanının kaynağı, 2017'de yayınlanan Transformer algoritmasına kadar uzanıyor. Bu, makinelerin uzun metinleri anlaması sorununu çözdü ve büyük modellerin akademik araştırmadan mühendislik sorununa dönüşmesini sağladı. Yeterli hesaplama gücü ve veri olduğu sürece, teknik beceriye sahip herhangi bir şirket büyük modeller geliştirebilir.
Ancak, girişin kolay olması başarıyı da kolaylaştırmaz. Açık kaynak büyük modellerin temel rekabet gücü, yalnızca performans artışından ziyade aktif bir geliştirici topluluğundadır. Aynı zamanda, çoğu büyük modelin çıkarım yetenekleri hala GPT-4'ün seviyesine ulaşmakta zorlanıyor.
Büyük bir zorluk, iş modelidir. Sınırlı istisnalar dışında, çoğu AI şirketi kârlılık yolunu henüz bulamadı. Yüksek hesaplama maliyetleri sektörün gelişiminde bir engel haline geldi. Microsoft ve Adobe gibi teknoloji devleri bile, AI ürünlerinde kârlılık sağlamakta zorlanıyor.
Genel olarak, büyük model çağının geldiği görülüyor, ancak bunu nasıl paraya çevireceğimiz hâlâ bir muamma. Gelecekte, gerçek değer belki de modelin kendisinde değil, model temelinde geliştirilen uygulamalarda yatıyor. Tıpkı iPhone 4'ün başarısının yalnızca işlemciden değil, aynı zamanda zengin uygulama ekosisteminden kaynaklandığı gibi.