ChatGPT-4 artık en düzgünü değil! Bu yapay zeka solladı
Yapay zeka dünyasında kıyasıya rekabet devam ediyor. OpenAI’ın GPT-4 tabanlı modeli son vakitlerin en güçlü modeli olarak gösterilse de, yeni testler bunun geride kaldığını ortaya koydu. Pekala en âlâ yapay zeka modeli hangisi?
Claude-3 vs ChatGPT-4: En düzgün yapay zeka modeli
Yapay zeka sistemlerinin performansını takip eden LMSys Chatbot Arena Leaderboard, Anthropic tarafından geliştirilen Claude-3 Opus modelinin en yüksek puan aldığını ortaya koydu. Bu da uzun yıllardır önder olan GPT-4’ün geride kaldığını gösteriyor.
Liderlik Tablosu, “sohbet savaşları” sırasında heyetler tarafından değerlendirildi. Farklı mevzulardan çeşitli komutlar girerek sohbet botlarını test eden heyetler, karşılaştırma için Elo derecelendirme sistemini kullandı.
Claude-3 Opus, son derecelendirme güncellemesinde 1253 Elo puanıyla tepeye yerleşti. İkinci ve üçüncü sırada ise sırasıyla 1251 ve 1248 puanlarıyla OpenAI GPT-4 önizleme modelleri yer aldı.
Sıralamanın geri kalanında ise Google Gemini Pro modeli 1203 puanla dördüncü, Anthropic’in daha evvelki Claude-3 Sonnet modeli 1198 puanla beşinci oldu. Ayrıyeten Çinli şirket Alibaba’nın Qwen1.5 modeli ise 1148 ile dokuzuncu sırada yer aldı.
İşte en âlâ yapay zeka modeli listesi:
- Claude 3 Opus – 1253
- GPT-4-1106-preview – 1251
- GPT-4-0125-preview – 1248
- Bard (Gemini Pro) – 1203
- Claude 3 Sonnet – 1196
- GPT-4-0314 – 1193
- Claude 3 Haiku – 1181
- GPT-4-0613 – 1174
- Mistral-Large-2402 – 1153
- Qwen1.5-72B-Chat – 1153
GPT-4 geçen yıl piyasaya sürüldüğünde epeyce yüksek bir standart belirlemişti. Lakin Anthropic geliştiricileri, model eğitimlerinde GPT-4’ü aşmayı başarmış üzere duruyor. Claude Opus, sohbet savaşında +5/-5’lik skor elde ederek rekor da kırdı.