ChatGPT-4 artık en düzgünü değil! Bu yapay zeka solladı

Yapay zeka dünyasında kıyasıya rekabet devam ediyor. OpenAI’ın GPT-4 tabanlı modeli son vakitlerin en güçlü modeli olarak gösterilse de, yeni testler bunun geride kaldığını ortaya koydu. Pekala en âlâ yapay zeka modeli hangisi?

Claude-3 vs ChatGPT-4: En düzgün yapay zeka modeli

Yapay zeka sistemlerinin performansını takip eden LMSys Chatbot Arena Leaderboard, Anthropic tarafından geliştirilen Claude-3 Opus modelinin en yüksek puan aldığını ortaya koydu. Bu da uzun yıllardır önder olan GPT-4’ün geride kaldığını gösteriyor.

Liderlik Tablosu, “sohbet savaşları” sırasında heyetler tarafından değerlendirildi. Farklı mevzulardan çeşitli komutlar girerek sohbet botlarını test eden heyetler, karşılaştırma için Elo derecelendirme sistemini kullandı.

Claude-3 Opus, son derecelendirme güncellemesinde 1253 Elo puanıyla tepeye yerleşti. İkinci ve üçüncü sırada ise sırasıyla 1251 ve 1248 puanlarıyla OpenAI GPT-4 önizleme modelleri yer aldı.

Sıralamanın geri kalanında ise Google Gemini Pro modeli 1203 puanla dördüncü, Anthropic’in daha evvelki Claude-3 Sonnet modeli 1198 puanla beşinci oldu. Ayrıyeten Çinli şirket Alibaba’nın Qwen1.5 modeli ise 1148 ile dokuzuncu sırada yer aldı.

İşte en âlâ yapay zeka modeli listesi:

  1. Claude 3 Opus – 1253
  2. GPT-4-1106-preview – 1251
  3. GPT-4-0125-preview – 1248
  4. Bard (Gemini Pro) – 1203
  5. Claude 3 Sonnet – 1196
  6. GPT-4-0314 – 1193
  7. Claude 3 Haiku – 1181
  8. GPT-4-0613 – 1174
  9. Mistral-Large-2402 – 1153
  10. Qwen1.5-72B-Chat – 1153

GPT-4 geçen yıl piyasaya sürüldüğünde epeyce yüksek bir standart belirlemişti. Lakin Anthropic geliştiricileri, model eğitimlerinde GPT-4’ü aşmayı başarmış üzere duruyor. Claude Opus, sohbet savaşında +5/-5’lik skor elde ederek rekor da kırdı.

Exit mobile version