ChatGPT-4 artık en düzgünü değil! Bu yapay zeka solladı

Mart 27, 2024

chatgpt 4 artik en duzgunu degil bu yapay zeka solladi J84Du5mi

Yapay zeka dünyasında kıyasıya rekabet devam ediyor. OpenAI’ın GPT-4 tabanlı modeli son vakitlerin en güçlü modeli olarak gösterilse de, yeni testler bunun geride kaldığını ortaya koydu. Pekala en âlâ yapay zeka modeli hangisi?

Claude-3 vs ChatGPT-4: En düzgün yapay zeka modeli

Yapay zeka sistemlerinin performansını takip eden LMSys Chatbot Arena Leaderboard, Anthropic tarafından geliştirilen Claude-3 Opus modelinin en yüksek puan aldığını ortaya koydu. Bu da uzun yıllardır önder olan GPT-4’ün geride kaldığını gösteriyor.

Liderlik Tablosu, “sohbet savaşları” sırasında heyetler tarafından değerlendirildi. Farklı mevzulardan çeşitli komutlar girerek sohbet botlarını test eden heyetler, karşılaştırma için Elo derecelendirme sistemini kullandı.

Claude-3 Opus, son derecelendirme güncellemesinde 1253 Elo puanıyla tepeye yerleşti. İkinci ve üçüncü sırada ise sırasıyla 1251 ve 1248 puanlarıyla OpenAI GPT-4 önizleme modelleri yer aldı.

Sıralamanın geri kalanında ise Google Gemini Pro modeli 1203 puanla dördüncü, Anthropic’in daha evvelki Claude-3 Sonnet modeli 1198 puanla beşinci oldu. Ayrıyeten Çinli şirket Alibaba’nın Qwen1.5 modeli ise 1148 ile dokuzuncu sırada yer aldı.

İşte en âlâ yapay zeka modeli listesi:

Claude 3 Opus – 1253
GPT-4-1106-preview – 1251
GPT-4-0125-preview – 1248
Bard (Gemini Pro) – 1203
Claude 3 Sonnet – 1196
GPT-4-0314 – 1193
Claude 3 Haiku – 1181
GPT-4-0613 – 1174
Mistral-Large-2402 – 1153
Qwen1.5-72B-Chat – 1153

GPT-4 geçen yıl piyasaya sürüldüğünde epeyce yüksek bir standart belirlemişti. Lakin Anthropic geliştiricileri, model eğitimlerinde GPT-4’ü aşmayı başarmış üzere duruyor. Claude Opus, sohbet savaşında +5/-5’lik skor elde ederek rekor da kırdı.