Elon Musk tarafından kurulan xAI şirketi, yapay zeka alanında önemli bir adım atmaya hazırlanıyor. Mart 2023’te hayata geçirilen Grok adlı sohbet botu için geliştirilen Grok-1.5 modeli, sektörde büyük bir heyecan yarattı. Bu yeni model, OpenAI tarafından geliştirilen GPT-4’ü geride bırakacak gibi görünüyor.
Gelişmiş Yetenekler ve Başarı Oranları
Grok-1.5, görsel işleme yetenekleriyle dikkat çekiyor. Artık belgeler, diyagramlar, çizelgeler, ekran görüntüleri ve fotoğrafları anlayabiliyor. Modelin tabloyu CSV’ye dönüştürme, koddaki hatayı çözme, diyagramı kodu dönüştürme gibi yetenekleriyle öne çıktığı belirtiliyor.
xAI tarafından gerçekleştirilen testlerde Grok-1.5, yüzde 53.6 başarı elde etti. Matematikle ilgili testlerde ise GPT-4’ü geride bırakarak yüzde 52.8 oranında başarı sağladı. Ayrıca metin okuma ve anlama ile gerçek dünya anlayışı testlerinde de rakiplerini zorlayan bir performans sergiledi.
Benchmark | Grok-1.5 | GPT-4 | Claude 3 Sonnet | Claude 3 Opus | Gemini Pro 1.5 |
---|---|---|---|---|---|
MMMU (Çok Disiplinli) | 53.6% | 56.8% | 53.1% | 59.4% | 58.5% |
Matematik | 52.8% | 49.9% | 47.9% | 50.5% | 52.1% |
AI2D | 88.3% | 78.2% | 88.7% | 88.1% | 80.3% |
Metin Okuma | 78.1% | 78.0% | – | – | 73.5% |
ChartQA | 76.1% | 78.5% | 81.1% | 80.8% | 81.3% |
Belgeler | 85.6% | 88.4% | 89.5% | 89.3% | 86.5% |
Gerçek Dünya Anlayışı | 68.7% | 61.4% | 51.9% | 49.8% | 67.5% |
Grok-1.5 modeli, xAI tarafından yakın zamanda test edilecek ve X’teki Grok sohbet botuna entegre edilecek. Bu yeni modelin yetenekleriyle ilgili düşüncelerinizi paylaşmaktan çekinmeyin. İleriye dönük yapay zeka alanındaki gelişmeleri heyecanla bekliyoruz.
0 Yorum