Anthropic ve OpenAI: Yapay Zeka Savaşı Bilim Dünyasında

Yazar:

Lockridge Okoth

Güncelleyen:

Mohammad Shahid

30 Haziran 2026, 22:43 TRT

Anthropic Claude Science’ı başlattı: 60’tan fazla bilimsel veritabanına bağlı bir yapay zeka çalışma alanı.
OpenAI, GeneBench-Pro adlı yeni bir yapay zeka değerlendirme kriteri yayımladı. Bu kriter, hesaplamalı biyoloji alanındaki yapay zeka yargılarını ölçüyor.
OpenAI'nin en iyi modeli GeneBench-Pro'nun biyoloji sorularının sadece %28,7'sini geçti.

Anthropic ve OpenAI, salı günü rekabetlerine yeni bir cephe açıyor: Her iki dev de bilimsel araştırmaları hedefledi. Anthropic, araştırmacılar için geliştirdiği yapay zeka platformu Claude Science’ı tanıttı. OpenAI ise hesaplamalı biyolojiye yönelik ölçüm aracı GeneBench-Pro’yu piyasaya sürdü.

Aynı gün gelen bu hamleler, yapay zeka yarışını sohbet botları ve kodlama sınırlarının ötesine laboratuvar ortamına taşıyor. Bir şirket bilim insanlarının hemen kullanabileceği bir araç sunarken diğeri, teknolojinin gideceği yolu ölçen bir kıstas oluşturarak farkını gösteriyor.

Sponsorlu

Claude Science Ne Sunuyor?

Claude Science, bilim insanlarının kullandığı veritabanlarını, kodu ve işlem gücünü tek bir uygulamada birleştiriyor. Genomik, proteomik ve kimya enformatiği gibi alanlarda 60’tan fazla bilimsel veritabanını bağlıyor.

Introducing Claude Science, a new app designed with every stage of research in mind.

Artifacts traced to their code, environments managed on demand, and 60+ optional scientific databases that you can connect.

Available now in beta. pic.twitter.com/HKhLknxLJO
— Claude (@claudeai) June 30, 2026

Claude Science, yeni bir model değil, bir uygulama olarak karşımıza çıkıyor. Anthropic’in en güçlü Fable 5 ve Mythos 5 modelleri hâlâ ABD’nin ihracat kuralları gereği sınırlandırılmış durumda. Uygulamada üretilen her sonucun izlenebilir olması ve hangi kodla ortaya çıktığının görünmesi, şeffaflık sağlıyor.

Bu platform, Anthropic’in ekim 2025’te başladığı yaşam bilimleri vizyonunu ileriye taşıyor. Beta sürecinde Allen Institute’tan Jérôme Lecoq, daha önce iki yıl süren incelemeleri günlere sığdırmayı başardı.

Anthropic ayrıca 50’ye kadar araştırma projesine, her biri 30.000 dolar’a varan kredi desteği sunacak.

GeneBench-Pro ile Seviyeyi OpenAI Yükseltti

Anthropic’in Claude Science’ı açıklamasının hemen ardından OpenAI da GeneBench-Pro’yu tanıttı. Bu benchmark, yapay zeka agent’larının gerçek biyoloji araştırmalarında gerekebilecek kararları ne kadar doğru verebildiğini ölçüyor.

We’re introducing GeneBench-Pro, a research-level benchmark for a harder kind of AI progress: how well agents can navigate messy biological data, choose the right analysis path, and make judgment calls that real computational research depends on.https://t.co/AsilnnSxnE
— OpenAI (@OpenAI) June 30, 2026

Sponsorlu

Benchmark’ta genomik, kantitatif biyoloji ve translasyonel tıp alanlarında toplam 129 problem yer alıyor.

OpenAI’in en güçlü modeli GPT-5.6 Sol, en üst düzey akıl yürütme seviyesinde soruların %28,7’sini doğru yanıtladı. Pro modda ise başarı oranı %31,5’e yükseldi. Şirketin daha önceki aşamalı GPT-5.6 lansmanı ise Washington’un talebiyle yapılmıştı.

GPT-5 ilk GeneBench’te %5’in altında kalırken, Anthropic’in Opus 4.8 modeli zorluk seviyesi daha yüksek testte %16’lık başarıya ulaştı.

En güncel gelişmelere anında ulaşmak için bizi X’te takip edin

İki Strateji, Tek Yarış

Tablo, aynı amaca giden iki ayrı yolun varlığını gösteriyor. Anthropic, laboratuvarların günlük kullanımı için yeni bir ürün sunuyor. OpenAI ise yapay zekanın gerçek hayattaki karmaşık veriler karşısında ne kadar isabetli kararlar alabildiğini kıyaslıyor.

Her iki lansman da Çin merkezli modellerin araştırmalardaki yükselişi gündemdeyken geldi. Ancak OpenAI’in kendi rakamları, bu alandaki beklentiyi bir parça aşağı çekiyor: En iyi modelleri dahi GeneBench-Pro’daki problemlerin çoğunda başarısız oluyor.

Baskı hem jeopolitik hem bilimsel düzeyde hissediliyor. ABD’nin ihracat kısıtlamaları Anthropic’i farklı ülkelerde ana sunucu aramaya yönlendirdi.

Değerlendiriciler, GeneBench-Pro’daki her problemin bir insan uzmandan 20 ila 40 saat alacağını ve binlerce dolar’a mal olacağını hesapladı. OpenAI, modelinin aynı analizleri yalnızca birkaç dolar’a bitirebildiğini belirtiyor.

Yaşlanma biyolojisi uzmanı Aubrey de Grey, geniş çaplı faydalar için zaman gerekeceğini ancak yapay zekanın araştırmadaki darboğazları aşacağını düşünüyor.

Longevity Escape Velocity Foundation Başkanı ve Baş Bilim Sorumlusu Aubrey de Grey, BeInCrypto podcast’inde şu ifadeleri kullandı: Çok kısa bir süre içinde yapay zekanın özellikle ilaç geliştirme süreçlerinde belirleyici hız kısıtını ortadan kaldıracağını göreceğiz dedi.

De Grey, araştırmanın hız kazanmasının tedavi onaylarına dönüşmesinde ise düzenleyici süreçler ve toplumun risk algısının belirleyici olacağını da ekledi.

Araştırmacılardan Hızlı Benimseme Beklentisi

Bazı uzmanlara göre değişim şimdiden başladı bile. İmmünoloji profesörü Dr. Derya Unutmaz, aynı BeInCrypto yayında AI’ın kendi uzmanlık kararlarından daha iyi sonuç verdiğini aktardı.

‘Kendi alanımda 35 yıllık bir geçmişim var. Buna rağmen yapay zekaya, kendi fikirlerimden çok daha fazla güveniyorum’ dedi.

Bu güvenin kısa sürede klinik uygulamalara da yayılacağını öngörüyor.

‘Artık tıpta yapay zekayı kullanmamak hem etik dışı hem de çok yakında mesleki bir hata olarak kabul edilmeye başlanacak’ diye belirtti.

Ancak bu iyimserlik hâlâ benchmark sonuçlarının önünde gidiyor. Önümüzdeki aylarda bilim insanları bu araçları ne kadar hızla benimseyecek ve GeneBench-Pro skorları yükselişe geçecek mi, göreceğiz.