Anthropic ve OpenAI, salı günü rekabetlerine yeni bir cephe açıyor: Her iki dev de bilimsel araştırmaları hedefledi. Anthropic, araştırmacılar için geliştirdiği yapay zeka platformu Claude Science’ı tanıttı. OpenAI ise hesaplamalı biyolojiye yönelik ölçüm aracı GeneBench-Pro’yu piyasaya sürdü.
Aynı gün gelen bu hamleler, yapay zeka yarışını sohbet botları ve kodlama sınırlarının ötesine laboratuvar ortamına taşıyor. Bir şirket bilim insanlarının hemen kullanabileceği bir araç sunarken diğeri, teknolojinin gideceği yolu ölçen bir kıstas oluşturarak farkını gösteriyor.
Claude Science Ne Sunuyor?
Claude Science, bilim insanlarının kullandığı veritabanlarını, kodu ve işlem gücünü tek bir uygulamada birleştiriyor. Genomik, proteomik ve kimya enformatiği gibi alanlarda 60’tan fazla bilimsel veritabanını bağlıyor.
Claude Science, yeni bir model değil, bir uygulama olarak karşımıza çıkıyor. Anthropic’in en güçlü Fable 5 ve Mythos 5 modelleri hâlâ ABD’nin ihracat kuralları gereği sınırlandırılmış durumda. Uygulamada üretilen her sonucun izlenebilir olması ve hangi kodla ortaya çıktığının görünmesi, şeffaflık sağlıyor.
Bu platform, Anthropic’in ekim 2025’te başladığı yaşam bilimleri vizyonunu ileriye taşıyor. Beta sürecinde Allen Institute’tan Jérôme Lecoq, daha önce iki yıl süren incelemeleri günlere sığdırmayı başardı.
Anthropic ayrıca 50’ye kadar araştırma projesine, her biri 30.000 dolar’a varan kredi desteği sunacak.
GeneBench-Pro ile Seviyeyi OpenAI Yükseltti
Anthropic’in Claude Science’ı açıklamasının hemen ardından OpenAI da GeneBench-Pro’yu tanıttı. Bu benchmark, yapay zeka agent’larının gerçek biyoloji araştırmalarında gerekebilecek kararları ne kadar doğru verebildiğini ölçüyor.
Benchmark’ta genomik, kantitatif biyoloji ve translasyonel tıp alanlarında toplam 129 problem yer alıyor.
OpenAI’in en güçlü modeli GPT-5.6 Sol, en üst düzey akıl yürütme seviyesinde soruların %28,7’sini doğru yanıtladı. Pro modda ise başarı oranı %31,5’e yükseldi. Şirketin daha önceki aşamalı GPT-5.6 lansmanı ise Washington’un talebiyle yapılmıştı.
GPT-5 ilk GeneBench’te %5’in altında kalırken, Anthropic’in Opus 4.8 modeli zorluk seviyesi daha yüksek testte %16’lık başarıya ulaştı.
En güncel gelişmelere anında ulaşmak için bizi X’te takip edin
İki Strateji, Tek Yarış
Tablo, aynı amaca giden iki ayrı yolun varlığını gösteriyor. Anthropic, laboratuvarların günlük kullanımı için yeni bir ürün sunuyor. OpenAI ise yapay zekanın gerçek hayattaki karmaşık veriler karşısında ne kadar isabetli kararlar alabildiğini kıyaslıyor.
Her iki lansman da Çin merkezli modellerin araştırmalardaki yükselişi gündemdeyken geldi. Ancak OpenAI’in kendi rakamları, bu alandaki beklentiyi bir parça aşağı çekiyor: En iyi modelleri dahi GeneBench-Pro’daki problemlerin çoğunda başarısız oluyor.
Baskı hem jeopolitik hem bilimsel düzeyde hissediliyor. ABD’nin ihracat kısıtlamaları Anthropic’i farklı ülkelerde ana sunucu aramaya yönlendirdi.
Değerlendiriciler, GeneBench-Pro’daki her problemin bir insan uzmandan 20 ila 40 saat alacağını ve binlerce dolar’a mal olacağını hesapladı. OpenAI, modelinin aynı analizleri yalnızca birkaç dolar’a bitirebildiğini belirtiyor.
Yaşlanma biyolojisi uzmanı Aubrey de Grey, geniş çaplı faydalar için zaman gerekeceğini ancak yapay zekanın araştırmadaki darboğazları aşacağını düşünüyor.
Longevity Escape Velocity Foundation Başkanı ve Baş Bilim Sorumlusu Aubrey de Grey, BeInCrypto podcast’inde şu ifadeleri kullandı: Çok kısa bir süre içinde yapay zekanın özellikle ilaç geliştirme süreçlerinde belirleyici hız kısıtını ortadan kaldıracağını göreceğiz dedi.
De Grey, araştırmanın hız kazanmasının tedavi onaylarına dönüşmesinde ise düzenleyici süreçler ve toplumun risk algısının belirleyici olacağını da ekledi.
Araştırmacılardan Hızlı Benimseme Beklentisi
Bazı uzmanlara göre değişim şimdiden başladı bile. İmmünoloji profesörü Dr. Derya Unutmaz, aynı BeInCrypto yayında AI’ın kendi uzmanlık kararlarından daha iyi sonuç verdiğini aktardı.
‘Kendi alanımda 35 yıllık bir geçmişim var. Buna rağmen yapay zekaya, kendi fikirlerimden çok daha fazla güveniyorum’ dedi.
Bu güvenin kısa sürede klinik uygulamalara da yayılacağını öngörüyor.
‘Artık tıpta yapay zekayı kullanmamak hem etik dışı hem de çok yakında mesleki bir hata olarak kabul edilmeye başlanacak’ diye belirtti.
Ancak bu iyimserlik hâlâ benchmark sonuçlarının önünde gidiyor. Önümüzdeki aylarda bilim insanları bu araçları ne kadar hızla benimseyecek ve GeneBench-Pro skorları yükselişe geçecek mi, göreceğiz.









