Çin’in DeepSeek’i Nedir ve Yapay Zeka Dünyasını Neden Korkutuyor?

Bir yıldan biraz daha eski bir Çinli yapay zeka teşebbüsü olan DeepSeek, dünyanın en güzel sohbet robotlarıyla karşılaştırılabilir performansı görünüşte çok daha düşük bir maliyetle sunan çığır açıcı yapay zeka modellerini gösterdikten sonra Silikon Vadisi’nde şaşkınlık ve dehşet yarattı.
New York’tan Londra ve Tokyo’ya, pay senetleri darbe aldı; Nvidia %13’e varan bir düşüş yaşarken Nasdaq ve S&P de geriledi. DeepSeek’in en son yapay zeka modeli hafta sonu Apple’ın App Store listelerinde doruğa yükselerek OpenAI üzere daha kıymetli modellere karşı gözle görülür bir meydan okuma ortaya koydu ve Microsoft, Meta ve Alphabet üzere şirketlerin teknoloji için planladıkları yüz milyarlarca dolarlık harcama konusunda soru işaretleri yarattı.
DeepSeek’in ortaya çıkışı, yapay zekanın geleceğinin geliştirilmesi için giderek artan ölçülerde güç ve güç gerektireceğine dair yaygın inanca bir zıt görüş sunabilir.
DeepSeek’in inovasyonu etrafındaki heyecan çığ üzere büyürken ve yatırımcılar ABD merkezli rakipleri ve onların donanım tedarikçileri üzerindeki tesirlerini sindirmeye başlarken, global teknoloji payları Ocak ayı sonlarında düşüşe geçti.
DeepSeek tam olarak nedir?
DeepSeek, 2023 yılında yapay zeka odaklı kantitatif hedge fonu High-Flyer’ın başkanı Liang Wenfeng tarafından kuruldu. Şirket açık kaynaklı yapay zeka modelleri geliştiriyor, yani geliştirici topluluğu yazılımı inceleyip güzelleştirebiliyor. Taşınabilir uygulaması, Ocak ayı başında piyasaya sürüldükten sonra ABD’de iPhone indirme listelerinde tepeye yükseldi.
Uygulama, OpenAI’nin ChatGPT’si üzere öbür sohbet robotlarından, bir soruya karşılık vermeden evvel münasebetini söz ederek ayrılıyor. Şirket, R1 sürümünün OpenAI’nin en son sürümüyle eşit performans sunduğunu sav ediyor ve teknolojiyi kullanarak sohbet robotları geliştirmekle ilgilenen bireylere bunun üzerine inşa etmeleri için lisans verdi.
DeepSeek R1, OpenAI yahut Meta AI ile nasıl karşılaştırılır?
Şirket tarafından tam olarak detaylandırılmamış olsa da, DeepSeek’in modellerini eğitme ve geliştirme maliyetinin OpenAI yahut Meta Platforms Inc.’in en yeterli eserleri için gerekenin sırf bir kısmı olduğu görülüyor. Modelin çok daha verimli olması, Nvidia Corp. üzere şirketlerden en yeni ve en güçlü yapay zeka hızlandırıcılarını satın almak için büyük sermaye harcamalarına duyulan gereksinimi sorgulatıyor. Bu tıpkı vakitte, DeepSeek’in temsil ettiği tipten bir atılımı engellemeyi amaçlayan ABD’nin Çin’e bu çeşit gelişmiş yarı iletkenlerin ihracatını kısıtlamasına olan ilgiyi de artırıyor.
DeepSeek, R1’in matematiksel vazifeler için AIME 2024, genel bilgi için MMLU ve soru-cevap performansı için AlpacaEval 2.0 üzere birçok önde gelen kıyaslamada rakip modellere yakın ya da onlardan daha düzgün olduğunu söylüyor. Ayrıyeten UC Berkeley’e bağlı Chatbot Arena isimli bir liderlik tablosunda da en düzgün performans gösterenler ortasında yer alıyor.
ABD’de alarm çaldıran nedir?
Washington, ABD-Çin ortasındaki teknoloji üstünlüğü yarışında ülkenin yapay zeka alanındaki ilerlemelerini durdurmak gayesiyle Çin’e GPU yarı iletkenleri üzere yüksek teknolojilerin ihracatını yasakladı. Lakin DeepSeek’in kaydettiği ilerleme, Çinli yapay zeka mühendislerinin kısıtlamaları aşarak hudutlu kaynaklarla daha fazla verimliliğe odaklandıklarını gösteriyor. DeepSeek’in ne kadar gelişmiş yapay zeka eğitim donanımına erişimi olduğu belirsizliğini korusa da, şirket ticari kısıtlamaların Çin’in ilerlemesini engellemede büsbütün tesirli olmadığını göstermeye yetecek kadar yol kat etti.
DeepSeek ne vakit global ilgi uyandırdı?
Yapay zeka geliştiricisi, 2023’te birinci modelinin piyasaya sürülmesinden bu yana yakından izleniyor. Akabinde Kasım ayında, insan kanısını taklit etmek için tasarlanan DeepSeek R1 akıl yürütme modelini dünyaya tanıttı. Bu model, Ocak ayında web arayüzüyle birlikte çok daha ucuz bir OpenAI alternatifi olarak global üne kavuşan taşınabilir chatbot uygulamasının temelini oluşturuyor ve yatırımcı Marc Andreessen bunu “AI’nin Sputnik anı” olarak nitelendiriyor.
Pazar takipçisi App Figures’ün bilgilerine nazaran DeepSeek taşınabilir uygulaması 25 Ocak’a kadar 1,6 milyon sefer indirildi ve Avustralya, Kanada, Çin, Singapur, ABD ve İngiltere’deki iPhone uygulama mağazalarında 1 numaraya yerleşti.
DeepSeek’in kurucusu kimdir?
1985’te Guangdong’da doğan Liang, Zhejiang Üniversitesi’nden elektronik ve bilgi mühendisliği alanında lisans ve yüksek lisans dereceleri aldı. Tianyancha şirket data tabanına nazaran DeepSeek’i 10 milyon yuan (1,4 milyon $) kayıtlı sermaye ile kurdu.
Liang, Çin yayın organı 36kr ile yaptığı bir röportajda, daha fazla ilerlemenin önündeki darboğazın daha fazla bağış toplamak değil, ABD’nin en düzgün çiplere erişim konusundaki kısıtlamaları olduğunu söyledi. Liang, en düzgün araştırmacılarının birçoklarının Çin’in en uygun üniversitelerinden yeni mezun olduğunu belirterek, Çin’in Nvidia ve yapay zeka çipleri etrafında inşa edilene misal kendi mahallî ekosistemini geliştirmesi gerektiğini vurguladı.
“Daha fazla yatırım kesinlikle daha fazla inovasyona yol açmaz. Aksi takdirde büyük şirketler tüm inovasyonu ele geçirir,” diyor Liang.
DeepSeek Çin’in yapay zeka dünyasında nerede duruyor?
Alibaba Group Holding Ltd. ve Baidu Inc’den Tencent Holdings Ltd’ye kadar Çin’in teknoloji önderleri, yapay zeka teşebbüsleri için donanım ve müşteri edinme yarışına kıymetli ölçüde para ve kaynak aktardı. Kai-Fu Lee’nin 01.AI teşebbüsünün yanı sıra DeepSeek, bu geniş kitlenin üzerinde para kazanma stratejileri geliştirmeden evvel en fazla sayıda kullanıcıyı süratle işe almak için tasarlanan açık kaynak yaklaşımıyla öne çıkıyor.
DeepSeek’in modelleri daha uygun fiyatlı olduğu için, daha büyük oyuncuların son bir buçuk yıl içinde arka arda fiyat indirimleri dalgalarına sahne olan bir fiyat savaşına girdiği Çin’deki yapay zeka geliştiricileri için maliyetlerin düşürülmesine yardımcı olmada rol oynadı bile.
Bunun global YZ pazarı üzerindeki tesirleri nelerdir?
DeepSeek’in başarısı OpenAI ve öteki ABD’li sağlayıcıları yerleşik liderliklerini korumak için fiyatlarını düşürmeye itebilir. Ayrıyeten, daha verimli modellerin çok daha küçük bir harcama ile rekabet edebilmesi durumunda, Meta ve Microsoft Corp. üzere şirketlerin – her biri bu yıl büyük ölçüde yapay zeka altyapısı için 65 milyar dolar yahut daha fazla sermaye harcaması yapmayı taahhüt eden – büyük harcamalarını da sorguluyor.
Bu durum, yatırımcıların Nvidia Corp. ve ASML Holding NV üzere yapay zeka hizmetlerine yönelik artan talepten yararlanan şirketleri satmasıyla global borsaları sarstı. Iflytek Co. üzere DeepSeek ile irtibatlı Çinli isimlerin payları tırmandı.
Şimdiden, dünyanın dört bir yanındaki geliştiriciler DeepSeek’in yazılımını deniyor ve onunla araçlar geliştirmeye çalışıyor. Bu durum, gelişmiş yapay zeka muhakeme modellerinin benimsenmesini hızlandırabilir ve birebir vakitte bu modellerin kullanımına ait korkuluklara duyulan gereksinime dair tasaları de artırabilir. DeepSeek’in ilerlemeleri, YZ’nin nasıl geliştirildiğini denetim etmek için düzenlemeleri hızlandırabilir.
DeepSeek’in eksiklikleri nelerdir?
Diğer tüm Çinli yapay zeka modelleri üzere DeepSeek de Çin’de hassas kabul edilen mevzularda oto-sansür uyguluyor. DeepSeek, 1989 Tiananmen Meydanı protestoları ya da Çin’in Tayvan’ı işgal etme mümkünlüğü üzere jeopolitik açıdan telaş verici sorularla ilgili soruları geçiştiriyor. DeepSeek botu testlerde Hindistan Başbakanı Narendra Modi üzere siyasi figürler hakkında detaylı cevaplar verebiliyor, ancak Çin Devlet Başkanı Xi Jinping hakkında bunu yapmayı reddediyor.
DeepSeek’in bulut altyapısı bu ani popülaritesi nedeniyle test edilecek üzere görünüyor. Şirket 27 Ocak’ta kısa müddetliğine büyük bir kesinti yaşadı ve yeni ve geri dönen kullanıcılar sohbet robotuna daha fazla sorgu gönderdikçe daha da fazla trafiği yönetmek zorunda kalacak.
Bloomberg çeviri