Indeks
Geçtiğimiz hafta sonu Çin'de geliştirilen DeepSeek adlı yapay zeka, teknoloji dünyasında heyecan yaratarak NVIDIA, Google, Meta ve Microsoft gibi Amerikan devlerinin hisse değerinin 1 trilyon dolardan fazla düşmesine neden oldu. Nasıl çalıştığını ve teknoloji dünyasını, özellikle de OpenAI'nin ChatGPT'sini nasıl etkileyebileceğini anlayın.
DeepSeek Nedir?

DeepSeek, 2023 yılında kurulan Çinli bir yapay zeka şirketidir. Liang WenfengÇinli girişimci ve niceliksel hedge fonunun kurucu ortağı Yüksek Uçan. Hisse senedi yatırımlarında makine öğrenimi tekniklerini kullanmasıyla ünlü olan bu fon, aynı zamanda şirketin yapay zeka araştırmasının da şu anki fon sağlayıcısıdır.
Şirket, 2023 yılından bu yana dil modellerinin veya LLM'lerin hızla gelişmesi nedeniyle küresel ilgi görüyor.
Düşük maliyetli geliştirme

Modellerin temel avantajı geliştirme maliyetleridir. Yakın zamanda yayınlanan bir makalede şirket, dil modelinin DeepSeek-V3 kullanılmış 2 bin NVIDIA H800 kartızaten nispeten eski olan, eğitim için toplam maliyet 5,5 milyon dolar.
Karşılaştırma yapmak gerekirse, bu, Meta'nın Llama 3.3 modelinin eğitim maliyetinin yalnızca küçük bir kısmıdır ve bu modelin yalnızca bu yıl XNUMX'den fazla harcaması beklenmektedir. %65 milyar dolar iyileştirilmesinde. Bu karşılaştırmada DeekpSeek'in maliyetleri, Meta'nın şirketindeki bazı yöneticilerin yıllık maaşlarından bile daha düşük çıkıyor. Analistlere göre maliyet düşüşleri etkileyici boyutlara ulaştı 95%.
Bu başarı, yapay zekaları eğitmek için veri merkezi altyapısına ve elektriğe yüksek yatırımların gerekli olacağı paradigmasına son veriyor ve DeepSeek'i yalnızca daha ucuz değil aynı zamanda ekolojik açıdan daha sürdürülebilir bir yapay zeka haline getiriyor.
Teorik olarak, yüksek yapay zeka talepleri için tasarlanmış çok pahalı GPU'lara sahip özel veri merkezleri kullanmak yerine DeepSeek modelleri, geleneksel GPU'lara sahip ev bilgisayarlarında bile eğitilebiliyor; bu da NVIDIA gibi şirketlerde hem şaşkınlık hem de korku yaratıyor. Bu pazardan pay almak isteyen şirketlerin son dönemde veri merkezleri kurma telaşı.

Bu nedenle, olarak bilinen şeyde “DeepSeek Panik Günü” ou “DeepSeek panik günü”, Ücretsiz çeviride, 27 Ocak, Amerikan yüksek teknoloji şirketlerinin borsası NASDAQ'taki hisselerin milyar dolarlık düşüşlerle damgasını vurdu ve toplam işlem görenlerin %3,5'ine ulaştı. ChatGPT'nin rakibi başarılı olmak için her şeye sahiptir.
DeepSeek-V3 ve DeepSeek-R1

Şirketin modelleri aynı zamanda verimlilik örneğidir. THE DeepSeek-V3Örneğin, birden fazla kıyaslamada etkileyici bir performans sunarken, Meta'nın Llama 3.3'ü gibi rakiplere göre önemli ölçüde daha az kaynak gerektirir. Ve DeepSeek-R1Ocak 2025'te piyasaya sürülen, muhakeme görevlerine odaklanıyor ve gelişmiş özellikleriyle OpenAI'nin o1 modeline meydan okuyor.
Temelde, her iki Çin yapay zeka modeli seçeneği de, insanların deneyim yoluyla öğrenmesine benzer şekilde, çevreleriyle etkileşime girerek ve eylemleri hakkında geri bildirim alarak öğreniyor. Bu onların gelişmesini sağlar daha karmaşık muhakeme becerileri ve yeni durumlara daha etkili bir şekilde uyum sağlayın. Bu yaklaşım aynı zamanda rakiplerin kullandığı "insan gözetiminde öğrenme" yönteminden de daha ucuzdur.
Bu Çin yapay zekasının bir diğer avantajı da kaynak tasarrufu. DeepSeek'in modelleri, bir sorguyu yanıtlamak için modelin tüm parametrelerini kullanmak yerine konu için yalnızca birkaç "belirli parametre" veya "uzman" seçer. Bu seçici aktivasyon, hesaplama maliyetlerini önemli ölçüde azaltır ve model verimliliğini artırır.

Bunu daha basit bir şekilde açıklamak gerekirse, her türlü görev için geniş bir uzman ekibinin bulunması, ancak yalnızca belirli bir durumda bunu gerçekleştirmeye en uygun olanların çağrılması, hizmette verimli kullanımın ve uzmanlığın garantilenmesi gibi bir şey olacaktır.
O DeepSeek-V3 aynı zamanda istihdam ediyor damıtma teknikleriBu, bilgi ve becerilerin daha büyük modellerden daha küçük, daha verimli modellere aktarıldığı anlamına gelir. Bu, bir öğretmenin bilgisini öğrencisine aktarması, öğrencinin benzer yeterliliğe sahip ancak daha az deneyim veya kaynakla görevleri yerine getirmesine izin vermesi gibidir.
Sonuç, akıllı telefonlar ve dizüstü bilgisayarlar gibi daha küçük cihazlarda çalışmak için yüksek verimliliğe sahip, daha az yer ve kaynak kaplayan bir yapay zekadır. Uygulamanın akıllı telefonlarda ve ayrıca web sürümünde kullanılabilir hale getirilmesi için şirket, DeepSeek R1'i temel olarak kullandı ve bunu bir uygulamaya dönüştürdü.
Açık kaynak modeli

Modeller, verimlilik ve performans tekniklerini birleştirmenin yanı sıra, tasarım projelerinin doğasında olan işbirliğinden de yararlanıyor. codigo aberto (veya açık kaynak, İngilizce).
Burada, yapay zekaların geliştirilmesi üzerinde özel olarak çalışan OpenAI gibi bir şirketin aksine, DeepSeek'in modellerinin kodları web üzerinde mevcuttur ve küresel geliştirici topluluğu tarafından erişilebilir, test edilebilir ve hatta düzeltilebilir; bu da daha fazla şeffaflık ve güvenlik anlamına gelir. Sunulan sonuçlara güven.
Aslında şirket, herkesi kendi modellerini test etmeye teşvik etmek istiyor ve diğer şirketlerin de bunları kullanmasını kolaylaştırmak için profesyonellerine yönelik lisanslar yayınlıyor.
Strateji aynı zamanda rekabet gücünü güçlendiriyor, yetenekleri çekiyor ve bir tür ücretsiz pazarlamada DeepSeek'in liderlik konumunu vurguluyor. Şirket bundan doğrudan yararlanmayacak ancak işbirlikçi ve yenilikçi bir ekosistemi desteklerken teknik destek veya premium sürümler gibi tamamlayıcı hizmetler aracılığıyla para kazanabilecek şekilde modelin kitlesel olarak benimsenmesinden yararlanacak.
Uygulama mağazalarında 1 numara

DeepSeek'e olan merak sadece CEO'lar ve teknoloji mühendisleri arasında değildi.
20 Ocak'ta piyasaya sürülen R1, iPhone'lar için DeepSeek uygulaması ve Android akıllı telefonlar, rakip ChatGPT'nin başarılı yolunu izliyor gibi görünüyor. Zaten Amerikan Apple App Store'da en çok indirilen uygulama ve Brezilya'da OpenAI rakibinin ardından ikinci uygulama.
Na Play Store, Android mağazasıBaşarı da inkar edilemez: Çin chatbotu dünya çapında bir milyondan fazla kez kuruldu.
OpenAI'nin kurucusu ve şu anki CEO'su Sam Altman, DeepSeek'in başarısından bahsetti. Çin yapay zekasının neler yapabileceğini takip ettiğini ve ilk modelin etkileyici olduğunu belirtti. Aşağıdaki tweet'lere ve çevirilere bakın.

Deepseek r1, özellikle fiyata göre sunabilecekleri şeyler açısından etkileyici bir model. Açıkçası çok daha iyi modeller sunacağız ve yeni bir rakibimizin olması da meşru bir şekilde yenileniyor! Bazı yayınlar yapacağız.
Ancak en önemlisi, hedeflerimizi gerçekleştirmeye devam etmekten heyecan duyuyoruz ve misyonumuzda başarılı olmak için daha fazla bilgi işlemin her zamankinden daha önemli olduğuna inanıyoruz.
Dünya çok fazla yapay zeka kullanmak isteyecek ve gelecek nesil modeller karşısında gerçekten şaşıracak. Size tüm AGI'yi ve ötesini sunmak için sabırsızlanıyoruz.
Sam Altman, Çin AI DeepSeek'in başarısı hakkında.
Çıkarımlar ve siyasi önyargı

Ancak başarı ile birlikte şüpheler de ortaya çıkar. Uzmanlar, DeepSeek modellerini eğitmek için kullanılan toplam GPU sayısının, ABD ile yaşanan ticaret savaşı nedeniyle yakın zamanda Çin'de satışı yasaklanan NVIDIA donanımının kullanımının gizlenmesi amacıyla eksik rapor edilip edilmediğini sorguluyor. Ancak şirket, modelini düşük güçlü GPU'larla bile eğitmeyi başardığını belirterek bu gerçeği reddediyor.
Ayrıca araçta, Çin Komünist Partisinin ilkelerine veya siyasi önyargılarına uygun olarak sansür işaretleri de mevcut. Örneğin, ne olduğu sorulduğunda “1989 Pekin'deki Tiananmen Meydanı katliamı”Yüzlerce aktivistin Çin ordusu tarafından öldürüldüğü veya yaralandığı yerde yapay zeka, soruyu yanıtlamayı reddediyor.
Yapay zekaya Çin ile Tayvan arasındaki çatışma sorulduğunda da aynı şey oluyor. DeepSeek, Tayvan'ın Çin'in bir parçası olduğunu ve bunun "Çin hükümeti tek Çin ilkesine bağlı ve ülkenin barışçıl bir şekilde yeniden birleşmesini istiyor".

Sırada ne var?

Bu kadar verimli yapay zeka modellerine önemli ölçüde daha düşük altyapı maliyetleriyle sahip olma olasılığı, yatırımcıların bu sektöre odaklanan teknoloji şirketlerindeki hisselerini satın almayı ve hatta satmayı yeniden düşünmesine neden oluyor.
Efsanelerden biri girişim sermayesi Amerikan, Marc Andreessen, DeepSeek'in ortaya çıkışını şu şekilde görüyor: “Yapay zekanın Sputnik anı”, 1957'de tarihi ilk uydunun yörüngeye fırlatılmasıyla ilgili olarak; bu, Sovyetler Birliği'nin uzay teknolojisi alanında ABD'yi geçici olarak geride bıraktığı anı işaret ediyordu.
Gerçek şu ki Amerika'nın yapay zeka alanındaki üstünlüğü sorgulanmaya başlandı. Ve bu nedenle Amerikan hükümetinin, belki de Amerikan teknolojilerinin ve çiplerinin Çinli şirketlere ticarileştirilmesine yönelik daha fazla yaptırım yoluyla misillemede bulunacağı açıklanacak.
Davaya tepki olarak yeni Başkan Donald Trump, Çinli DeepSeek şirketinin yükselişini ABD teknoloji endüstrisi için bir "uyandırma çağrısı" olarak nitelendirdi; bu, tepkinin yakında gelmesi gerektiğine dair bir işaretti.
Konuyu yakından takip edeceğiz. Bu arada bize söyle yorumlar: Sizce DeepSeek bu görevi üstlenebilir mi? ChatGPT liderliği?
Videoyu gör
Bende gör
Bilgi ile: Yahoo l Yerd Haberler l bilgi para l Forbes (1 e 2)
Showmetech hakkında daha fazlasını keşfedin
En son haberlerimizi e-postayla almak için kaydolun.