Çin’in AI Gamble: Deepseek’in Proveri V2 o kadar büyük ki kendi dairesine ihtiyacı var 🏢🤖

Yapay zekada yerleşik bir gerçektir, yeterince büyük bir modelin esprili bir züppe eşdeğeri olması: kişi ne için iyi olduğunu bilmeyebilir, ancak herkes ne kadar yer kapladığından oldukça etkilenir. Çin’in entelektüel merakı olan Deepseek’e, algoritmik çizim odasından ortaya çıkan pozitif Herkül Proveri V2 – bu kadar heybetli bir “büyük dil modeli” ile ortaya çıkıyor, hatta hesaplamadan önce şampanya ve havyar talep ettiğinden şüpheleniyor.

İyi bir Nisan günü-özellikle 30’lu, günlükleri tutanlar için-Deepseek, en son dahilerini sarılma yüzüne yükledi, açık kaynaklı MIT lisansını kapıyı açıp “Herkes davet edildi!” Diye bağırdığı için çok fazla şey değil, çok fazla şey değil, çok fazla şey değil. Prover V2 için ne için? Neden, en kafa karıştırıcı kanıtlarla düello yapmak ve matematiği doğrulamak, böylece filozofları erken yaşlanmaktan kurtarmak.

Şimdi, 671 milyar parametresi ile Prover V2, Prover V1’in omuzlarında duruyor V1 ve daha atletik kardeş V1.5, kendileri geçen Ağustos’ta sadece dünyaya kaybediliyor. İlk versiyona eşlik eden akademisyenler, modelin en korkutucu rekabet sorunlarını bile Yalın 4 programlama diline dönüştürme yeteneğini detaylandırdılar – çünkü doğal olarak, hiçbir şey eğlenceli bir bilgisayarı var olan bir bilgisayarı ikna etmek gibi söylemiyor.

Prover V2’nin içerik oluşturucuları, matematiksel bilgiyi zarif bir dijital sosis haline getirdiği konusunda ısrar ederek kanıtları o kadar hızlı çalkalayarak Pisagor bile bir aşağılık kompleksi geliştirebilir. Matematik, bir zamanlar AI’dan kaçınanların son sığınağı olarak kabul edildi, şimdi dijital gasp ile karşı karşıya.

Bütün bu yaygara ne hakkında?

Modeller – İkili Babble’ın muhteşem koleksiyonları – yapay zeka çevrelerinde, sürekli bir diyet yapıyormuş gibi yanlış bir şekilde “ağırlık” olarak adlandırılır. Bununla birlikte, son teknoloji ürünü LLM’lerin indirmeleri, ortalama bilgisayarın hafıza bankalarını kavramasına ve Viktorya dönemine ait bir bayrak almasına neden olma eğilimindedir.

650 gigabaytta, Prover V2 bir dil modeli ya da çok muhtaç bir bagaj parçasıdır. Çoğu ölümlü, gerekli RAM veya VRAM’tan yoksundur – şüpheli bir terim, teknoloji şirket bütçe toplantılarında rol oynamayı seven Herkül GPU‘larını ifade eder.

Prover V2’yi biraz daha az korkunç yapmak için umutsuz olan Deepseek, parametreleri 8 bit yüzen nokta hassasiyetine sıkıştırdı, bu da evde gol atanlar için, sadece birkaç varoluş kriziyle alanı kapladığı anlamına geliyor. Ne diyet! Sadece macaronlarla çalışsaydı.

Prover V1 gibi önceki enkarnasyonlar Deepseekmath’a dayanıyordu ve hayali arkadaşların sentetik verileri üzerinde yetiştirildi. Sentetik veriler, söyleyebiliriz, bilgisayarların kendi aralarında dedikodu yapmasının sonucudur – yani, gerçek insan verileri giderek daha nadirdir, tıpkı iyi akşam yemeği sohbeti gibi.

Prover V1.5, daha hızlı, daha akıllı, daha iyi giyimli bir modeldi-daha doğrulukla güçleniyor, ancak V2’nin kesin iyileştirmeleri, sabah kahvelerinden önce bir filozof gibi akademik gerilimle örtülüyor. Prover V2’nin parametrelerinin sayısı, Deepseek’in önceki modeli olan R1’e dayandığını, AI balo salonuna vals eden ve Openai’nin O1’inin yanı sıra göz kamaştırıcı konukları göz kamaştıran bir debutante.

Açık ağırlıklar: nimet mi yoksa varoluşsal korku mu?

Birinin yapay zekasını “açık ağırlık” yapmak, hem şarap koleksiyonunuzu hem de ev anahtarlarınızı halka bırakmanın modern eşdeğeridir. Bir yandan Ram ile demokrasi; Öte yandan, Tchaikovsky’nin oynadığı ve tehlikeler için Tehlike Oynadığı gibi kaosa davet.

R1’in büyük girişi, Sputnik anlarının güvenlik ve konuşması endişelerini kışkırttı – çünkü soğuk omuzları soğuk CPU’lar için değiştirmenin yeni yollarını bulamıyorsa küresel rekabet nedir? Açık Kaynak savunucuları, Deepseek’in Meta’nın kaldığı yerden devam ettiğini ve kamu ruhlu AIS’in özel olanları kilit kodlarını değiştirecek kadar gergin hale getirebileceğini gösterdi.

Kitleler için llms – veya en azından yedek dizüstü bilgisayarları olanlar

Sonunda, dizüstü bilgisayarları süper bilgisayardan daha fazla tamarlaştırıcı olanlar bile, şansa değil, iki kurnaz hileye teşekkürler: model damıtma (güçlü bir “öğretmen” modelinin dijital bilgeliğini pint büyüklüğünde bir öğrenciye verdiği) (sayıları her bayt gazlara kadar sıkma).

Gururla yarım bit olan Prover V2, kanıtın kendisidir; Ve sayısal felaketin kenarında sallanmanın tadını çıkarmanız koşuluyla her zaman daha fazla indirim için yer vardır. En kötü durumda, model “büyük ölçüde işlevsel” kalır – iki şişe şampanya sonrası Wildean Dody’leri de tanımlayan bir ifade.

Bu arada, Deepseek’in R1’i artık cep telefonunuzda yaşayabilecek 1.5 milyar parametre Waif’den, kendi güç şebekesini talep eden 70 milyar sürüme kadar sayısız formda yaşıyor. Demokratikleşme asla matematiksel olarak korkutucu görünmedi.

2025-04-30 17:11