DeepSeek'ten yeni meydan okuma: Janus-Pro
Teknoloji, 2025.01.29 11:24DeepSeek'in yeni Janus Pro modeli, düşük geliştirme maliyetine rağmen görsel oluşturma alanında OpenAI'nin DALL-E 3'ünü geride bırakacak şekilde üstün performans sergiliyor. Yeni açık kaynaklı model, DeepSeek'in daha önceki başarılarını pekiştiriyor ve rekabeti artırıyor.

Çinli DeepSeek, gelişmiş yapay zeka (AI) modellerinin bir anda popüler hale gelmesi ile birlikte dikkatleri üzerine çekti. Şirket, AI modellerini eğitmek için yalnızca 6 milyon dolardan az bir bütçe harcadı. Buna karşılık, OpenAI'nin DALL-E 3 modeli için yatırılan miktar 100 milyon dolar civarındaydı.
DeepSeek'in başarısı, sadece App Store'da bir numara olmasının ötesine geçmiş durumda; NVIDIA'nın ABD pazarında 400 milyar dolarlık değer kaybetmesine bile yol açan bir gelişmeden bahsediyoruz. Hal böyle olunca, hizmetin siber saldırılara uğraması ve kapasite sorunları yaşaması da kaçınılmaz oldu.
Janus-Pro'nun Çığır Açan Başarısı
Bu zorlukların üstesinden gelmeye çalışan Çin merkezli AI laboratuvarı DeepSeek, aynı zamanda Janus-Pro adlı devrim niteliğinde bir açık kaynaklı metinden görsele AI modelini duyurdu. Bu yeni model, büyük bir yankı uyandırarak, görüntü üretiminde OpenAI'nin DALL-E 3, Stability AI'nın Stable Diffusion ve diğer benzer modellerden birkaç kriterde daha iyi performans sergiliyor.
Çin'in yapay zekası DeepSeek, birdenbire nasıl bu kadar popüler oldu?
Janus-Pro, geçtiğimiz yıl sonlarına doğru piyasaya sürülen Janus modelinin güncellenmiş sürümü. Janus-Pro, farklı boyutlarda sunuluyor; bunlar arasında 1 milyar parametreden 7 milyar parametreye kadar değişen seçenekler bulunuyor. DeepSeek'in paylaştığı verilere göre, en büyük model olan Janus-Pro-7B, rakipleri PixArt-alpha, Emu3-Gen ve SDXL'yi GenEval ve DPG-Bench gibi endüstri standartlarında geride bırakarak hem görüntü üretimi hem de analizde mükemmel bir performans gösteriyor. Janus-Pro-7B, HuggingfaceAI platformu üzerinden ücretsiz olarak indirilebiliyor, bu platform ise makine öğrenimi alanında oldukça popüler.
Yeni Bir Yaklaşım: Görsel Kodlayıcı ve Esneklik
Janus-Pro-7B, birleşik bir transformatör mimarisini kullanarak görsel kodlama süreçlerini ayrıştıran bir otoregresif çerçeveye dayanıyor. Bu yaklaşım, yalnızca görsel kodlayıcının üretim ve anlayış rolü arasındaki çatışmayı hafifletmekle kalmıyor, aynı zamanda modelin esnekliğini de artırıyor. Janus-Pro, tekil süreçler için özel olarak tasarlanmış modellerle karşılaştırıldığında, çoklu görevlerde rakiplerini geride bırakıyor. Ancak, özel amaçlı modellerin sunduğu performansın da gölgesinde kalmıyor.
Rekabetçi Zorluk ve Uygulama Alanları
Janus-Pro'nun piyasaya sürülmesi, DeepSeek'in önceki başarısının ardından, GPT-4'e benzer özellikler sunan yeni R1 dil modelinin de etkisiyle büyük bir rekabet doğurdu. Bu gelişmiş modellerin düşük maliyetle geliştirilmesi, ABD AI endüstrisinde şok etkisi yaratmış durumda. Bu tür yeni modeller, sektördeki geleneksel AI uygulamalarıyla kıyaslandığında daha uygun fiyatlarla büyük bir dönüşüm vaat ediyor.
Kaynak: BURSADA BUGÜN
Teknoloji, 2025.01.29 11:24