Çin dijital devi Alibaba Çarşamba günü yapay zekasının (AI) yeni bir modelinin başlatıldığı açıklandı Qwenson günlerde uluslararası düzeyde çok fazla heyecan yaratan Deepseek V3'e “neredeyse tamamen” aştığını belirten Qwen2.5-Max olarak adlandırıldı.
Resmi Wechat Social Network'te yayınlanan bir açıklamada, grubun bulut bilişim bölümü ('bulut') Alibaba Cloud, openai OA çağrı-3.1-405b'nin GPT-4O'sunu model olarak model olarak model olarak model olarak içeriyor. Üstesinden gelme iddiaları ve Qwen'in en son versiyonunun Claude-3.5-Sonnet Antropik ile eşit olduğuna dikkat çekti.
Alibaba Kurumsal Haber Portalı Alizila, Qwen2.5-Max'in “öne çıktığını” açıklıyor. Metinler, tablolar, diyagramlar, grafikler ve görüntü eğiliminin ileri anlamasıve bir saatten fazla olan videoları da anlayabilir ve bunlarla ilgili soruları cevaplayarak, segmentleri ikinci spesifik olanla tanımlayabilirsiniz.
Teknoloji ayrıca modelinin faturalar, formlar veya tabloların verilerini yapılandırılmış ürünlere dönüştürme yeteneğini de vurgulamaktadır. Finansal raporların veya yasal belgelerin işlenmesi “.
AI: Dünyada şiddetli bir kavga
Alibaba Çin'den dev bir teknoloji. Fotoğraf: Reuters
Alibaba, Nisan 2023'te CHATGPT'ye alternatifini sundu, Tongyi Qianwen (Mandarin'de, “Bin sorudan” gibi bir şey) ve böylece 'Çin Google' Baidu gibi diğer Çin openai rakiplerine katıldı, ki Ayrıca manşetleri onunla tekelleştirmişti Ernie Bot.
Birkaç gün öncesine kadar uluslararası olarak anonim olan Deepseek, gelişimi sadece iki ay sürdüğünü ve sadece 6 milyon dolardan daha düşük olduğunu iddia eden V3 modelinin lansmanı ile AI Dünya Kurulu'na atladı. 20 Ocak'ta R1 adlı en son versiyonunu yayınladı.
Çinli resmi medya, Depseek'in başarısını kutladı ve modellerinin ABD'li rakiplere karşı uygun fiyatlı olduğunu vurguladı -Openai'nin O1'inden % 95 daha ucuz hizmetler sunuyor ve ayrıca Kuzey Amerika ülkesinin liderleri veya hatta yeni başkanları arasında tekelleşen ilgiyi yineliyor, Donald Trump.
2023 yılında Çin Kapsamı Fonu Yüksek Flyer Quant tarafından başlatıldı, Depseek açık kaynakta bahisler ve hizmetler sunuyor Openai'nin O1 modelinden % 95 daha ucuz.
Bununla birlikte, çeken büyük ilgi – Amerika Birleşik Devletleri'ndeki Apple cihazları için indirmelerde lider olarak yerleştirildi – aynı zamanda eleştiriye çevrildi, çünkü 'uygulaması' Çin'deki sansürden etkilenen konular hakkında Tiananmen katliamı 1989 veya Tayvan ise Çin'in bir parçası.
Aynı fenomen, 2023'te doğrulandığı gibi, Pekin bu hizmetleri, yasaklandıkları “temel sosyalist değerlere” saygı duyacak şekilde düzenlediği diğer Çinli konuşmalarda gerçekleşti. “Ulusal güvenlik, bölgesel birliği ve sosyal istikrarı tehdit eden içerikler üretin.”
Qwen nasıl test edilir
Deepseek ve Alibaba, Çin'deki AI'daki rakipler. Fotoğraf: Reuters
Qwen'i kanıtlamak için, ilk adım deponuza erişmektir. Sarılma Yüzü veya GithubAlibaba Cloud, hem modelleri hem de uygulama talimatlarını yayınladı. Python'da programlama konusunda temel bilgiye sahip olmak ve Google Colab veya GPU'lu bir makineye sahip olmak gerekir. Modeli daha verimli bir şekilde yürütün. Model boşaltıldıktan sonra, sunulan ağırlıkları yükleyebilir ve AI ile etkileşime girmek için sarılma yüz transformatörleri gibi kitapçıları kullanabilirsiniz.
Daha erişilebilir bir yöntem, QWEN'i modellerin yürütülmesini sağlayan bir Alibaba bulut hizmeti olan Modescope Platformu aracılığıyla test etmektir. Yerel yapılandırmaya gerek yok.
Yalnızca bir hesap oluşturmak, Qwen Model sürümünü seçmek ve web arayüzünden metin oluşturmaya başlamak gerekir. Bu seçenek ideal Programlama deneyimi olmayanlar için Ancak Alibaba'nın AI'sını kolayca denemek istiyorlar.
Qwen'in gelişimi, Çin'in yapay zeka sektörüne kendi ve açık kaynak teknolojileriyle liderlik konusundaki ilgisini yansıtıyor. Küresel topluluğa sahip olması, ABD modellerine alternatifleri keşfetmemizi ve çeşitli uygulamalarda yeniliği teşvik etmemizi sağlar. Bu test seçenekleriyle, hem geliştiriciler hem de meraklı teknoloji, Erişim bariyerleri olmayan gelişmiş bir AI.
Anabolik ile Yapay Zeka: Better Call ve Deepseek V3
Meta Ai'yi arayın. Fotoğraf: Hedef
Resmi Qwen blogunda yayınlanan Alibaba, dil modelinin en son sürümüyle elde edilen ilerlemeleri açıkladı. En son alev ve Deepseek modelleriyle Qwen 2.5 maksimum ile yüzleşen Alibaba modeli tarafından elde edilen puanlar Birçok durumda üstündeler.
Qwen 2.5 Max, modellerin çok daha verimli ve ölçeklenebilir olmasını sağlayan Deepseek'inkine benzer bir mimari kullanır). Bu mimari ile, tüm bilgiye sahip monolitik bir modele sahip olmak yerine, Bu birkaç “uzman” olarak ayrılmıştır, Her biri bir veri veya görev alt kümesinde uzmanlaşmıştır. Başka bir unsur olan “yönlendirici”, bu uzmanlardan hangisinin belirli bir girişi işlemek için en uygun olduğuna karar verir.
Bu tekniğin, 20.000 milyondan fazla Tókens ve Denetimli İnce Ayarlama Metodolojileri (SFT) ve İnsan Geri Bildirimlerinden (RLHF) takviye öğrenmesiyle yapılan gelişmelere eklenen, Alibaba'nın şu anın daha gelişmiş modellerinden birini oluşturmasına izin verdi. .
Testler, qwen2.5-Max'in Arena-Hard, LiveBench, LiveCodebench ve GPQA-Diamond gibi referans testlerinde Deepseek V3'ü aştığını ve MMLU-PRO dahil diğer test türlerinde çok rekabetçi sonuçlar sunduğunu gösterdi.
Kullanım, yani belirli uygulamalar Bu teknolojilerin geleceği.
Resmi Wechat Social Network'te yayınlanan bir açıklamada, grubun bulut bilişim bölümü ('bulut') Alibaba Cloud, openai OA çağrı-3.1-405b'nin GPT-4O'sunu model olarak model olarak model olarak model olarak içeriyor. Üstesinden gelme iddiaları ve Qwen'in en son versiyonunun Claude-3.5-Sonnet Antropik ile eşit olduğuna dikkat çekti.
Alibaba Kurumsal Haber Portalı Alizila, Qwen2.5-Max'in “öne çıktığını” açıklıyor. Metinler, tablolar, diyagramlar, grafikler ve görüntü eğiliminin ileri anlamasıve bir saatten fazla olan videoları da anlayabilir ve bunlarla ilgili soruları cevaplayarak, segmentleri ikinci spesifik olanla tanımlayabilirsiniz.
Teknoloji ayrıca modelinin faturalar, formlar veya tabloların verilerini yapılandırılmış ürünlere dönüştürme yeteneğini de vurgulamaktadır. Finansal raporların veya yasal belgelerin işlenmesi “.
AI: Dünyada şiddetli bir kavga
Alibaba Çin'den dev bir teknoloji. Fotoğraf: Reuters
Alibaba, Nisan 2023'te CHATGPT'ye alternatifini sundu, Tongyi Qianwen (Mandarin'de, “Bin sorudan” gibi bir şey) ve böylece 'Çin Google' Baidu gibi diğer Çin openai rakiplerine katıldı, ki Ayrıca manşetleri onunla tekelleştirmişti Ernie Bot.
Birkaç gün öncesine kadar uluslararası olarak anonim olan Deepseek, gelişimi sadece iki ay sürdüğünü ve sadece 6 milyon dolardan daha düşük olduğunu iddia eden V3 modelinin lansmanı ile AI Dünya Kurulu'na atladı. 20 Ocak'ta R1 adlı en son versiyonunu yayınladı.
Çinli resmi medya, Depseek'in başarısını kutladı ve modellerinin ABD'li rakiplere karşı uygun fiyatlı olduğunu vurguladı -Openai'nin O1'inden % 95 daha ucuz hizmetler sunuyor ve ayrıca Kuzey Amerika ülkesinin liderleri veya hatta yeni başkanları arasında tekelleşen ilgiyi yineliyor, Donald Trump.
2023 yılında Çin Kapsamı Fonu Yüksek Flyer Quant tarafından başlatıldı, Depseek açık kaynakta bahisler ve hizmetler sunuyor Openai'nin O1 modelinden % 95 daha ucuz.
Bununla birlikte, çeken büyük ilgi – Amerika Birleşik Devletleri'ndeki Apple cihazları için indirmelerde lider olarak yerleştirildi – aynı zamanda eleştiriye çevrildi, çünkü 'uygulaması' Çin'deki sansürden etkilenen konular hakkında Tiananmen katliamı 1989 veya Tayvan ise Çin'in bir parçası.
Aynı fenomen, 2023'te doğrulandığı gibi, Pekin bu hizmetleri, yasaklandıkları “temel sosyalist değerlere” saygı duyacak şekilde düzenlediği diğer Çinli konuşmalarda gerçekleşti. “Ulusal güvenlik, bölgesel birliği ve sosyal istikrarı tehdit eden içerikler üretin.”
Qwen nasıl test edilir
Qwen'i kanıtlamak için, ilk adım deponuza erişmektir. Sarılma Yüzü veya GithubAlibaba Cloud, hem modelleri hem de uygulama talimatlarını yayınladı. Python'da programlama konusunda temel bilgiye sahip olmak ve Google Colab veya GPU'lu bir makineye sahip olmak gerekir. Modeli daha verimli bir şekilde yürütün. Model boşaltıldıktan sonra, sunulan ağırlıkları yükleyebilir ve AI ile etkileşime girmek için sarılma yüz transformatörleri gibi kitapçıları kullanabilirsiniz.
Daha erişilebilir bir yöntem, QWEN'i modellerin yürütülmesini sağlayan bir Alibaba bulut hizmeti olan Modescope Platformu aracılığıyla test etmektir. Yerel yapılandırmaya gerek yok.
Yalnızca bir hesap oluşturmak, Qwen Model sürümünü seçmek ve web arayüzünden metin oluşturmaya başlamak gerekir. Bu seçenek ideal Programlama deneyimi olmayanlar için Ancak Alibaba'nın AI'sını kolayca denemek istiyorlar.
Qwen'in gelişimi, Çin'in yapay zeka sektörüne kendi ve açık kaynak teknolojileriyle liderlik konusundaki ilgisini yansıtıyor. Küresel topluluğa sahip olması, ABD modellerine alternatifleri keşfetmemizi ve çeşitli uygulamalarda yeniliği teşvik etmemizi sağlar. Bu test seçenekleriyle, hem geliştiriciler hem de meraklı teknoloji, Erişim bariyerleri olmayan gelişmiş bir AI.
Anabolik ile Yapay Zeka: Better Call ve Deepseek V3
Resmi Qwen blogunda yayınlanan Alibaba, dil modelinin en son sürümüyle elde edilen ilerlemeleri açıkladı. En son alev ve Deepseek modelleriyle Qwen 2.5 maksimum ile yüzleşen Alibaba modeli tarafından elde edilen puanlar Birçok durumda üstündeler.
Qwen 2.5 Max, modellerin çok daha verimli ve ölçeklenebilir olmasını sağlayan Deepseek'inkine benzer bir mimari kullanır). Bu mimari ile, tüm bilgiye sahip monolitik bir modele sahip olmak yerine, Bu birkaç “uzman” olarak ayrılmıştır, Her biri bir veri veya görev alt kümesinde uzmanlaşmıştır. Başka bir unsur olan “yönlendirici”, bu uzmanlardan hangisinin belirli bir girişi işlemek için en uygun olduğuna karar verir.
Bu tekniğin, 20.000 milyondan fazla Tókens ve Denetimli İnce Ayarlama Metodolojileri (SFT) ve İnsan Geri Bildirimlerinden (RLHF) takviye öğrenmesiyle yapılan gelişmelere eklenen, Alibaba'nın şu anın daha gelişmiş modellerinden birini oluşturmasına izin verdi. .
Testler, qwen2.5-Max'in Arena-Hard, LiveBench, LiveCodebench ve GPQA-Diamond gibi referans testlerinde Deepseek V3'ü aştığını ve MMLU-PRO dahil diğer test türlerinde çok rekabetçi sonuçlar sunduğunu gösterdi.
Kullanım, yani belirli uygulamalar Bu teknolojilerin geleceği.