İnternette gezinebilir ve hatta alışveriş yapabilirsin

uTKu

New member
Amazon Yapay zeka alanı için kariyeri kazanmak isteyen teknolojik devlere görüntülerini kaybetmek istemiyor. Şirket, geçen ayın sonunda lansmanını duyurdu Nova Yasası, bir AI ajanı Web tarayıcılarıyla etkileşim kurmak ve kullanıcı adına görevleri yürütmek ve böylece Chatgpt ve Gemini.


Nova Yasası'nın gelişimi, sanal ajanların manuel navigasyonun yerini aldığı ve kullanıcıların zamanını ve verimliliğini optimize ettiği bir geleceğe işaret ediyor.


Geleneksel modellerden farklı olarak, bu araç sadece cevaplar değil, aynı zamanda Bir web sayfasında somut eylemler gerçekleştirebilirsinizFormları Nasıl Tamamlayın, Bırakma Menülerinde Seçenekleri seçin ve hatta çevrimiçi satın alımlar yapabilirsiniz.


Şu anda, araç araştırma önizleme aşamasındadır, yani erken geliştirme aşamalarında ve sadece testler için mevcuttur. Ancak Amazon, geliştiricilerin yetenekleriyle deneyimlemesi için bir deneme sürümü (SDK) başlattı. Diğer hizmetlerle entegrasyonunuzu geliştirin.


Otomatik akıllı ajanların bir geleceği


Amazon ajanınız Nova Yasası'nı tanıttı. Fotoğraf: Reuters/Fabian Bimmer.

Bir AI ajanının her zaman bir Arka planda çalışan yazılım Veya erişilebilir arayüzlerle, robot gibi fiziksel bir formu yoktur. Örneğin, ChatGPT, Siri, Google Assistant veya Alexa gibi sanal chatbots ve asistanlar; Ayrıca Netflix, Spotify veya Amazon algoritmaları şeklinde öneri sistemlerinde; ve bankalarda, idarelerde veya insan kaynaklarında tekrarlayan görevleri yöneten RPA yazılımında (robotik proses otomasyonu) bile.


Nova Yasası'nın potansiyeli basit navigasyonun ötesine geçer.


Amazon Planları Alexa+ 'a entegre etsanal asistanı, kullanıcı deneyimini çevrimiçi hizmetlerle etkileşimde optimize etmek için. 2024'te sunulan Nova modellerindeki üssü sayesinde şirket, sadece yüksek hassasiyetle siparişleri yerine getirmekle kalmayıp aynı zamanda zaman içinde performansını artırmak için ince ayar ve takviye ile öğrenen yapay bir zeka sistemine bahis oynuyor.


Bu lansmanla Amazon, yapay zeka alanındaki varlığını güçlendirir, Nova'nın kullanıcıların Web ile etkileşim biçimini değiştirme potansiyeline sahip bir ajan olarak konumlandırılması. Bu teknoloji geliştikçe, dijital görevlerin otomasyonunda yeni bir dönemin başlangıcıyla karşı karşıya kalabiliriz.


Chatgpt ve Gemini'den nasıl farklı?


AI, Chatgpt'in arkasındaki şirket. Fotoğraf: AP.
AI, Chatgpt'in arkasındaki şirket. Fotoğraf: AP.

Nova Act'ın lansmanı Amazon'u doğrudan rekabete sokuyor Openai ve Google Navigasyon kapasitesi ile gelişmiş geliştirilmesinde.


Chatgpt gibi araçlar (işlevle Operatör) ve Antropik'ten Claude (Bilgisayar kullanımı) Bu kavramı araştırdı, elektronik ticaret platformu bir Hassasiyet% 90'dan büyük Web sitelerindeki günlük görevlerde.


Bu alandaki AI'nın ana zorluklarından biri Dinamik Web Arayüzleri ile Dövüşgelişmekte olan menüler, kurabiye afişleri veya promosyon pencereleri olarak. Nova Yasası, bir daha fazla istikrar ve hassasiyet Bu eylemlerin yürütülmesinde rakiplerine kıyasla.


Ayrıca, büyük ölçüde bağlı olan Chatgpt ve Gemini'nin aksine Site nasıl oluşturulurböylece geliştiriciler karmaşık işlevler yaratabilir ve böylece veri kurtarabilir ve görevleri yürütebilir; Nova Yasası, Bir tarayıcının içinde otonom olarak çalışın. Bu, yalnızca dış entegrasyonlara bağlı olmadan süreçleri tamamlamanızı sağlar.


Kendi adına, Google Cloud Kısa süre önce, AI ajanlarını toplayan kapsamlı bir çözüm olan Google Agentspace'i başlattı, Gemini'nin gelişmiş akıl yürütmesi, Google kalitesi ile arama ve çalışan verimliliğini tek bir göstergeyle artırmak için iş verileri.


Google Cloud'daki küresel çözümler ve endüstriler başkan yardımcısı Carrie Tharp, “Perakende, AI ajanları artık fütüristik bir kavram değil; bunlar, müşteri deneyimlerini keşiften satın almaya ve ötesine dönüştüren mevcut gerçeklik.” Dedi.


“Bugün, AI ajanları sadece ürünleri tavsiye etmekle kalmıyor, aynı zamanda kişiselleştirilmiş satın alma turları düzenlemek, iadeleri yönetiyor ve anında müşteri hizmetleri sağlıyor. Bu AI temsilcileri, küçük işletmelerden küresel şirketlere kadar perakendecilerin farklı ihtiyaçlarını karşılıyor ve somut ticari değer üretmelerine yardımcı oluyor.”


Şimdi sektör için mevcut olan bu multimodal çözüm Metin, resim, video ve sesi entegre eden en alakalı verileri gösterin Böylece ticaret kullanıcıya daha sezgisel bir deneyim sağlayabilir. Bu çözüm sayesinde müşteriler, daha iyi satın alma kararları vermelerine yardımcı olacak daha eksiksiz ve hassas ürünlerin açıklamalarını bulacaklar


Şimdiye kadar, Amazon'un ajanı, ortalama bir internet kullanıcısının ihtiyaçlarına yanıt verme kapasitesini ölçmek için bölüme maruz kaldı. Görüntülerin görüntülerini çıkarmak için bir araç olan SO -Constrice Screenspot Web Metininde (OCR), Nova Yasası%94 hassasiyet elde etti, Openai'nin CuA'sını (%88) ve Claude 3.7 sonnet antropik (%90).


Şirket kaynaklarına göre, fareyi hareket ettirmek ve TRCADO'yu kontrol etmek için hassasiyet kontrol edildiği WebVoyager'da henüz verilmedi, bu da a priori'nin daha geniş senaryolardaki performansları hakkında şüphe yaratabileceği bir durum.