1950'de Alan Turing Henüz var olmayan bir nesne olan bilgisayarların bir noktada yapabileceklerini tahmin etme cesaretini gösterdi insanları kandırmak. Düşünen bir nesne olarak kabul edilebilmeleri için, bir engelin üstesinden gelmeleri gerekiyordu. çok basit bir test.
Yıllardır ölçülerine uymayan sayısız cihaz bu uzmanlığa tabi tutuldu. Son olarak, üretken yapay zekanın gelişi bu bilgisayar deneyini kontrol altına aldı.
Her ne kadar Turing testi artık yanılmaz ya da tek geçerli test olarak görülmese de, bir bireyin bir makine tarafından ileri sürülen argümanlarla aldatılıp aldatılamayacağını belirleyen bir parametre olarak işlevini sürdürmeye devam ediyor.
Chatbotların mantığıyla yüzleşmek için Kaliforniya Üniversitesi bilişsel bilimler bölümünden araştırmacılar, üç yapay zekanın kopyalarını ölçmek için Turing aracını kullandıkları bir çalışma yayınladılar: ELIZA, GPT-3.5 ve GPT-4.
İkna edici bir taklit
GPT-4 Turing testini geçmeyi başardı.
Kontrollü bir ortamda yapılan derin analizler yoluyla akademisyenler, bu yapay zekaların yapay zekayı ne ölçüde ikna edici bir şekilde taklit edebileceğini belirlemeye çalıştı. konuşma davranışı insanlardan.
Turing normlarına göre, iki ayrı oda. Birinde bir kişiyi, diğerinde ise akıcı bir şekilde iletişim kurabilen bir bilgisayar bekliyor. Hakim, görevi bir ara odada bulunmaktadır. her kapının arkasında kimin olduğunu belirlemek.
Yazılım, bir konuşma sırasında değerlendiriciyi ikna etmeyi başarırsa sınav başarılı sayılır. 5 dakika ve en azından zamanın %50'sinde– bir kişiyle sohbet görüşmesine katıldığınızı.
Böylece, çalışma katılımcıları bir mesajlaşma programı aracılığıyla etten kemikten veya sıfırlar ve birler olabilecek biriyle sohbet ettiler. Her duraklamanın ardından, kiminle etkileşime girdiklerini anlamaları istendi.
Sınavı yapanları yanıltmak için modelden çok çekingen bir genç adam kişiliğini benimsemesi, meydan okumayı fazla ciddiye almaması, argo kullanması ve ara sıra yazım hataları yapması istendi.
Araştırmacılar GPT-4'ün insan olduğunu varsaydılar %54 Bu önemli bir ilerlemeyi temsil ediyor çünkü zorlu sınavı yeterince kazanmayı başardı. ELIZA yalnızca insan olarak kabul edilirken %22 zamanların.
“Her ne kadar Turing limiti %70 olarak belirlemiş olsa da %50'nin kayıtlı olması fazlasıyla haklı çünkü bu, sorgulayıcıların bir makinenin önünde olup olmadıklarını tahmin ederken şanstan daha iyi olmadıklarını gösteriyor.”
Araştırmadan sorumlu kişilerin belirttiği gibi, bu plan, kullanıcıların çevrimiçi bir etkileşim sırasında benzer diğer kişileri tanımlayıp tanımlayamadıklarını güvenilir bir şekilde kontrol etmeye hizmet ediyor.
“Katılımcıların güven puanları ve kararlarına ilişkin gerekçeler tahminde bulunmadıklarını gösteriyor. GPT-4'ün insan olduğuna dair yargıların ortalama güvenirliği %73'tü.”
Harika simülatör
ChatGPT Turing testini geçmeyi başardı.
Bu makale, GPT-4'ün konuşma becerilerinin her dinleyiciyi kandırabilecek kadar karmaşık bir düzeye ulaştığını göstermeye hizmet ediyor. Bu da onun gerçek bir insandan ayırt edilemeyecek davranışlar sergileme potansiyelini doğruluyor.
GPT-4 gibi yapay zeka sistemleri diyalog yeteneklerini daha yakından taklit ettikçe, doğal dilin anlaşılmasını ve oluşturulmasını gerektiren işlevlere daha kolay entegre edilebilirler.
Buna müşteri hizmetleri, sanal yardım, zihinsel sağlık desteği, tıbbi danışmanlık ve eğitim araçları dahildir.
Ancak yapay zekanın bu aldatmacayı başarma ihtimali önemli bir hususu ortaya çıkarıyor. etik sorunlar. Bu, yanlış bilgi yaymak veya tespit edilmeden dolandırıcılık faaliyetleri yürütmek için kullanılabileceği anlamına gelir.
Büyük dil modelleri ve diğer yapay zeka sistemleri, aldıkları eğitimlerden manipülasyon, dalkavukluk ve güvenlik testlerinde hile yapma gibi teknikler yoluyla gerçeği gizleme yeteneğini öğrenmiştir.
Bu, yapay zeka teknolojilerinin uygun şekilde kullanılmasını sağlamak için sağlam yönergeler ve düzenleyici çerçeveler geliştirmenin ve uygulamanın öneminin altını çiziyor. Sorumlu ve şeffaf.
Sosyal bir etkinlik
Dil zekadan bağımsız olabilir.AP
Bu teknik değerlendirmeden çıkan sonuç, botların akıllı olduğu veya düşünmek olarak tanımlanabilecek herhangi bir şeyi yaptığıdır. Çünkü düşünme sosyal bir eylem olarak kabul edilir.
Aslında yapay zekanın gösterdiği şey, dilin zekadan bağımsız olabileceğidir. Her şeyden önce, yaptığının farkında olamayan bir zeka olduğu için.
Sonuçta, Turing testinin zekaya ilişkin yeterli kanıt sağlaması pek olası görünmüyor, ancak en iyi ihtimalle zekanın kusurlu bir yansımasıdır. insan bilgisi.
Bu test, makinenin soruları doğru yanıtlama becerisine ilişkin bilgisini değerlendirmediğinden, yalnızca insanın vereceği yanıtlara benzer yanıtlar üretme yeteneği dikkate alınır.
ChatGPT gibi dil modellerinin yaptığı şey, cümledeki bir sonraki kelimeyi tahmin etmektir. Algoritma, tutarlılığa bakılmaksızın tüm kelimeleri birbiriyle ilişkili olarak yerleştirmeyi öğrenir.
Böylece dilsel modeller, kelimelerin gruplanma şeklini tasarlar ve bu çıkarıma dayanarak, kelimeler sohbet gibi belirli görevleri yerine getirmek üzere eğitilir.
Yıllardır ölçülerine uymayan sayısız cihaz bu uzmanlığa tabi tutuldu. Son olarak, üretken yapay zekanın gelişi bu bilgisayar deneyini kontrol altına aldı.
Her ne kadar Turing testi artık yanılmaz ya da tek geçerli test olarak görülmese de, bir bireyin bir makine tarafından ileri sürülen argümanlarla aldatılıp aldatılamayacağını belirleyen bir parametre olarak işlevini sürdürmeye devam ediyor.
Chatbotların mantığıyla yüzleşmek için Kaliforniya Üniversitesi bilişsel bilimler bölümünden araştırmacılar, üç yapay zekanın kopyalarını ölçmek için Turing aracını kullandıkları bir çalışma yayınladılar: ELIZA, GPT-3.5 ve GPT-4.
İkna edici bir taklit
GPT-4 Turing testini geçmeyi başardı.
Kontrollü bir ortamda yapılan derin analizler yoluyla akademisyenler, bu yapay zekaların yapay zekayı ne ölçüde ikna edici bir şekilde taklit edebileceğini belirlemeye çalıştı. konuşma davranışı insanlardan.
Turing normlarına göre, iki ayrı oda. Birinde bir kişiyi, diğerinde ise akıcı bir şekilde iletişim kurabilen bir bilgisayar bekliyor. Hakim, görevi bir ara odada bulunmaktadır. her kapının arkasında kimin olduğunu belirlemek.
Yazılım, bir konuşma sırasında değerlendiriciyi ikna etmeyi başarırsa sınav başarılı sayılır. 5 dakika ve en azından zamanın %50'sinde– bir kişiyle sohbet görüşmesine katıldığınızı.
Böylece, çalışma katılımcıları bir mesajlaşma programı aracılığıyla etten kemikten veya sıfırlar ve birler olabilecek biriyle sohbet ettiler. Her duraklamanın ardından, kiminle etkileşime girdiklerini anlamaları istendi.
Sınavı yapanları yanıltmak için modelden çok çekingen bir genç adam kişiliğini benimsemesi, meydan okumayı fazla ciddiye almaması, argo kullanması ve ara sıra yazım hataları yapması istendi.
Araştırmacılar GPT-4'ün insan olduğunu varsaydılar %54 Bu önemli bir ilerlemeyi temsil ediyor çünkü zorlu sınavı yeterince kazanmayı başardı. ELIZA yalnızca insan olarak kabul edilirken %22 zamanların.
“Her ne kadar Turing limiti %70 olarak belirlemiş olsa da %50'nin kayıtlı olması fazlasıyla haklı çünkü bu, sorgulayıcıların bir makinenin önünde olup olmadıklarını tahmin ederken şanstan daha iyi olmadıklarını gösteriyor.”
Araştırmadan sorumlu kişilerin belirttiği gibi, bu plan, kullanıcıların çevrimiçi bir etkileşim sırasında benzer diğer kişileri tanımlayıp tanımlayamadıklarını güvenilir bir şekilde kontrol etmeye hizmet ediyor.
“Katılımcıların güven puanları ve kararlarına ilişkin gerekçeler tahminde bulunmadıklarını gösteriyor. GPT-4'ün insan olduğuna dair yargıların ortalama güvenirliği %73'tü.”
Harika simülatör
![ChatGPT Turing testini geçmeyi başardı.](https://www.clarin.com/img/2023/04/08/EyL9XbJYP_720x0__1.jpg)
Bu makale, GPT-4'ün konuşma becerilerinin her dinleyiciyi kandırabilecek kadar karmaşık bir düzeye ulaştığını göstermeye hizmet ediyor. Bu da onun gerçek bir insandan ayırt edilemeyecek davranışlar sergileme potansiyelini doğruluyor.
GPT-4 gibi yapay zeka sistemleri diyalog yeteneklerini daha yakından taklit ettikçe, doğal dilin anlaşılmasını ve oluşturulmasını gerektiren işlevlere daha kolay entegre edilebilirler.
Buna müşteri hizmetleri, sanal yardım, zihinsel sağlık desteği, tıbbi danışmanlık ve eğitim araçları dahildir.
Ancak yapay zekanın bu aldatmacayı başarma ihtimali önemli bir hususu ortaya çıkarıyor. etik sorunlar. Bu, yanlış bilgi yaymak veya tespit edilmeden dolandırıcılık faaliyetleri yürütmek için kullanılabileceği anlamına gelir.
Büyük dil modelleri ve diğer yapay zeka sistemleri, aldıkları eğitimlerden manipülasyon, dalkavukluk ve güvenlik testlerinde hile yapma gibi teknikler yoluyla gerçeği gizleme yeteneğini öğrenmiştir.
Bu, yapay zeka teknolojilerinin uygun şekilde kullanılmasını sağlamak için sağlam yönergeler ve düzenleyici çerçeveler geliştirmenin ve uygulamanın öneminin altını çiziyor. Sorumlu ve şeffaf.
Sosyal bir etkinlik
![Dil zekadan bağımsız olabilir.AP](https://www.clarin.com/img/2024/06/04/NTGMNzdNA_720x0__1.jpg)
Bu teknik değerlendirmeden çıkan sonuç, botların akıllı olduğu veya düşünmek olarak tanımlanabilecek herhangi bir şeyi yaptığıdır. Çünkü düşünme sosyal bir eylem olarak kabul edilir.
Aslında yapay zekanın gösterdiği şey, dilin zekadan bağımsız olabileceğidir. Her şeyden önce, yaptığının farkında olamayan bir zeka olduğu için.
Sonuçta, Turing testinin zekaya ilişkin yeterli kanıt sağlaması pek olası görünmüyor, ancak en iyi ihtimalle zekanın kusurlu bir yansımasıdır. insan bilgisi.
Bu test, makinenin soruları doğru yanıtlama becerisine ilişkin bilgisini değerlendirmediğinden, yalnızca insanın vereceği yanıtlara benzer yanıtlar üretme yeteneği dikkate alınır.
ChatGPT gibi dil modellerinin yaptığı şey, cümledeki bir sonraki kelimeyi tahmin etmektir. Algoritma, tutarlılığa bakılmaksızın tüm kelimeleri birbiriyle ilişkili olarak yerleştirmeyi öğrenir.
Böylece dilsel modeller, kelimelerin gruplanma şeklini tasarlar ve bu çıkarıma dayanarak, kelimeler sohbet gibi belirli görevleri yerine getirmek üzere eğitilir.