OpenAI, yapay zekanın “halüsinasyon sorununu” çözmek için insan bir fikir zinciri oluşturan lisan modeli istiyor.

OpenAI, AI’nin (yapay zeka) doğru olmayan şeyler uydurduğu yaygın “halüsinasyon sorununu” ortadan kaldırmada yaptığı birtakım ilerlemeleri özetleyen yeni bir makale yayınladı. Makale, halüsinasyonları ve nasıl ortaya çıktıklarını belirleyip temizlemek için kullanılan sonuç denetimi ve süreç denetimi olarak isimlendirilen iki modeli özetiyor.
Ödül modelleri, OpenAI’nin sonuç kontrolü modelinde yapay zekanın verdiği kesin sonuç hakkında geri bildirim sağlamak için eğitiliyor. Süreç denetiminde ise ödül modeli, insan aynıi bir fikir zinciri oluşturarak izlenen yolun her adımında geri bildirim sağlar.
OpenAI’nin araştırma makalesinde belirttiğine göre, her iki model de bir matematik data kümesi üzerinde test edildi ve süreç kontrol sisteminin “önemli ölçüde daha iyi performans sağladığı” bulundu. Lakin süreç kontrolü yolunun şu ana kadar sadece matematik alanında test edildiğini ve genel bilgi alanında nasıl performans gösterdiğini görmek için daha fazla çalışma gerekeceğini belirtmek çok önemli olabilir.
Süreç kontrol yolunun mümkün sonuçlarını açıklayan OpenAI, “Bu sonuçlar genelleştirilirse, süreç kontrolünün bize her iki seçeneğin en iyi özelliklerini bir araya getiren bir model – sonuç kontrolünden hem daha iyi performans gösteren hem de daha uyumlu bir sistem – sunduğunu görebiliriz” dedi.
Bu adım adım doğrulamanın halüsinasyonları daha genel olarak ortadan kaldırmaya ne kadar yardımcı olacağını söylemek için şimdi çok erken benzeri gözüküyor. Lakin halüsinasyonların şimdi LLM’lerin muhtemelen en büyük sorunu olduğu düşünülürse, umarız tesirli bir tahlil olacaktır.
OpenAI, halka açık olan ChatGPT hizmetinde süreç kontrolüne ne zaman geçileceği konusunda bir kestirimde bulunmadı. Yeni usul hala araştırma aşamasında bulunuyor ve genel bilgiler üzerinde test edilmesi gerekiyor.
OpenAI, ilk sonuçlar iyi olsa da daha inançlı prosedürlerin ahenk zorluğu ismi verilen düşük performansa neden olabileceğinden bahsediyor. Sonuçlar, şu ana kadar süreç kontrolünün matematik sorunları üzerinde çalışırken bu türlü bir performans düşüşü yaşamadığını öneriyor, lakin daha genel bilgilerde sonucun nasıl olacağını şimdi bilmiyoruz.