Artık Google’ın Yapay Zekâsının Sesi, İnsandan Ayırt Edilemiyor

Artık o robotik sesleri, kesik kesik konuşmaları ve sesinizi monotonlaştırarak yapılan robot taklitlerini unutun. İnanılması güç ama şimdi yapay zeka sesi ile bizden çok daha iyi seslendirme yapabiliyor.

Geçtiğimiz günlerde Google tarafından yayımlanan bir araştırmanın sonuçları bilim dünyasında büyük bir şaşkınlık yarattı. Çalışmanın sonuçlarına göre Tecatron 2 isimli yazıyı konuşmaya çeviren bir yapay zeka sistemi, yazıları insan ile aynı anlaşılırlıkta ve netlikte okuyabiliyor, üstelik vurgulara ve anlam farklarına da dikkat ederek.

Grafikler Sese Dönüşüyor

Bu sistem Google’ın derin nöral ağa sahip yapay zekasının ikinci jenerasyonu. Bu nöral ağ ilk olarak yazıyı frekans çizgilerinden oluşan ayrıntılı bir grafiğe dönüştürüyor. Daha sonra bu grafik Google’ın WaveNet denen yapay zekasına aktarılıyor ve bu da grafiği okuyarak sese dönüştürüyor.

Aşağıdaki örnekleri dinleyebilirsiniz. Bu örneklerden biri yapay zeka ile oluşturulurken diğeri bir seslendirme sanatçısı tarafından okundu. Ön yargıları ortadan kaldırmak için, hangisi insan, hangisi makine belirtilmemiş. Sadece dosyayı kaynağından indirdiğinizde hangisinin makine olduğunu görebiliyorsunuz.

Aşağıdaki metin seslendirmesinin biri robot diğeri insan.

“George Washington was the first President of the United States.”

Tacotron 2 yazıları insana benzer bir şekilde okumakla kalmıyor aynı zamanda telaffuzu çok zor kelimeleri, isimleri hatta tekerlemeleri bile mükemmel şekilde seslendiriyor. Örneğin aşağıdaki tekerlemeleri neredeyse bir insandan bile daha iyi bir şekilde okuyor. 

Aşağıdaki tekerlemeleri dinleyin.

“Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?”

“She sells sea-shells on the sea-shore. The shells she sells are sea-shells I'm sure.”

Yapay zeka aşağıdaki örnekteki gibi büyük harfler ile yazılmış kelimeleri daha vurgulu okuması gerektiğini biliyor.

“The buses aren’t the PROBLEM, they actually provide a SOLUTION.”

earbud-google
Yapay Zekanın En İşe Yarayanı

Bu teknoloji, geliştirilen diğer birçok yapay zekanın aksine Google için hemen işe yarayacak bir uygulama. Zaten son dönemde ağzımızı açık bırakan anında çeviri yapan Google kulaklığın arkasındaki teknoloji bu gelişmelerden geliyor. Tacotron 2 ile yaşanan gelişmeler, muhtemelen önümüzdeki dönemde Google akıllı asistanını da rakiplerine göre çok avantajlı bir duruma getirecek.

Ancak sistem şimdilik sadece bir kadın sesi ile konuşmaya programlandı. Erkek sesi ve farklı kadın sesleri için sistemin yeniden eğitilmesi gerekecek.

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir