Adıyaman Üniversitesi Kurumsal Arşivi

Türkçe konuşma tanıma sistemi için geniş kelime dağarcığına sahip test veri kümesinin geliştirilmesi ve yeni bir test prosedürü

Basit öğe kaydını göster

dc.contributor.author Oyucu, Saadin
dc.date.accessioned 2022-05-17T08:01:04Z
dc.date.available 2022-05-17T08:01:04Z
dc.date.issued 2022
dc.identifier.issn 2149-0309
dc.identifier.uri http://dspace.adiyaman.edu.tr:8080/xmlui/handle/20.500.12414/2972
dc.description.abstract Otomatik konuşma tanıma sistemlerindeki en temel sorun, alana özgü bir otomatik konuşma tanıma sisteminin geliştirilmesi değil, geniş kelime dağarcığına sahip bir otomatik konuşma tanıma sisteminin geliştirilmesidir. Geniş kelime dağarcığına sahip olacak şekilde geliştirilen otomatik konuşma tanıma sistemleri, geniş kelime dağarcığına sahip bir test veri kümesi ile test edilmelidir. Bu nedenle çalışma kapsamında bir otomatik konuşma tanıma test veri kümesi hazırlanmıştır. Hazırlanan otomatik konuşma tanıma test veri kümesi, 20 farklı alandan konuşmaları ve bu konuşmalara karşılık gelen metin dosyalarını içermektedir. Çalışma kapsamında sunulan test prosedürü, geniş kelime dağarcığına sahip farklı Türkçe otomatik konuşma tanıma sistemleri üzerinde de test edilmiştir. Elde edilen kelime hata oranı sonuçlarının %14-21 arasında değişkenlik gösterdiği görülmüştür. Geniş kelime dağarcığına sahip olacak şekilde hazırlanan test veri kümesi ve test prosedürü, ilerideki çalışmalarda otomatik konuşma tanıma sistemlerinin başarısının daha net ortaya konması için yol göstericidir. tr
dc.description.abstract The most fundamental problem in the automatic speech recognition systems is not the development of a domain specific automatic speech recognition system, but the development of an automatic speech recognition system with a large vocabulary. Developed automatic speech recognition systems should be tested with a large vocabulary test dataset. For this reason, an automatic speech recognition test corpus was prepared within the scope of the study. Prepared automatic speech recognition test corpus includes conversations from 20 different areas and text files of these conversations. The test procedure presented in the study was also tested on Turkish automatic speech recognition systems with a large vocabulary. It has been observed that the word error rate results ranged between 14-21%. The test corpus and test procedure with a large vocabulary prepared are guiding for the success of automatic speech recognition systems in future studies to be revealed more clearly. tr
dc.language.iso en tr
dc.publisher Adıyaman Üniversitesi tr
dc.subject Konuşma tanıma tr
dc.subject Türkçe konuşma tanıma tr
dc.subject Konuşma veri seti tr
dc.subject Türkçe konuşma veri seti tr
dc.subject Test veri seti tr
dc.subject Speech recognition tr
dc.subject Turkish speech recognition tr
dc.subject Speech corpus tr
dc.subject Test corpus tr
dc.subject Turkish speech corpus tr
dc.title Türkçe konuşma tanıma sistemi için geniş kelime dağarcığına sahip test veri kümesinin geliştirilmesi ve yeni bir test prosedürü tr
dc.title.alternative Development of test corpus with large vocabulary for Turkish speech recognition system and a new test procedure tr
dc.type Article tr
dc.contributor.authorID 0000-0003-3880-3039 tr
dc.contributor.department Adıyaman University, Faculty of Engineering, Department of Computer Engineering, Adıyaman, 02040, Turkey tr
dc.identifier.endpage 164 tr
dc.identifier.issue 16 tr
dc.identifier.startpage 156 tr
dc.identifier.volume 9 tr
dc.source.title Adıyaman Üniversitesi Mühendislik Bilimleri Dergisi tr


Bu öğenin dosyaları:

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster