Файл:Merlin - An Open Source Neural Network Speech Synthesis System Ssw9 PS2-13 Wu.pdf

Материал из Материалы по машинному обучению
Перейти к: навигация, поиск
Merlin_-_An_Open_Source_Neural_Network_Speech_Synthesis_System_Ssw9_PS2-13_Wu.pdf(0 × 0 пикселей, размер файла: 571 КБ, MIME-тип: application/pdf)

Zhizheng Wu Oliver Watts Simon King The Centre for Speech Technology Research, University of Edinburgh, United Kingdom

Abstract

We introduce the Merlin speech synthesis toolkit for neural network-based speech synthesis. The system takes linguistic features as input, and employs neural networks to predict acoustic features, which are then passed to a vocoder to produce the speech waveform. Various neural network architecturesareimplemented,includingastandardfeedforwardneural network, mixture density neural network, recurrent neural network(RNN),longshort-termmemory(LSTM)recurrentneural network, amongst others. The toolkit is Open Source, written in Python, and is extensible. This paper briefly describes the system, and provides some benchmarking results on a freelyavailable corpus.

IndexTerms: Speechsynthesis,deeplearning,neuralnetwork, Open Source, toolkit

История файла

Нажмите на дату/время, чтобы просмотреть, как тогда выглядел файл.

Дата/времяРазмерыУчастникПримечание
текущий18:44, 23 декабря 20160 × 0 (571 КБ)Slikos (обсуждение | вклад)
  • Вы не можете перезаписать этот файл.

Следующая 1 страница ссылается на данный файл: