К Международному дню слепых, отмечаемому ежегодно 13 ноября, ФГУП «Стандартинформ» подготовил обзор национального стандарта «Синтезаторы речи специальных компьютерных рабочих мест для инвалидов по зрению. Технические требования».
ГОСТ Р 52873–2017 будет введен в действие с 01.01.2019 года взамен ГОСТ Р 52873-2007.
Стандарт распространяется на синтезаторы речи, применяемые инвалидами по зрению в качестве компонента специального компьютерного рабочего места как средства реабилитации.
Синтезатор речи – техническое средство, преобразующее текст, составленный на различных языках, в звуковой сигнал.
Синтезаторы речи разделяются на: моноязычные (например, только русский язык) и многоязычные (например, русский и английский и др.); программные (функционирующие на базе технических и программных средств) и аппаратные (действующие на базе технических средств).
Синтезатор речи обеспечивает пользователю комфортные условия работы, которые включают в себя такие параметры, как слитность воспроизведения звуков в словах, разборчивость речи, близость голоса к человеческому и др., т.е. характеристики, которые влияют на утомляемость пользователя при прослушивании больших массивов информации.
Программные средства синтезатора речи должны состоять из: текстового процессора, транскриптора, звуковой базы, формирователя речевого сигнала, блока вывода звука.
Текстовый процессор должен обладать функциями выделения предложений в тексте, прочтения заголовков электронных писем и документов, а также анализировать использование «е» и «ё», выполнять задачи омонимии (замОк или зАмок), расставлять ударения в словах. Система должна определять тип интонации предложения, а также места установки и длительность пауз в чтении.
Транскриптор преобразует полученный от текстового процессора текст в последовательность звуков.
Затем, используя звуковую базу, формируется речевой сигнал.
Программа синтезатора речи имеет блок вывода звука: с помощью соответствующих стандартных интерфейсов формируется звуковой поток данных на встроенную звуковую карту компьютера.
Программные средства синтезатора должны включать в себя возможность регулировки скорости речи при неизменной высоте основного тона. В качестве норматива устанавливается средняя скорость воспроизведения на уровне 90 слов в минуту, а также возможность регулировки высоты голоса при неизменной скорости, регулировки громкости звучания.
Система должна обеспечивать необходимую степень разборчивости речи. Речь считается разборчивой, если она понятна пользователям при средней скорости воспроизведения в диапазоне от 80 до 180 слов в минуту.