Компонент "Text-to-Speech"

1. Опис

Призначений для генерації голосу із заданого тексту.

Цей компонент присутній у схемах типу:

  • Голосова.

Блок (Рис. 1(1)) використовується у полі для побудови схеми. При натисканні на блок відкривається панель налаштувань даного компонента (Рис. 1(2)).

Text-to-Speech.png
Рис. 1. Компонент "Text-to-Speech”

1.1. Блок "Text-to-Speech"

Блок складається з таких елементів:

  1. Назви компонента;

  2. Гілка "In" - гілка, що приймає (з'єднує з іншим блоком);

  3. Гілка "Out" - вихідна (з'єднує з наступним блоком) гілка.

При наведенні на поле "Out" з'являється перемикач, який дозволяє з'єднати цей компонент з компонентом, який вже має з'єднання.

Наявність іконки Screenshot 2024-11-07 154742.png позначає, що перемикач увімкнено, і цей компонент можна з'єднати з компонентом, який уже має з'єднання.

Зміна положення перемикача видаляє вихідну гілку цього компонента.

Кнопка Screenshot 2024-11-07 155145.png видаляє блок зі схеми.

1.2. Панель налаштувань "Text-to-Speech"

Складається з таких елементів:

  1. Поле "Provider";

  2. Поле "Key";

  3. Поле "Token";

  4. Поле "Language";

  5. Поле "Voice";

  6. Поле "Region";

  7. Поле "Add your custom flags here";

  8. Поле "Text type";

  9. Поле "Text";

  10. Елемент "Get speech";

  11. Елемент "Get digits";

  12. Перемикач "Break";

  13. Елемент "Limit";

  14. Елемент "Add description".

1.2.1. Поле "Provider"

Тут обирається, з чиєю допомогою буде генеруватися голос.

Доступні такі варіанти:

  • google;

  • microsoft;

  • yandex.

1.2.2. Поле "Key"

При виборі microsoft з'являється додаткове поле "Key", в яке необхідно ввести ключ.

1.2.3. Поле "Token"

При виборі yandex з'являється додаткове поле "Token", в яке необхідно ввести токен авторизації.

1.2.4 Поле "Language"

У цьому полі необхідно вибрати мову, якою необхідно озвучити текст.

1.2.5. Поле "Voice"

Поле для вибору голосу, яким буде озвучуватися заданий текст.

1.2.6. Поле "Region"

Поле присутнє при виборі microsoft у полі "Provider".

Призначене для вибору регіону.

1.2.7. Поле "Add your custom flags here"

Поле присутнє при виборі google у полі "Provider".

Поле для додавання користувацьких прапорців за допомогою написання коду у форматі JSON.

1.2.8. Поле "Text type"

Поле для вибору типу тексту. Доступні такі варіанти:

  • ssml (мова розмітки синтезу мови) - являє собою засновану на XML мову розмітки для додатків синтезу мови;

  • text - звичайний текст.

1.2.9. Поле "Text"

У цьому полі вказується текст, який необхідно перетворити на звук.

1.2.10. Елемент "Get speech"

Призначений для розпізнавання, що говорить абонент під час прослуховування звуків, які налаштовані в цьому компоненті.

Складається з:

  1. Перемикач "Get speech";

  2. Поле "Timeout".

1.2.10.1. Перемикач "Get speech"

Призначений для увімкнення/вимкнення можливості розпізнавання, що говорить абонент під час прослуховування звуків, які налаштовані в цьому компоненті.

Розпізнана мова зберігається у змінну - google_transcript.

1.2.10.2. Поле "Timeout"

У цьому полі вказується кількість мілісекунд після закінчення мовлення, коли ми ще розпізнаємо, що говорить абонент.

У ввімкненому положенні одночасно може перебувати тільки один із перемикачів, "Get speech" або "Get digits".

1.2.11. Елемент "Get digits"

Призначений для отримання інформації про те, що натискає абонент під час прослуховування звуків, які налаштовані в цьому компоненті.

Складається з таких елементів:

  1. Перемикач "Get digits";

  2. Поле "Min";

  3. Поле "Max";

  4. Поле "Set result to variable";

  5. Поле "Timeout";

  6. Поле "Digit timeout (ms)";

  7. Поле "Tries";

  8. Поле “Terminators”;

  9. Перемикач "Flush DTMF".

1.2.11.1. Перемикач "Get digits"

Призначений для увімкнення/вимкнення можливості отримувати інформацію про те, що натискає абонент під час прослуховування звуків, які налаштовані в цьому компоненті.

1.2.11.2. Поле "Min"

Тут вказується мінімальна кількість цифр, які ми очікуємо отримати від абонента.

1.2.11.3. Поле "Max"

Тут вказується максимальна кількість цифр, які ми очікуємо отримати від абонента.

1.2.11.4. Поле "Set result to variable"

Задаємо назву змінної, до якої записуватимуться значення, що їх обрав абонент під час прослуховування звуків, які налаштовані в цьому компоненті.

У разі ввімкненого перемикача "Get speech" у змінну записується розпізнана мова абонента у вигляді тексту.

У разі ввімкненого перемикача "Get digits" у змінну записується цифра(-и), які натиснув абонент.

1.2.11.5. Поле "Timeout"

Тут вказується час очікування на відповідь або введення абонентом необхідної кількості цифр.

1.2.11.6. Поле "Digit timeout (ms)"

Тут вказується час очікування між набором цифр — скільки мілісекунд очікувати на набір наступної цифри. Якщо це поле не заповнене, то обмеження беруться з поля "Timeout".

1.2.11.7. Поле "Tries"

Тут вказується кількість спроб для абонента ввести необхідну кількість цифр.

1.2.11.8. Поле “Terminators”

Якщо в полі вказано символ -, то натискання в телефоні кнопки "#" записується у змінну. Застосовується для можливості використовувати кнопку "#" у голосовому меню.

Якщо в полі вказано #, то під час натискання в телефоні кнопки "#" виконується вихід із програвання звукового файлу.

1.2.11.9. Перемикач "Flush DTMF"

Відповідає за можливість анулювати набрані абонентом цифри до початку програвання запису.

Снимок экрана 2024-06-07 154953.png - анулює набрані абонентом цифри;

Screenshot 2024-03-26 145227.png - не анулює набрані абонентом цифри.

1.2.12. Перемикач "Break"

1.2.13. Елемент "Limit"

Рис. 2. Встановлення ліміту

1.2.14. Елемент "Add description"

Рис. 3. Елемент "Add description"