KooBAudio 2.0

Readme

Содержание:

О программе

Системные требования

О проектах и «библиотеке»

Поддержка голосовых движков

О контекстной справке

Хранение данных

Исправление ошибок в реестре

Контактная информация

 

 

О программе:

KooBAudio – программа для преобразования электронных текстов в аудиокниги с помощью установленных в системе движков речевого синтеза.

Основные возможности программы:

·         Импорт текстовых документов в форматах FB2, RTF, DOC*, TXT
(*при наличии
Microsoft.Word)

·         Разделение книги на отдельные файлы по оглавлению (автоматически при импорте FB2 документов, или с помощью поиска по шаблонам) и / или блоки определенной длинны.

·         Запись аудиофайлов в форматах MP3, AAC, и многих других посредством настраиваемых пользователем внешних кодеков

·         Поддерживаются полностью настраиваемые тэги аудиофайлов и встраивание обложки.

·         Высокая скорость записи аудиофайлов, сжатие аудиосигнала напрямую, без промежуточных WAV файлов.

·         Для максимально эффективного использования ресурсов многоядерных процессоров поддерживается параллельная запись нескольких файлов.

·         Обработка аудио сигнала речевого синтезатора различными эффектами (эквалайзер, реверберация и т.п.)

·         Пакетный режим записи.

·         «Анализ диалогов» - возможность задать независимые параметры голоса (скорость чтения и тембр) для прямой речи и слов автора в диалогах. Это придает компьютерному голосу больше выражения, подчеркивая переход от слов автора к репликам персонажей.

·         Использование дополнительного голосового движка для чтения фрагментов текста на иностранных языках (т.н. билингва)

·         Настраиваемые паузы для различных знаков препинания.

·         Встроенная предварительная обработка текста словарями ударений на основе регулярных выражений или упрощенного синтаксиса подстановочных символов.

·         Встроенный редактор словарей ударений с расширенными возможностями фильтрации и поиска.

·         «Словарный анализ» - вывод в виде списка всех слов встречающихся в тексте книги в порядке частоты употребления. Автоматическая группировка родственных слов (с различными окончаниями) и подбор шаблона для правила словаря. Всё это позволяет быстро проверить произношение движком имен и названий, употребляемых в книге, и при необходимости добавить правила в словарь ударений.

·         Словарь склонения числительных. В KooBAudio встроена собственная (не зависящая от используемого движка) функция преобразования чисел в текстовый вид с определением формы (простое или порядковое числительное, падеж, род, число) слова. Это позволяет исправить неправильное произношение движком любых чисел, в том числе дат. Например, текст «8 февраля 2011 года» будет заменен на «восьмое февраля две тысячи одиннадцатого года» (Nicolai без словарей произнес бы как «восемь февраля две тысячи одиннадцать года»). Для определения формы числительного используются регулярные выражения из служебного словаря «numeric.dic»

 

Системные требования

·         Операционная система: Windows XP / Windows Vista / Windows 7
(поддерживаются 32 и 64 битные версии ОС)

·         Процессор с тактовой частотой 1 ГГц или выше (рекомендуется 2+ ядерный процессор)

·         Оперативная память: 256 МБ (XP) / 1024МБ (Vista / 7)

·         Разрешение экрана 1024x768 или выше

·         Microsoft .NET Framework 4.0

·         SAPI5 совместимый речевой синтезатор (рекомендуемый: "ELAN TTS Russian (Nicolai 16Khz)")

 

 

О проектах и «библиотеке»:

Программа использует систему так называемых проектов: вся необходимая для записи отдельной аудиокниги информация, включающая базовые сведения о книге (автор, название итд), исходные и обработанные (подготовленные для озвучивания речевым синтезатором) блоки текста, сохраняется в собственном формате в библиотеке программы.
После импорта нового, или внесения изменений в уже имеющийся в библиотеке проект, его текст необходимо подготовить к озвучиванию речевым синтезатором. Подготовка включает операции «Анализ диалогов», «замена числительных», и «обработка словарями ударений». Подготовка запускается автоматически, и работает в фоновом режиме.
Скорость подготовки проекта зависит в первую очередь от объёмов подключенных словарей ударений и производительности компьютера. В некоторых случаях эта операция может занять довольно продолжительное время…

После завершения подготовки проект, что называется, «готов к употреблению». Можно начинать запись в выбранный аудиоформат или прослушать с компьютера с помощью встроенной «читалки».

 

 

Поддержка голосовых движков:

Начиная с версии 2.0.8.00 в программе поддерживаются два различных API для доступа к установленным в системе голосовым движкам. У каждого из них есть определенные достоинства и недостатки:

1.Встроенный в платформу .NET Framework System.Speech.Synthesis

[+] Качественный встроенный алгоритм  ресэмплинга (преобразование частоты дискретизации аудиосигала речевого движка)

[-] В SMML режиме управление тембром голоса сильно ограниченно

[-] Не совместим с некоторыми движками

[-] Наличие некорректных записей в реестре может вызывать критическую ошибку при инициализации (см. пункт «Исправление ошибок в реестре»)

2. SAPI 5 / SpeechLib (sapi.dll)

[+] Совместим с большинством распространенных на сегодняшний день голосовых движков

[-] При выборе «не родной» частоты аудио сигнала и / или при микшировании голосов с разной частотой в режиме «билингвы» используется низкокачественный алгоритм ресэмплинга, и качество звука заметно ухудшается

[-] Выше задержка при произношении слов в редакторе словарей

 

 

О контекстной справке:

В программе предусмотрено два вида справочной информации:

1.    Всплывающие подсказки. Появляются автоматически при наведении курсора мыши на интересующий элемент. Содержат краткое описание функции элемента.

2.    Контекстная справка. Доступна в окне настроек программы и в окне импорта проекта. Для показа контекстной справки нажмите кнопку   ?   в правой части заголовка окна, затем щелкните мышкой по интересующему элементу.
В контекстной справке содержится более подробное описание функции элемента, примечания, рекомендации ит.д.

 

 

Хранение данных

При первом запуске программы будет предложен выбор папки, в которой будут сохраняться настройки и прочие файлы пользователя.

 

В однопользовательском режиме используется каталог Application Data текущего пользователя Windows. Т.е. у каждой учетной записи Windows будут свои настройки, книги в библиотеке и т.д...

Расположение каталога зависит от версии ОС

·         XP:
C:\Documents and Settings\Имя пользователя\Application Data\KooBAudio\

·         Vista / 7:
С:\Users\Имя пользователя\AppData\Roaming\KooBAudio\

 

В многопользовательском режиме используется каталог общий Application Data . Т.е. у всех учетных записей Windows будут общие настройки, книги в библиотеке и т.д...

Расположение каталога зависит от версии ОС:

·         XP:
C:\Documents and Settings\All Users\Application Data\KooBAudio\

·         Vista / 7:
С
:\ProgramData\KooBAudio\

 

В portable режиме используется каталог, в котором расположен исполняемый файл программы. Настройки, книги в библиотеке и прочие данные не будут зависеть от учетной записи Windows. Папку с portable версией программы можно записать на любой внешний носитель и запускать на разных компьютерах (при условии, что на них установлен .NET Framework и нужный голосовой движок).

Не рекомендуется выбирать portable режим на операционных системах Windows Vista / 7, если программа была установлена в каталог Program Files, т.к. доступ к записи/изменению файлов в этой папке может быть заблокирован службой Windows UAC

 

 

Исправление ошибок в реестре

Некоторые голосовые движки от сторонних разработчиков при установке прописывают в реестр данные в некорректном формате, что крайне негативно влияет на работу одного из используемых в KooBAudio компонента среды .NET (System.Speech.Synthesis). Фактически использование всех речевых движков при наличии хотя бы одной проблемной записи в реестре становится невозможным.

В целях решения этой проблемы KooBAudio при каждом запуске перед инициализацией речевого синтеза сканирует ветку реестра HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\ и при обнаружении проблем предлагает исправить их в автоматическом режиме.

Известные на сегодняшний день типы ошибок:

Важно! Перед внесением изменений рекомендуется сделать бэкап ветви реестра HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\  Автоматическое исправление ошибок позволит избежать вылетов при запуске и инициализации класса речевого синтеза «.NET» в KooBAudio, но работоспособность с соответствующими «проблемными» движками  при этом не гарантируется.

 

Контактная информация

 

Сайт:                           http://koobaudio.narod.ru

Форум поддержки:   http://koobaudio.borda.ru

E-mail:                         koobaudio@gmail.com