KooBAudio 2.0
Readme
Содержание:
KooBAudio
– программа для преобразования электронных текстов в аудиокниги с помощью установленных в системе движков речевого синтеза.
Основные возможности
программы:
·
Импорт текстовых документов в
форматах FB2,
RTF,
DOC*,
TXT
(*при наличии Microsoft.Word)
·
Разделение книги на отдельные
файлы по оглавлению (автоматически при импорте FB2 документов, или с
помощью поиска по шаблонам) и / или блоки определенной длинны.
·
Запись аудиофайлов в форматах MP3,
AAC, и многих других посредством настраиваемых пользователем внешних кодеков
·
Поддерживаются полностью
настраиваемые тэги аудиофайлов и встраивание обложки.
·
Высокая скорость записи
аудиофайлов, сжатие аудиосигнала напрямую, без
промежуточных WAV
файлов.
·
Для максимально эффективного
использования ресурсов многоядерных процессоров поддерживается параллельная
запись нескольких файлов.
·
Обработка аудио сигнала
речевого синтезатора различными эффектами (эквалайзер, реверберация и т.п.)
·
Пакетный режим записи.
·
«Анализ диалогов» -
возможность задать независимые параметры голоса (скорость чтения и тембр) для
прямой речи и слов автора в диалогах. Это придает компьютерному голосу больше
выражения, подчеркивая переход от слов автора к репликам персонажей.
·
Использование дополнительного
голосового движка для чтения фрагментов текста на иностранных языках (т.н.
билингва)
·
Настраиваемые паузы для
различных знаков препинания.
·
Встроенная предварительная
обработка текста словарями ударений на основе регулярных выражений или
упрощенного синтаксиса подстановочных символов.
·
Встроенный редактор словарей
ударений с расширенными возможностями фильтрации и поиска.
·
«Словарный анализ» - вывод в
виде списка всех слов встречающихся в тексте книги в порядке частоты
употребления. Автоматическая группировка родственных слов (с различными окончаниями)
и подбор шаблона для правила словаря. Всё это позволяет быстро проверить
произношение движком имен и названий, употребляемых в книге, и при
необходимости добавить правила в словарь ударений.
·
Словарь склонения
числительных. В KooBAudio встроена собственная (не
зависящая от используемого движка) функция преобразования чисел в текстовый вид
с определением формы (простое или порядковое числительное, падеж, род, число)
слова. Это позволяет исправить неправильное произношение движком любых чисел, в
том числе дат. Например, текст «8 февраля 2011 года» будет заменен на «восьмое
февраля две тысячи одиннадцатого года» (Nicolai без
словарей произнес бы как «восемь февраля две тысячи одиннадцать года»). Для
определения формы числительного используются регулярные выражения из служебного
словаря «numeric.dic»
·
Операционная
система: Windows XP / Windows
Vista / Windows 7
(поддерживаются 32 и 64 битные версии ОС)
·
Процессор
с тактовой частотой 1 ГГц или выше (рекомендуется 2+ ядерный процессор)
·
Оперативная
память: 256 МБ (XP) / 1024МБ (Vista / 7)
·
Разрешение
экрана 1024x768 или выше
·
Microsoft .NET Framework 4.0
·
SAPI5 совместимый речевой
синтезатор (рекомендуемый: "ELAN
TTS Russian (Nicolai
16Khz)")
О проектах и
«библиотеке»:
Программа использует систему
так называемых проектов: вся необходимая для записи отдельной аудиокниги
информация, включающая базовые сведения о книге (автор, название итд), исходные и обработанные (подготовленные для
озвучивания речевым синтезатором) блоки текста, сохраняется в собственном
формате в библиотеке программы.
После импорта нового, или внесения изменений в уже имеющийся в библиотеке
проект, его текст необходимо подготовить к озвучиванию речевым синтезатором.
Подготовка включает операции «Анализ диалогов», «замена числительных», и
«обработка словарями ударений». Подготовка запускается автоматически, и
работает в фоновом режиме.
Скорость подготовки проекта зависит в первую очередь от объёмов подключенных
словарей ударений и производительности компьютера. В некоторых случаях эта
операция может занять довольно продолжительное время…
После завершения подготовки
проект, что называется, «готов к употреблению». Можно начинать запись в выбранный аудиоформат или
прослушать с компьютера с помощью встроенной «читалки».
Начиная с
версии 2.0.8.00 в программе поддерживаются два различных
API
для
доступа к установленным в системе голосовым движкам. У каждого из них есть
определенные достоинства и недостатки:
1.Встроенный в платформу .NET Framework
“System.Speech.Synthesis”
[+]
Качественный
встроенный алгоритм ресэмплинга
(преобразование частоты дискретизации аудиосигала
речевого движка)
[-]
В SMML
режиме
управление тембром голоса сильно ограниченно
[-]
Не совместим с некоторыми движками
[-]
Наличие некорректных записей в реестре может вызывать критическую ошибку при
инициализации (см. пункт «Исправление ошибок в реестре»)
2.
SAPI
5 / SpeechLib
(sapi.dll)
[+]
Совместим с большинством распространенных на сегодняшний день голосовых движков
[-]
При выборе «не родной» частоты аудио сигнала и / или при микшировании голосов с
разной частотой в режиме «билингвы» используется низкокачественный алгоритм ресэмплинга, и качество звука заметно ухудшается
[-]
Выше
задержка при произношении слов в редакторе словарей
В программе предусмотрено два
вида справочной информации:
1. Всплывающие
подсказки. Появляются автоматически при наведении курсора мыши на интересующий
элемент. Содержат краткое описание функции элемента.
2.
Контекстная справка. Доступна в окне настроек программы и в окне импорта проекта.
Для показа контекстной справки нажмите кнопку ?
в правой части заголовка окна, затем
щелкните мышкой по интересующему элементу.
В контекстной справке содержится более подробное описание функции элемента,
примечания, рекомендации ит.д.
При первом запуске программы
будет предложен выбор папки, в которой будут сохраняться настройки и прочие
файлы пользователя.
В однопользовательском
режиме используется каталог Application Data текущего пользователя Windows. Т.е. у
каждой учетной записи Windows будут свои настройки, книги в библиотеке
и т.д...
Расположение каталога зависит
от версии ОС
·
XP:
C:\Documents and Settings\Имя пользователя\Application
Data\KooBAudio\
·
С:\Users\Имя пользователя\AppData\Roaming\KooBAudio\
В многопользовательском
режиме используется каталог общий Application Data . Т.е. у всех учетных
записей Windows
будут общие настройки, книги в библиотеке и т.д...
Расположение каталога зависит
от версии ОС:
·
XP:
C:\Documents and Settings\All Users\Application Data\KooBAudio\
·
С:\ProgramData\KooBAudio\
В portable режиме
используется каталог, в котором расположен исполняемый файл программы.
Настройки, книги в библиотеке и прочие данные не будут зависеть от учетной
записи Windows.
Папку с portable
версией
программы можно записать на любой внешний носитель и запускать на разных
компьютерах (при условии, что на них установлен .NET Framework и
нужный голосовой движок).
Не рекомендуется
выбирать portable
режим
на операционных системах Windows Vista / 7, если программа была
установлена в каталог Program Files, т.к. доступ
к записи/изменению файлов в этой папке может быть заблокирован службой Windows UAC
Некоторые голосовые движки от
сторонних разработчиков при установке прописывают в реестр данные в
некорректном формате, что крайне негативно влияет на работу одного из
используемых в KooBAudio
компонента
среды .NET
(System.Speech.Synthesis). Фактически
использование всех речевых движков при наличии хотя бы одной проблемной
записи в реестре становится невозможным.
В целях решения этой проблемы KooBAudio
при
каждом запуске перед инициализацией речевого синтеза сканирует ветку реестра HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\ и
при обнаружении проблем предлагает исправить их в автоматическом режиме.
Известные на сегодняшний день
типы ошибок:
Важно! Перед внесением
изменений рекомендуется сделать бэкап ветви реестра HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens\ Автоматическое исправление ошибок позволит
избежать вылетов при запуске и инициализации класса речевого синтеза «.NET» в KooBAudio,
но работоспособность с соответствующими «проблемными» движками при этом не гарантируется.
Сайт: http://koobaudio.narod.ru
Форум
поддержки: http://koobaudio.borda.ru
E-mail: koobaudio@gmail.com