Герман Зубов →  Можно ли с помощью современных компьютерных технологий сфабриковать фонограмму речи конкретного человека?

В ближайшие 3-4 года будет невозможно сфабриковать или синтезировать голос и речь конкретного человека на таком уровне, при котором даже обычный человек не смог бы распознать подделку.
Подобный синтез речи станет возможным, когда будет разработана точная математическая модель речеобразующего тракта человека. Пока это не удалось ни одному научному коллективу ни в нашей стране, ни за рубежом.
В настоящее время все синтезаторы речи используют т.н. компилятивный аллофонный синтез или более совершенный его вариант — Hybrid Unit Selection TTS, при котором речь «создается» соединением заранее записанных отдельных звуков, сочетаний звуков или даже целых слов. Чтобы создать такой синтезатор необходимы большие трудозатраты по сбору звуковой базы (однородной по качеству), её сегментации, подбору и обеспечению бесшовного соединения фрагментов речи.

3 комментария

Алексей Кандышев
добрый день! занимаемся сбором и фикс док-в
не хотите у нас статейку дать — тема: аудио док-ва: бесплатно на взаимовыгодной основе — пример:
www.avtor-protiv.ru/e/2117861-diktofonnaya-zapis-v-sude

приглашаем к сотрудничеству!
0
Герман Зубов
С удовольствием, если можно будет сделать ссылку на сайт автора. На какой e-mail высылать?
0