Преобразователь голоса своими руками

Содержание

Устройство изменения голоса в реальном времени на Ардуино
Комплектующие
Проект
Схема устройства
Код проекта
Схемы имитаторов звуковых эффектов, изменение голоса
Схемы имитаторов звуковых эффектов, изменение голоса
Схема приставки
Второй вариант приставки
Преобразователя напряжение-ширина импульсов
Преобразователь голоса своими руками

Устройство изменения голоса в реальном времени на Ардуино

Создадим устройство на основе шилда Audio Hacker и платы Arduino, которое будет изменять голос в реальном времени.

Чтобы сразу понять как это работает — лучше всего посмотреть видео ниже. За проект огромное спасибо ребятам из «nootropic design».

Комплектующие

Для этого устройства нам понадобится немного деталей:

Arduino UNO или Genuino UNO × 1
Audio Hacker shield × 1
Поворотный потенциометр (универсальный) × 1

Проект

Простой проект с использованием шилда Audio Hacker для плат Arduino от компании»nootropic design». Это речевой чейнджер (от англ. — замена) в реальном времени, который является усовершенствованием исходного примера, который предоставлен в библиотеке Audio Hacker.

Мы используем технику, называемую гранулярным синтезом, чтобы изменить высоту ввода. Гранулярный синтез довольно сложен, но он включает в себя разделение семпла на маленькие фрагменты, называемые «зернами».

Гранулярный синтез (англ. Granular synthesis) — последовательная генерация звуковых гранул. Каждая гранула — это ультракороткая частица звука длиной в 10—100 миллисекунд. Звук получается в результате быстрого взаимодействия частоты повторения и частотных составляющих гранул, который далее может быть отфильтрован и сформирован огибающей методами вычитающего синтеза. Гранулами часто управляет Клеточный Автомат, который производит псевдослучайные последовательности. Гранулярный синтез очень сложен в управлении и даёт совершенно неожиданные результаты.

Одним из первых реализаций гранулярного синтеза была в программе Ross Bencina AudioMulch в виде эффекта, а уже потом появилась в виде синтезатора в Reason.

Из наиболее известных программных инструментов, применяющих гранулярный синтез, можно назвать Аbsynth, а из эффектов — Glitch. В аппаратном решении гранулярный синтез можно встретить в рабочей станции Kyma, а также в приборах обработки звука Eventide.

Теория гранулярного синтеза была разработана Дэннисом Габором.

При воспроизведении семпла, если мы хотим увеличить высоту тона, мы воспроизводим «зерно» с более высокой скоростью, но мы воспроизводим его снова и снова до тех пор, пока это не займет столько же времени, сколько и «зерно», воспроизводимое на исходной скорости. Аналогично, чтобы снизить высоту, мы воспроизводим каждое «зерно» с более медленной скоростью, но переходим к следующему «зерну раньше», чтобы общая длительность сэмпла была одинаковой.

Этот речевой чейнджер в реальном времени только снижает высоту звука. Повышение высоты звука потребует задержки для записи чего-либо и более быстрого воспроизведения фрагментов. Понижение высоты звука достигается записью входа и одновременным его замедленным воспроизведением. То есть «воспроизводящая головка» движется медленнее, чем «записывающая головка». Иногда воспроизводящая головка должна пропускать некоторые входные данные и догонять записывающую головку. Таким образом, воспроизведение занимает столько же времени как запись, что создает ощущение реального времени.

Схема устройства

Схема нашего устройства представлена на изображении ниже. Нажмите для увеличения.

Код проекта

Примеры и основной код устройства в архиве ниже, а также на GitHub странице автора. Вы можете загрузить библиотеку в IDE Arduino с помощью:

File -> Examples -> Audio Hacker -> RealtimeVoiceChanger

На этом всё. Надеемся, что вы будете использовать это устройство только в законных целях.

Источник

Схемы имитаторов звуковых эффектов, изменение голоса

Схема (рис. 5.73) предназначена для работы с любым источником звукового сигнала и позволяет изменить спектр на выходе относительно входного. Например, из обычной разговорной речи сделать “компьютерный голос». Достигается это за счет модуляции исходного сигнала прямоугольными импульсами, которые формирует генератор на микросхеме DA1 (рабочая частота у него выбрана около 10 Гц).

Рис. 5.73. Схема приставки для имитации “компьютерного” голоса

Возникающие при этом искажения создают новые частотные составляющие в спектре исходного сигнала, которые и меняют тембр звука, например голоса, делая его менее похожим на оригинал. Для получения нужного спектра может потребоваться регулировка элементов R3 и R2. Транзистор используется в качестве управляемого напряжением резистора и образует вместе с R4 управляемый напряжением аттенюатор.

Еще одна схема для изменения спектра сигнала показана на рис. 5.74 [Л40]. В ней звуковой сигнал модулируется с частотой 50-90 Гц (частота изменяется резистором R2), вырабатываемой микросхемой DA1. Чтобы не было сильных искажений и ухудшения разборчивости, входной сигнал не должен превышать уровень в 150 мВ и поступать от источника с низким выходным сопротивлением, например, от электродинамического микрофона. Выходной сигнал подается на любой внешний усилитель. При этом во многих случаях можно не устанавливать конденсаторы С4-С5 (если в звуковом сигнале нет постоянной составляющей).

Для создания некоторых устройств (стабилизации напряжения или скорости вращения электромотора, автоматического зарядного устройства и др.) может потребоваться преобразователь управляющего входного напряжения в ширину выходных импульсов. Вариант схемы такого узла приведен на рис. 5.75 [Л46], она обеспечивает точность преобразования не хуже 1 %.

Рис. 5.74. Второй вариант приставки для создания звуковых эффектов

Рис. 5.75. Схема преобразователя напряжение-ширина импульсов и диаграммы, поясняющие работу

Микросхема DA1 имеет отечественный аналог К140УД7 и работает в качестве интегратора разности напряжений Uвх и Uon, а на таймере DA2 собран одновибратор с запуском от внешнего тактового генератора. Резистор R2 служит для установки нужной минимальной ширины импульсов.

Литература: Радиолюбителям: полезные схемы, Книга 5. Шелестов И.П.

Источник

Схемы имитаторов звуковых эффектов, изменение голоса

Приведены принципиальнаые схемы приставок для обработки голоса, получения искажения по типу «компьютерный голос». Устройства будут полезны для озвучивания разных событий с использованием звуковых эффектов.

Схема приставки

Схема на рисунке 1 предназначена для работы с любым источником звукового сигнала и позволяет изменить спектр на выходе относительно входного. Например, из обычной разговорной речи сделать “компьютерный голос». Достигается это за счет модуляции исходного сигнала прямоугольными импульсами, которые формирует генератор на микросхеме DA1 (рабочая частота у него выбрана около 10 Гц).

Рис. 1. Схема приставки для имитации компьютерного голоса.

Для получения нужного спектра может потребоваться регулировка элементов R3 и R2. Транзистор используется в качестве управляемого напряжением резистора и образует вместе с R4 управляемый напряжением аттенюатор.

Второй вариант приставки

Еще одна схема для изменения спектра сигнала показана на рисунке 2. В ней звуковой сигнал модулируется с частотой 50-90 Гц (частота изменяется резистором R2), вырабатываемой микросхемой DA1.

Рис. 2. Второй вариант приставки для создания звуковых эффектов.

Чтобы не было сильных искажений и ухудшения разборчивости, входной сигнал не должен превышать уровень в 150 мВ и поступать от источника с низким выходным сопротивлением, например, от электродинамического микрофона. Выходной сигнал подается на любой внешний усилитель. При этом во многих случаях можно не устанавливать конденсаторы С4-С5 (если в звуковом сигнале нет постоянной составляющей).

Преобразователя напряжение-ширина импульсов

Для создания некоторых устройств (стабилизации напряжения или скорости вращения электромотора, автоматического зарядного устройства и др.) может потребоваться преобразователь управляющего входного напряжения в ширину выходных импульсов. Вариант схемы такого узла приведен на рисунке 3, она обеспечивает точность преобразования не хуже 1 %.

Рис. 3. Схема преобразователя напряжение-ширина импульсов и диаграммы, поясняющие работу.

Литература: Радиолюбителям: полезные схемы, Книга 5. Шелестов И.П.

Источник

Преобразователь голоса своими руками

Прежде всего — С НОВЫМ ГОДОМ!

Срочно нужно выбрать тему для дипломной работы.

В связи с этим хотел бы обратиться к вам. Узнать ваше мнение.

1. Схема для изменения голоса.
Суть:
Все вы знаете МАКСИМА ГАЛКИНА.
Он пародирует знаминитостей.
В принципе у каждого человека есть свой тембр голоса, некая постоянная частота его говора.
Что если эту постоянную частоту распознать и заменять её на другую, какую вы захотите. Электронно естестно.
Вы берёте микрофон — выбираете чим голосом будете говорить и говорите в микрофон своим голосом а спец схема преобразовывает вашу тональность в другую.

Ваше мнение, заранее спасибо.

Последний раз редактировалось Радиогубитель! Сб дек 30, 2006 21:45:53, всего редактировалось 1 раз.

Мышонок

Друг Кота

Карма: 6
Рейтинг сообщений: 30
Зарегистрирован: Чт сен 14, 2006 11:42:09
Сообщений: 3792
Откуда: Обитаю на чердаке
Рейтинг сообщения: 0

_________________
Память очень интересная штука: бывает так, что запомнишь одно, а вспомнишь другое.

Последний раз редактировалось Мышонок Вс дек 31, 2006 06:15:30, всего редактировалось 1 раз.

JLCPCB, всего $2 за прототип печатной платы! Цвет — любой!

Зарегистрируйтесь и получите два купона по 5$ каждый:https://jlcpcb.com/cwc

Радиогубитель!

Первый раз сказал Мяу!

Зарегистрирован: Сб дек 30, 2006 21:16:10
Сообщений: 20
Рейтинг сообщения: 0

Цель в принципе проста — создать устройство.
Этап 1 : Вы создаёте базу данных в устройстве — где храниться информация о тональностях.
Этап 2 : Вы говорите в микрофон.
Устройство распознаёт вашу тональность и записывает её в память
Этап 3 : Вы выбираете из базы данных устройства нужный голос.
Этап 4 : Вы говорите в микрофон а ваша тональность заменяется на выбранную из базы.

Просто у меня знакомая работает на корпоративных вечеринках ей это нужно для пародирования, ну и думаю пригодиться тем кто озвучивает собственные фильмы, чтоб не приглашать много актёров.

Сборка печатных плат от $30 + БЕСПЛАТНАЯ доставка по всему миру + трафарет

Радиогубитель!

Первый раз сказал Мяу!

Зарегистрирован: Сб дек 30, 2006 21:16:10
Сообщений: 20
Рейтинг сообщения: 0

И какая задержка для распознавания?

Не будет ощущаться расхождений в шевелении губ и звука?

Понимаю что зависит от частоты.
Но может знаете откуда начинается диапазон тональности у человека.
Думаю не с 20 Гц

Вебинар поможет в выборе недорогих источников питания оптимальных для систем охраны, промышленных и телекоммуникационных приложений, а также для широкого применения. Будут представлены основные группы источников питания по конструктивным признакам и по областям применения в контексте их стоимости или их особенностей, позволяющих снизить затраты на электропитание конечного устройства.

KT315B

Сверлит текстолит когтями

Карма: 11
Рейтинг сообщений: 13
Зарегистрирован: Пт июл 21, 2006 15:05:19
Сообщений: 1243
Откуда: плод воображения
Рейтинг сообщения: 0
Медали: 1

Приглашаем всех желающих 13 октября 2021 г. посетить вебинар, посвященный искусственному интеллекту, машинному обучению и решениям для их реализации от Microchip. Современные среды для глубинного обучения нейронных сетей позволяют без детального изучения предмета развернуть искусственную нейронную сеть (ANN) не только на производительных микропроцессорах и ПЛИС, но и на 32-битных микроконтроллерах. А благодаря широкому портфолио Microchip, включающему в себя диапазон компонентов от микроконтроллеров и датчиков до ПЛИС, средств скоростной передачи и хранения информации, возможно решить весь спектр задач, возникающий при обучении, верификации и развёртывании модели ANN.

Мышонок

Друг Кота

_________________ Память очень интересная штука: бывает так, что запомнишь одно, а вспомнишь другое.

Радиогубитель!

Первый раз сказал Мяу!

Зарегистрирован: Сб дек 30, 2006 21:16:10
Сообщений: 20
Рейтинг сообщения: 0

Радиогубитель!

Первый раз сказал Мяу!

Зарегистрирован: Сб дек 30, 2006 21:16:10
Сообщений: 20
Рейтинг сообщения: 0

Мышонок

Друг Кота

Ещё надо не забывать про обертоны: НЧ огибающая (иногда даже инфразвуковой частоты).

Есть очень простой способ «металлизации» голоса (это приставки «Дистошн») — обычный усилитель, загоняющий синусоиду в ограничение, т.е. трапецию или даже прямоугольник. Появляется куча высших гармоник и голос приобретает «металлический» оттенок.

Другой способ «Буратино» (по технологии известного фильма). Записываем на одной скорости, проигрываем на другой. Т.е. весь сигнал одинаково смещаем в область высоких частот (проигрывание на большей скорости) или в область НЧ (воспроизведение на меньшей скорости).

_________________
Память очень интересная штука: бывает так, что запомнишь одно, а вспомнишь другое.

KT315B

Сверлит текстолит когтями

Немного не врубился в суть вопроса — наверное НГ делает свое дело. А что есть в этом контексте «несущая» частота? Частота, которая задает общую тональность голоса? Исключая обертоны, гармоники и прочее?

Мышонок

Друг Кота

_________________ Память очень интересная штука: бывает так, что запомнишь одно, а вспомнишь другое.

Старый ржавый электронщик

Говорящий с текстолитом

Карма: 4
Рейтинг сообщений: 15
Зарегистрирован: Чт дек 15, 2005 17:34:48
Сообщений: 1508
Откуда: Петрозаводск
Рейтинг сообщения: 0

_________________ путь наименьшего сопротивления проходит по пути наитолстого провода (с) Сергей Соболь

Мышонок

Друг Кота

Т.е. как я понял, мы берем частоту какой-нибудь основной (достаточно большой амплитуды) гармоники в качестве несущей? Сумма-то различных частот (гармоник) остаётся.
Я понимал (да и КТ315В, наверняка, тоже), что несущая — это частота передатчика, которая модулируется всем спектром сигнала. Фактически мы перемножаем несущую на сигнал.

И вообще, долой заумные мысли! Новый Год на носу!
Ну, за науку!

_________________
Память очень интересная штука: бывает так, что запомнишь одно, а вспомнишь другое.

Сэр Мурр

Модератор

Карма: 46
Рейтинг сообщений: 232
Зарегистрирован: Чт окт 27, 2005 18:50:07
Сообщений: 11174
Откуда: из мест не столь отдалённых
Рейтинг сообщения: 0
Медали: 2

Радиогубитель!

Первый раз сказал Мяу!

Зарегистрирован: Сб дек 30, 2006 21:16:10
Сообщений: 20
Рейтинг сообщения: 0

А может поступить так:
Создать так сказать массив из гласных.
Попробуйте сказать «до» и «во»
звук одинаковой тональности
«ди» и «ви» тоже одинаковой но расположены на другой несущей
то есть как я понимаю голос человека состоит из массива частот гласных, одной несущей согласных и шума образующего согласные путём сложения с несущей согласных.

для 1)
fбуквы а
fбуквы и
fбуквы о
fбуквы у и тд.
Причём они обязательно должны быть взаимосвязанны по определённому закону. Зная например fa путём расчёта я могу узнать все остальные f

Поправьте если я не прав?

WildCat

Собутыльник Сэра Мурра

Карма: 23
Рейтинг сообщений: 5
Зарегистрирован: Вт янв 10, 2006 00:26:45
Сообщений: 2918
Откуда: Челябинск
Рейтинг сообщения: 0

Вообще-то если вы не заметили, то все пародисты передают лишь манеру речи, а никак не сам голос.
Но если уж интересует само изменение голоса то вот что скажу:
скажите букву А. нет, не так. чуть попротяжнее, широко раскрыв рот. Отлично!
а теперь скажите О так же протяжно. Молодцы!
пронаблюдаем: голос не меняется. как мы тянули букву А, так она и осталась. все звуки образуются из-за препятствий воздуху на пути, т.е. зубы, язык, губы, например при букве О губы вытягиваются в трубочку. Если же раскрыть рот, то снова получим А. Попробуйте, произносите другие гласные, согласные и вы поймете, что голос никак не меняется от типа произносимого звука. А вот если вы проговорите что-нибудь шепотом, то ваш шепот будет неотличим от чьего-либо другого.

Таким образом, задача упростилась к минимуму — собираем простейший вокодер и модулируем голос (протяжное А) жертвы своей речью и получаем примерно то что хотели.
Как вариант используем синтетический звук — в программе-говорилке подбираем необходимый тембр и скорость речи. Но это имxo уход от темы, т.к. задача стоит в изменении голоса в реальном времени.
Существую программы — вокодеры, изменялки речи(Rave Karaoke например), обрабатывающие голос, правда, с небольшой задержкой.

Вот что я подумал — а если поставить делитель частоты на выходе? получим ту же скорость, но более низкий тон голоса? или как?

_________________
Увлекательный ресурс об электронике и не только

Источник