Ардуино голосовой модуль – Распознавание голоса на Arduino или «Do You Know What I Am Saying?». Блог Амперкот.ру — диспротект.рф

19.11.2019| alexxlab| Нет комментариев

Ардуино голосовой модуль – Распознавание голоса на Arduino или «Do You Know What I Am Saying?». Блог Амперкот.ру

Содержание

Все о модуле распознавания голоса EasyVR (ex VRbot) / Деталька / Сообщество EasyElectronics.ru

Сегодня я наконец возьму и эпически сорву покрова с этих самых модулей EasyVR, так как тема сисек, ящитаю, практически не раскрыта. Покрова буду «срывать полностью, полностью буду срывать», так что готовьтесь 🙂

Итак, дело началось с того, что мне захотелось добавить управление голосом в автомобиль (систему комфота) и в комнату дома. Хотя, больше, конечно, хотелось «поиграться» и посмотреть, что из этого получится. Про VRBot я уже где-то слышал, но в руках не держал, так что уже знал, что какие-то готовые решения есть.

Копание в интернетах показало, что как таковых VRBot’ов уже не существует и вывело меня на сайт их производителя и переемника VeeaR. Переемником VRBot стал модуль, практически не отличающийся от своего предшественника — EasyVR. Также, появилась более «крутая» его версия — SmartVR, которая позволяла писать аж свои приложения для какой-то там встроенной виртуальной машины. Но для SmartVR необходимо было допиливать хоть и немного, но внешний обвес (либо покупать дорогую плату разработчика), по этому для начала, ничтоже сумняшеся, я заказал пару EasyVR на «поковырять», даже и не думая, что мои ковыряния потом зайдут так далеко…

После того, как модули мне пришли, я начал с ними играться. Поставил штатный софт, подключил, пообучал, посмотрел возможности. Конечно, функционал этих модулей из коробки достаточно узок — распознавание некоторого количества команд управления роботом (больше они, ИМХО, ни для чего не годятся), зашитых намертво в прошивку на нескольких европейских языках + возможность добавить до 32-х своих собственных команд (то, ради чего модули и заказывались). Также, была очень заманчивая возможность сделать «избу-говорильню» — прошить в модуль наборы звуков, которые потом можно было бы воспроизводить через него как ответы.
Распознавание зашитых команд было «человеконезависимое», т.е., по факту, модулю было все равно кто и каким голосом называет команды — он их уверенно распознавал (только нужно было обеспечить правильное произношение). Пользовательские же команды требовали сначала обучения под конкретного пользователя. Еще существовала возможность распознавания конкретного человека по характеристикам голоса — «голосовой пароль», что вполне неплохо работало и тоже было достаточно интересной фишкой.

Все вроде было замечательно, но меня очень сильно будоражил вопрос: «почему для SmartVR можно писать свои собственные программы, а для EasyVR нельзя?» И черт меня дернул раскопать всю эту кухню глубже.
Начал я с того, что выяснил такой момент — оба модуля работают на абсолютно одинаковых чипах, RSC-4128 компании Sensory. Что-то из услышанного когда-то давно подсказывало мне, что чип хороший, годный, стабильный и использовался в куче всяких роботизированных игрушек типа Furby. Так оно и оказалось.
На сайте разработчика с большим трудом были найдены и выкачаны разные доки — даташит на чип, описание технологических библиотек, СДК, примеры и много-много другого барахла. После изучения всего добра я влюбился в этот чип 🙂 Его возможности, фактически, оказались уникальны: других специализированных однокристальных решений (кроме более старшего семейства этой же фирмы) как-бы и не существовало. Итак, по порядку.

RSC-4128

Чип представляет собой специализированный микроконтроллер на совместимом с 8051 ядре, который несет на себе периферию для записи и воспроизведения звука (микрофонный преамп с АЦП, ЦАП с ШИМ для динамика, аудио-компараторы, фильтры). На чипе есть немного оперативки (4.8 килобайт) и РОМ, размер которого означается последними цифрами названия чипа (в данном случае 128 килобайт). Ядро работает на частоте 14 с лишним мегагерц от внешнего резонатора с PLL. Доступно 5 таймеров (3 обычных, 1 тик-таймер, 1 ватчдог), 8 источников прерываний (от таймеров и от пинов), интерфейс подключения внешней памяти, ускоритель векторной математики. На чипе нет

аппаратной периферии связи — UART, SPI, I2C. Есть только GPIO с прерываниями от некоторых пинов, но вопрос этот вполне неплохо решается софт-драйверами. Хорошо работает подсистема энергосбережения (все-таки, чип рассчитан на батарейное питание). С регистрами все очень просто и понятно, никаких заморочек. Чип может считывать программу либо полностью из внутреннего рома, либо полностью из внешнего (адресуя до 1 мегабайта без изъебств), в зависимости от состояния пина nXM. Также существуют механизмы доступа к разного рода навесной памяти, которые, в общем-то, не очень сильно нужны (ИМХО).
Основная же соль чипа — софт-библиотека FluentChip, которая и реализует все возможности по распознаванию и синтезу, а также много других полезных функций.

FluentChip

Это набор объектных файлов, которые содержат в себе весь волшебный функционал синтеза и распознавания, т.к. чип, по сути — голая болванка с периферией и сам ничего не умеет. Реализован следующий функционал:

Воспроизведение звука: с помощью специальной программы QuickSynthesys можно подготавливать библиотеки звуков, слов и предложений из них; музыку для встроенного MIDI-секвенсора. С помощью простых библиотечных функций можно воспроизводить звуки, слова, мидишки со своими инструментами и даже со словами поверх музыки; можно воспроизводить DTMF, пищать и посылать токены SonicNet в любой комбинации. Присутствует очень хорошее сжатие для речи — SX.
Запись звука: собственно, запись звука с последующим воспроизведением. Нам не актуально, т.к. для этого нужна особая навесная оперативка или флэшка приличного объема, которую к модулям никак не подключить.
Распознавание речи: отдельный разговор. Об этом функционале поговорим ниже.
SonicNet: позволяет посылать через динамик и слушать микрофоном специальные посылки-токены, не слышимые человеком и таким образом общаться нескольким устройствам между собой.

«Анимация»: набор функций для интерактивной обратной связи. Детектор и предсказатель ритма, детектор высоты тона или ноты, «синхронизатор движения губ» как для заранее зашитых звуковых библиотек, так и работающий в реальном времени с микрофона.
SoundSource: используя немного обвеса, возможно соорудить «электронные уши», детектировать положение источника звука и, например, поворачивать устройство или его «голову» к говорящему. Нам, к сожалению, прелестями воспользоваться не удастся ввиду ограниченного числа выведенных GPIO на модуле.
Утилитарные функции, типа функций настройки таймеров, доступа к буферам в оперативке, управления питанием, генерации задержек и проч. Есть готовый софтовый драйвер UART.

Теперь поговорим о распознавании речи. Библиотека умеет выполнять два принципиально разных метода распознавания: T2SI (text-to-speaker-independent, «человеко-независимый», говорящим может быть кто угодно) и

SD (speaker-dependent, говорить должен тот, кто обучал систему).

T2SI использует достаточно сложный и интересный подход. Сначала на компьютере в специальной программе (QuickT2SI) формируются словари путем вбивания нужных слов или фраз с клавиатуры. Затем программа, в зависимости от выбранной языковой модели проводит преобразование этих слов и фраз к фонемам (при необходимости результат можно корректировать, вплоть до ручного набора слов фонемами IPA). После этого можно произвести тонкую настройку распознавания и сформировать объектные файлы с данными для вашего набора слов, которые должны быть включены в программу. Таких наборов может быть очень много, а нужный просто выбирается при вызове библиотечной функции распознавания.
Этот метод сложен технически, использует акустические модели фонем для разных языков, нейросети для их распознавания и

скрытую марковскую модель (HMM) для статистического анализа и угадывания слов. Соль в том, что самая сложная работа — построение и обучение нейросети и формирование скрытой марковской модели — происходит на компьютере, а в устройство зашивается уже готовая нейросеть (в библиотеке на чипе есть софтовый нейропроцессор и анализатор HMM). Готовая нейросеть и модель содержит в себе только нужные состояния и фонемы для набора, поэтому получается очень компактная и быстрая.
Результат работы этого метода, конечно, впечатляет. Получается очень точное распознавание даже на больших словарях и с разными «говорителями». Но у метода есть для нас один очень большой недостаток. Нет модели русского языка 🙁 Причем, принципиально нет никаких ограничений, чтобы ее сделать, но разработчику, походу, это не особо нужно. Тем не менее, есть возможность использовать более-менее похожие модели испанского/итальянского с некоторыми ограничениями и набирать нужные слова сразу фонемами, но это не так удобно, хотя качество распознавания русских слов, запиленных таким образом, достаточно неплохое.

Второй метод — SD — основан на высчитывании огибающих слова/фразы и, возможно еще какой-то информации, типа FFT и генерации «паттерна» — отпечатка, соответствующего этому слову или фразе. По всей видимости, это какой-то векторный массив, наподобие паттернов, описывающих отпечаток пальца после векторного анализа. Только здесь, в качестве исходной информации выступает не картина папиллярного узора, а захваченная звуковая информация. Каждый паттерн занимает в памяти строго определенное количество байт — 256. Из нескольких паттернов в процессе обучения комбинируется «шаблон» (тоже 256 байт), который затем сохраняется в памяти, присваивается к какому-либо словарю и в дальнейшем можно запустить по этому словарю распознавание.
На практике же, при небольшом словаре с разными по произношению словами, система способна точно распознавать слова, даже если их говорит другой человек, что есть очень и очень хорошо!

На этом же принципе построена и SV — верификация говорящего, «голосовой пароль». Только разница в том, что информация векторизуется по другим признакам, и большее внимание уделяется конкретным характеристикам голоса говорящего. По этому и получается «пароль». А технически оно работает точно так же, как и SD.
Возможно запускать одновременно T2SI и SD/SV распознавание по разным наборам. Библиотечные функции достаточно просты и понятны, есть куча примеров, вполне читабельный хелп и аппноуты. Не утонете.
Для сохранения шаблонов требуется какая-то память. В комплекте библиотеки идет несколько модулей для работы с разными типами навесной памяти. Их достаточно просто подключить и настроить в конфигурационном файле, а библиотека возьмет на себя все остальное. На наших модулях установлена для этих целей I2C память 24LC64, которая как раз и позволяет хранить 32 шаблона. Драйвер для I2C памяти в поставке библиотеки есть. Даже с исходником. Примеры работы тоже есть.

Учтите, что библиотека занимает кучу ресурсов МК, так что оперативки остается порядка 250-300 байт (+ 256 байт RAMY буфера, которые используются для хранения паттернов при обучении SD и работе SD, но их можно использовать под свои нужды, на то есть библиотечные функции). При работе библиотечных функций практически не остается и процессорного времени, так что будьте аккуратны в прерываниях. Некоторым процессам (распознаванию, например) похеру и они просто будут работать дольше, а некоторым (воспроизведению звука) не похеру, и звук может начать трещать или вообще функция осыпется и вернет ошибку, что «недостаточно свободных циклов». Подробнее описано в документации (там такая большая таблица со всеми цифрами потребления). Но это все мелочи и решаются они просто грамотным программированием.
Да. Все программы из комплекта библиотек бесплатны. Кроме QuickT2SI, которая стоит $3500 в полном варианте. Жадность программы лечится скачиванием мною пропатченой версии по ссылкам во вложении к статье — «link.txt».

Среда разработки

Конечно же, к чему весь этот разговор и должен был привести. Собственно, «где и в чем писАть?». Вариантов тут совсем не много. Точнее говоря, по факту, всего один — решение от Phyton под названием Project-SE. Есть еще компилятор от mikroElektronik’и, но он уже снят с производства и поддержки, да и при этом косой очень. Так что, пользоваться придется Phyton’ом.
Среда очень корявая в плане интерфейса (IAR после нее покажется вам просто каким-то Эклипсом), но к ней за пару дней привыкаешь. Можно даже все настроить под свои нужды (кнопочки всякие, панели).
Никаких тонкостей и особенностей нет — среда заточена конкретно под этот камень. Создаем проект, настраиваем, подключаем библиотеки и всякие сгенерированные объектники со звуками и нейросетями и вперед — пишем на C или ASM. Примеров, опять же повторюсь, очень много. Все предельно просто и понятно.
Единственный, пожалуй, нюанс — конфигурационный файл, который должен быть подключен к каждому проекту — «config.mca». Там описываются настройки библиотек — пины, память, и прочее. Для нашего модуля я написал свой правильный конфиг, который можно скачать по ссылкам из вложения к этой статье.
Да. Продукт Project-SE работает после установки 14 дней в триальном режиме. Триальный режим по сути ничем не отличается от нормального. Просто напросто, по истечении времени продукт начинает жадничать и перестает компилировать. Жадность пропадает после запуска моего специального батника, который сбрасывает этот самый период. Батник можно скачать, опять же, по ссылкам во вложении к этой статье.

Модуль EasyVR

Модуль — штука самодостаточная. На нем установлен весь необходимый обвес, от стабилизатора питания, до памяти и преобразователя уровней напряжения (для UART). Изначально, общение с модулем происходит по UART, также есть разъем для микрофона (с микрофоном в комплекте), разъем для динамика (выход PWM, без динамика в комплекте) и колодка с тремя дополнительно выведенными GPIO + выводы nXM и RST. На модуле установлена флешка в 1 мегабайт максимально адресуемого пространства (на ней изначально хранится прошивка и звуки) и EEPROM 24LC64 для хранения шаблонов SD или какой-нибудь своей информации, типа конфигурации.

24LC64 совершенно спокойно перепаивается в 24LC256 и становится возможным хранить уже 128 шаблонов. 24LC512 к сожалению шире корпусом и на плату не влезает 🙂

Питается модуль от 3 до 5 вольт. На пинах, которые используются под UART стоит микросхема-преобразователь уровней (чтоб можно было шпарить до 5 вольт). На остальные пины подавать больше 3 вольт НЕЛЬЗЯ! Спалите пины или чип! Это вам не AVR!
А теперь самое главное, ради чего все затевалось! Разработчики модуля не афишируют эту возможность, но тем не менее, в модуль можно зашить абсолютно любой код! Устроено все так: в РОМе самого чипа сидит загрузчик, с которым может общаться программка «VeeLoader.exe» от VeeaR (из комплекта оригинального софта). А во флешке, которая на 1 мегабайт, собственно и лежит прошивка. Т.к. чип может работать либо со встроенным РОМом, либо с внешним флэшом, то вот и получается наша картина: подцепляем nXM на 3 вольта и чип стартует с вшитого по маске загрузчика, который может спокойно читать и писать флэшку без всяких ограничений или защит через UART. А если мы оставим висеть nXM свободно (на самом деле pull-down внутри чипа на несколько килоом), то чип будет стартовать с внешней флэшки. Таким образом, достаточно просто скормить HEX-файл своей программы VeeLoader’у и, вуаля, он зашьет ее во флэш! Делов-то 🙂

Вот таким образом мы получили достаточно мощный и недорогой инструмент для работы с натуральной речью, который можем лепить сами как захотим, не ограничиваясь рамками прошивки производителя. Можно делать все, на что хватит фантазии 🙂 Тем более, железка и технологии действительно уникальные, интересные и очень качественно вылизанные производителем (ребята из Sensory — молодцы).

Во вложении вы найдете ссылку на архив со всем необходимым (архив с софтом и пилюлями уникален и больше вы его нигде не достанете):
1. Инструментарий Sensory последних версий: QuickT2SI 3.1.7 (с лечивом), QuickSynthesis 5.2.1, библиотеки FluentChip 3.1.6 с примерами и всей документацией, в том числе на чип и железо.
2. Инструментарий Phyton: Project-SE 1.22.00 (с лечивом)
3. Инструментарий VeeaR: VeeLoader.exe и последняя прошивка EasyVR, если захочется вернуть штатный функционал

Все вопросы и пожелания пишите в комментах. Чем смогу — помогу :)

we.easyelectronics.ru

Статья о принципах работы голосового модуля на микросхеме WT588D для Ардуино.

Новый высококачественный модуль для Ардуино RKP-WT588D-8Mbit на микросхеме WT588D08 (компании Guangzhou Waytronic Electronic Limited) оптимально подходит для большинства задач в робототехнике и системах мехатроники, связанных с воспроизведением коротких голосовых или музыкальных фрагментов.
Модули и микросхемы серии WT588D предназначены для приложений, где требуется простое дешевое решение по хранению-воспроизведению звуковых и музыкальных сообщений длительностью до 17.5 минут с возможностью быстрой и удобной их перезаписи. Смена аудио информации в модулях WT588D осуществляется перепрошивкой микросхемы SPI-flash памяти с помощью недорогого USB-программатора. Запись может производиться прямо в готовом изделии без необходимости извлечения микросхемы из платы.

Основные преимущества модулей и микросхем WT588D

Низкая стоимость
Минимальные размеры (модуль WT588D-16 pin: всего 22 х 19 мм)
Простая схема включения
Быстрая и удобная перезапись (с компьютера через недорогой USB программатор, либо с помощью офф-лайн копира)
Мощные возможности настройки и конфигурирования
Поставляется на плате со штыревыми выводами под стандартную DIP-панельку, либо в виде набора микросхем
Встроенный высокоскоростной аудио процессор, обеспечивающий качественное и чистое звучание
Поддерживаемые частоты дискретизации от 6кГц до 20кГц
Несколько режимов управления, как с помощью кнопок или отдельных сигналов, так и по командам внешнего микроконтроллера
напряжение питания от 2.8 до 5.5В

Режимы работы микросхемы
В зависимости от программных установок микросхемы могут работать в одном из шести возможных режимов:
— простой кнопочный режим
— два режима с управлением от внешнего микроконтроллера по последовательной шине (однопроводной или трёхпроводной SPI)
— режим параллельного ввода данных
— режим с функциями кнопок, аналогичными mpЗ-плейеру
— режим с матричным подключением до 24 кнопок

Принципиальная схема голосового модуля WT588D с 16-ю выводами

В простом кнопочном режиме логические управляющие сигналы подают на пять входных линий. В этом режиме каждый вывод сопоставлен одной звуковой/музыкальной группе фрагментов. Активный уровень сигнала — 0. Каждый из пяти входов может быть индивидуально запрограммирован на один из 15 возможных режимов работы, в том числе Edge, Level. On/Off (вход работает по принципу кнопки с фиксацией), Next Loop, Prev Loop (последовательный перебор всех аудио файлов), Pause, Stop, управление громкостью.

Режим одно-проводного последовательного порта, в котором все команды управления передаются от внешнего микроконтроллера через одно-проводную шину данных, всего в этом режиме можно управлять включением до 219 голосовых групп.

Режим трех-проводного последовательного порта, в котором все команды управления передаются от внешнего микроконтроллера через трех-проводную шину данных, всего в этом режиме можно управлять включением до 219 голосовых групп.

Режим трех-проводного последовательного порта с расширенным количеством выходных линий, переключение в этот режим может осуществляться в любой момент по команде внешнего микропроцессора, при этом все восемь свободных выводов микросхемы WT588D начинают работать в качестве выходов, на каждом из них можно устанавливать логический 0 или 1 для управления внешними устройствами.

В режимах последовательного ввода данных, подавая команды управления, можно включать воспроизведение любого из 220 аудио фрагментов, программно регулировать громкость, включать и выключать циклический режим воспроизведения.

В режиме параллельного ввода данных адрес голосовой группы выставляется на входной шине в виде двоичного кода, всего в этом режиме можно управлять включением 219 голосовых групп.

В mp3 режиме выводы микросхемы выполняют те же функции, что и кнопки обычного mp3 плеера: PLAY/PAUSE, STOP, NEXT, PREVIOUS, VOLUME+, VOLUME-.

Режим матрицы кнопок 3х8, в этом режиме номер одной из 24-х звуковых групп задается сигналом от клавиатуры 3х8.

Загрузка готового проекта в микросхему осуществляется с помощью USB-программатора.

Программатор WT588D mini download предназначен для записи скомпилированных звуковых файлов в модули серии WT588D и проверки их работоспособности во всех режимах. С помощью дополнительного переходника позволяет записывать отдельные микросхемы SPI-flash, используемые в модулях и комплектах микросхем серии WT588D. Для осуществления внутрисхемного программирования служит дополнительный разъем, сигналы с него через внешний шлейф подаются непосредственно на выводы микросхемы SPI-flash. Запись и питание программатора осуществляется через стандартный USB-порт, внешний источник питания не требуется.

Подготовка и компиляция файла для записи производится с помощью программы WTW588D VoiceChip. Готовый скомпилированный файл может загружаться в модуль/микросхему как из оболочки программы WTW588D VoiceChip, так и с помощью отдельной утилиты загрузчика.

Эдесь можно скачать программу WTW588D VoiceChip (архив ZIP, размер 11.3 МБ) =>>

Программатор соединяется с компьютером стандартным USB-кабелем. Модули WT588D-28pin и WT588D-16pin вставляются непосредственно в панельку программатора, микросхема SPI-flash вставляется в программатор с помощью дополнительного адаптера-переходника. К аудиовыходу может быть подключен внешний динамик для проверки звучания записанных аудиофайлов.

Дата: Понедельник, 07 Июля 2014

robot-kit.ru

Звуковой информатор для Arduino — ProGDron.com

Плата расширения L293D, ИК-датчик VS1838B, TFT LCD, Модем M590E GSM GPRS, «монитор TFT LCD, датчик движения HC-SR501, ИК-пульт дистанционного управления, Радиомодуль NRF24L01, SD Card Module, Звуковой модуль, 5-axis stepper motor driver, Шаговый двигатель, Модем M590E GSM GPRS, 5-axis stepper motor driver, Часы реального времени DS 3231/DS 1307, терморегулятор W1209 DC, Релейный модуль, датчик движения HC-SR501, Модуль Wi-Fi ESP8266-12E, датчик движения HC-SR501, Передатчик и приемник в диапазоне RF 433 Mhz, Блок питания, L293D, Микросхема контроллера коллекторного электродвигателя, ИК-пульт дистанционного управления, Датчики контроля температуры, Радиомодуль NRF24L01, OKI 120A2, Rotary Encoder, SD Card Module, Беспроводной пульт дистанционного управления, Микросхема контроллера коллекторного электродвигателя, Модуль Bluetooth HC-06,, Модем M590E GSM GPRS, Часы реального времени DS 3231/DS 1307, Mini 360 на схеме LM2596, MP3-TF-16P, L293D, Модуль LCD монитора, Инфракрасные датчики расстояния, Часы реального времени, USB Host Shield, HC-SR501, Cветочувствительный датчик сопротивления, блок питания Mini 360 на схеме LM2596, ЖК-дисплей TFT дисплей, Контроллер L298N, HC-SR501, Модуль MP3 Player WTV020, GSM GPRS, Сервоприводы, Модем M590E GSM GPRS, Часы реального времени DS 3231/DS 1307, Модуль Wi-Fi ESP8266-12E, Инфракрасные датчики расстояния, Card Module, Ультразвуковые дальномеры HC-SR04, Блок питания, Карта памяти SD, Mini 360, Ethernet shield, L293D, блок питания Mini 360 на схеме LM2596, Радиомодуль, датчик температуры DS18B20, ИК-пульт дистанционного управления, USB конвертер UART, ИК-пульт, Антена для модуля WiFi, Ethernet shield, Модуль блока питания XL6009, Микросхема контроллера коллекторного электродвигателя, Модуль качества воздуха MQ-135, Микросхема контроллера коллекторного электродвигателя, ИК-пульт дистанционного управления, SD Card Module, Радиомодуль NRF24L01, двигатель OKI, 5-axis stepper motor driver, L293D, TB6560, Драйвер шагового двигателя TB6600, Шаговый двигатель, Модуль камеры, Блок питания, L293D, блок питания Mini 360 на схеме LM2596, 5axis mach4 interface, Карта памяти SD, Ethernet shield, Контроллер L298N, датчик движения HC-SR501, Модуль Wi-Fi ESP8266-12E, Модуль LCD монитора LCD1602, Шаговый двигатель OKI 120A2, Шаговый двигатель, Шаговый двигатель.

www.progdron.com

WTV020SD звуковой модуль для Arduino — Микроконтроллеры — Инструкции — Каталог статей — RC

Купить на Паркфлаере.

Вопросами озвучки своих Arduino-проектов я задавался не раз. И всегда минусы перевешивали плюсы: либо цена заоблачная, либо ресурсы контроллера потребляет… И вот довелось мне наткнуться на данный модуль. Стоит он копейки — поэтому купил я его не раздумывая. Надо сказать, что информации в сети на него не так уж и много, но я таки с ним справился и поделюсь тем, что удалось «накопать».

1. Модуль снабжен штырьками с удобным шагом в 2.54мм. Это позволяет втыкать его в беспаячную макетку без каких-либо переходников.

2. На борту находится разъем для microSD. Поставщик утверждает, что подходят карты объемом до 1Гб. У меня в наличии было только две карты — 64Мб (древняя «как г***о мамонта» и не уверен, что рабочая) и 2Гб. С первой картой модуль работать отказался, со второй заработал сразу и без каких-либо проблем.

3. Модуль питается от 3.3В. На борту есть перемычка для питания 5В, но экспериментировать я с ней не советую.

4. Модуль может работать как под управлением микроконтроллера, так и в виде самостоятельного плеера с кнопочным управлением. Последний режим меня интересовал мало (схему можно найти в документации в конце статьи). А вот с управлением от МК я разобрался. Схема подключения к Arduino такая:

Что интересно, модуль работает сам по себе в асинхронном режиме, не поглощая ресурсы микроконтроллера. Тот только отдает ему команды управления. А сигнал busy показывает, воспроизводит модуль что-нибудь или простаивает в ожидании.

5. Уж не знаю, почему китайцы обозвали его MP3-плеером, но только MP3 файлы у меня он проигрывать отказался. Заработал у меня он с файлами формата AD4. Ну да не беда — конвертер я нашел.

6. С размещением файлов на карте тоже далеко все не так просто. Все файлы должны размещаться в корневой директории и иметь имена в виде четырехзначных номеров. МК для проигрывания файла отдает модулю команду, содержащую номер трека.

7. Добрые люди написали вполне приличную библиотеку для Arduino. В ней же есть пример, содержащий в том числе и звуковые файлы. Функционал такой:

проиграть синхронно — МК будет ждать окончания проигрывания файла
проиграть асинхронно — МК отдаст команду и будет заниматься дальше своими делами
управление громкостью воспроизведения
пауза/остановка проигрывания файла

8. Выход на динамик достаточно слабый. В наушниках играет нормально, но динамик лучше подключать через какой-нибудь аудио усилитель (у меня был усилок на микросхеме TDA7297).

~~В итоге это оказался наиболее подходящий мне модуль. Озвучку модели танка я делаю именно на нем.~~

UPD: у модуля обнаружился очень неудобный косяк. Вывод BUSY срабатывает с огромной задержкой — почти в секунду. По этой причине модуль оказался непригоден для циклической непрерывной озвучки.

Ссылки для скачивания:

Даташит (Manual)

Библиотека для Arduino

Конвертер файлов MP3-to-AD4

rc-master.ucoz.ru

"ДИС-Протект"