Звуки для появления текста

Содержание

Преобразуем 2D в 1D
Обработка изображения
Результаты
Заключение

[5,46 Kb] (cкачиваний: 9620). Тип файла: mp3.

Звук вылета картинки для монтажа

[7,24 Kb] (cкачиваний: 12757). Тип файла: mp3.

Звук проносящегося мимо текста

[87,25 Kb] (cкачиваний: 1495). Тип файла: mp3.

Текст летает по экрану а потом попадает в центр

[69,09 Kb] (cкачиваний: 819). Тип файла: mp3.

Текст улетучился (звук)

[63,28 Kb] (cкачиваний: 991). Тип файла: mp3.

Звук пропадания текста с видимой части экрана

[46,77 Kb] (cкачиваний: 3567). Тип файла: mp3.

Звук внезапного появления

[88,35 Kb] (cкачиваний: 2519). Тип файла: mp3.

Звук плавного появления надписи на видео (пузыри)

[104,85 Kb] (cкачиваний: 946). Тип файла: mp3.

Стандартный короткий звук с появлением

[17,3 Kb] (cкачиваний: 3391). Тип файла: mp3.

Звук появления фото (с эхо)

[81,62 Kb] (cкачиваний: 1130). Тип файла: mp3.

Как вам такой вариант?

[15,9 Kb] (cкачиваний: 585). Тип файла: mp3.

[18,65 Kb] (cкачиваний: 829). Тип файла: mp3.

Звук с эффектом свертывания окна или появления объекта

[21,88 Kb] (cкачиваний: 1192). Тип файла: mp3.

Звук резкого появления

[14,29 Kb] (cкачиваний: 1998). Тип файла: mp3.

Звук легкого появления текста или картинки для монтажа

[36,93 Kb] (cкачиваний: 1367). Тип файла: mp3.

[33,63 Kb] (cкачиваний: 569). Тип файла: mp3.

Звук исчезания текста или другого объекта в монтаже

[52,58 Kb] (cкачиваний: 1273). Тип файла: mp3.

Звук эффектного появления

[15,92 Kb] (cкачиваний: 478). Тип файла: mp3.

Короткий звук с вылетом объекта

[16,05 Kb] (cкачиваний: 1161). Тип файла: mp3.

Звук появления персонажа

[18,35 Kb] (cкачиваний: 952). Тип файла: mp3.

Продолжительный звук исчезновения текста ил картинки, а может и слайда

[132,66 Kb] (cкачиваний: 1327). Тип файла: mp3.

Звук вылета картинки или другого объекта, например, текста для видео

На этой странице Вы можете скачать Звуки для переходов и появления картинок в высоком качестве (320Kbps) на компьютер, телефон, андроид, айфон или айпад. Слушайте музыку Звуки для переходов и появления картинок онлайн и другие рингтоны и минусовки.

В недавней публикации здесь на сайте описывалось устройство, позволяющее незрячим людям «видеть» изображение, преобразуя его с помощью звуковых волн. С технической точки зрения, в той статье не было никаких деталей вообще (~~а вдруг украдут идею за миллион~~), но сама концепция показалась интересной. Имея некоторый опыт обработки сигналов, я решил поэкспериментировать самостоятельно.

Что из этого получилось, подробности и примеры файлов под катом.

Преобразуем 2D в 1D

Первая очевидная задача, которая нас ожидает — это преобразовать двухмерное «плоское» изображение в «одномерную» звуковую волну. Как подсказали в комментариях к той статье, для этого удобно воспользоваться кривой Гильберта.

Она по своей сути похожа на фрактал, и идея в том, что при увеличении разрешения изображения, относительное расположение объектов не меняется (если объект был в верхнем левом углу картинки, то он останется там же). Различные размерности кривых Гильберта могут дать нам разные изображения: 32×32 для N=5, 64×64 для N=6, и так далее. «Обходя» изображение по этой кривой, мы получаем линию, одномерный объект.

Следующий вопрос это размер картинки. Интуитивно хочется взять изображение побольше, но тут есть большое «но»: даже картинка 512х512, это 262144 точек. Если преобразовать каждую точку в звуковой импульс, то при частоте дискретизации 44100, мы получим последовательность длиной в целых 6 секунд, а это слишком долго — изображения должны обновляться быстро, например с использованием web-камеры. Делать частоту дискретизации выше бесмысленно, мы получим ультразвуковые частоты, неслышимые ухом (хотя для совы или летучей мыши может и пойдет). В итоге ~~методом научного тыка~~ было выбрано разрешение 128х128, которое даст импульсы длиной 0.37c — с одной стороны, это достаточно быстро чтобы ориентироваться в реальном времени, с другой вполне достаточно, чтобы уловить на слух какие-то изменения в форме сигнала.

Обработка изображения

Первым шагом мы загружаем изображение, преобразуем его в ч/б и масштабируем до нужного размера. Размер изображения зависит от размерности кривой Гильберта.

Следующим шагом формируем звуковую волну. Тут разумеется, может быть великое множество алгоритмов и ноухау, для теста я просто взял яркостную составляющую. Разумеется, наверняка есть способы лучше.

Из кода, надеюсь, все понятно. Функция coordinates_from_distance делает за нас всю работу по преобразованию координат (х, у) в расстояние на кривой Гильберта, значение яркости L мы инвертируем и преобразуем в цвет.

Это еще не все. Т.к. на изображении могут быть большие блоки одного цвета, это может привести к появлению в звуке «dc-компоненты» — длинного ряда отличных от нуля значений, например [100,100,100. ]. Чтобы их убрать, применим к нашему массиву high-pass filter (фильтр Баттерворта) с частотой среза 50Гц (совпадение с частотой сети случайно). Синтез фильтров есть в библиотеке scipy, которым мы и воспользуемся.

Последним шагом сохраним изображение. Т.к. длина одного импульса короткая, мы повторяем его 10 раз, это будет на слух более приближено к реальному повторяющемуся изображению, например с веб-камеры.

Результаты

Вышеприведенный алгоритм, разумеется, совсем примитивный. Я хотел проверить три момента — насколько можно различать разные несложные фигуры, и насколько можно оценить расстояние до фигур.

Изображению соответствует такой звуковой сигнал:

Идея этого теста — сравнить «звучание» объекта другой формы. Звуковой сигнал:

Можно заметить, что звучание действительно другое, и на слух разница есть.

Идея теста — проверить объект меньшего размера. Звуковой сигнал:

В принципе, чем меньше размеры объекта, тем меньше будет «всплесков» в звуке, так что зависимость тут вполне прямая.

Как подсказали в комментариях, можно использовать преобразование Фурье для непосредственной конвертации картинки в звук. Сделанный по-быстрому тест показывает такие результаты (картинки те же):
Тест-1: cloud.mail.ru/public/2C5Z/5MEQ8Swjo
Тест-2: cloud.mail.ru/public/2dxp/3sz8mjAib
Тест-3: cloud.mail.ru/public/3NjJ/ZYrfdTYrk

Тесты звучат интересно, по крайней мере, для маленького и большого квадратов (файлы 1 и 3) разница на слух хорошо ощутима. А вот форма фигур (1 и 2) практически не различается, так что тут тоже есть над чем подумать. Но в целом, звучание полученное с помощью FFT, на слух мне нравится больше.

Заключение

Данный тест, разумеется, не диссертация, а просто proof of concept, сделанный за несколько часов свободного времени. Но даже так, оно в принципе работает, и разницу ощущать на слух вполне реально. Я не знаю, можно ли научиться ориентироваться в пространстве по таким звукам, гипотетически наверно можно после некоторой тренировки. Хотя тут огромное поле для улучшений и экспериментов, например, можно использовать стереозвук, что позволит лучше разделять объекты с разных сторон, можно экспериментировать с другими способами конвертации изображения в звук, например, кодировать цвет разными частотами, и пр. И наконец, перспективным тут является использование 3d-камер, способных воспринимать глубину (увы, такой камеры в наличии нет). Кстати, с помощью несложного кода на OpenCV, вышеприведенный алгоритм можно адаптировать к использованию web-камеры, что позволит экспериментировать с динамическими изображениями.

Ну и как обычно, всем удачных экспериментов.