[5,46 Kb] (cкачиваний: 9620). Тип файла: mp3.
Звук вылета картинки для монтажа
[7,24 Kb] (cкачиваний: 12757). Тип файла: mp3.
Звук проносящегося мимо текста
[87,25 Kb] (cкачиваний: 1495). Тип файла: mp3.
Текст летает по экрану а потом попадает в центр
[69,09 Kb] (cкачиваний: 819). Тип файла: mp3.
Текст улетучился (звук)
[63,28 Kb] (cкачиваний: 991). Тип файла: mp3.
Звук пропадания текста с видимой части экрана
[46,77 Kb] (cкачиваний: 3567). Тип файла: mp3.
Звук внезапного появления
[88,35 Kb] (cкачиваний: 2519). Тип файла: mp3.
Звук плавного появления надписи на видео (пузыри)
[104,85 Kb] (cкачиваний: 946). Тип файла: mp3.
Стандартный короткий звук с появлением
[17,3 Kb] (cкачиваний: 3391). Тип файла: mp3.
Звук появления фото (с эхо)
[81,62 Kb] (cкачиваний: 1130). Тип файла: mp3.
Как вам такой вариант?
[15,9 Kb] (cкачиваний: 585). Тип файла: mp3.
[18,65 Kb] (cкачиваний: 829). Тип файла: mp3.
Звук с эффектом свертывания окна или появления объекта
[21,88 Kb] (cкачиваний: 1192). Тип файла: mp3.
Звук резкого появления
[14,29 Kb] (cкачиваний: 1998). Тип файла: mp3.
Звук легкого появления текста или картинки для монтажа
[36,93 Kb] (cкачиваний: 1367). Тип файла: mp3.
[33,63 Kb] (cкачиваний: 569). Тип файла: mp3.
Звук исчезания текста или другого объекта в монтаже
[52,58 Kb] (cкачиваний: 1273). Тип файла: mp3.
Звук эффектного появления
[15,92 Kb] (cкачиваний: 478). Тип файла: mp3.
Короткий звук с вылетом объекта
[16,05 Kb] (cкачиваний: 1161). Тип файла: mp3.
Звук появления персонажа
[18,35 Kb] (cкачиваний: 952). Тип файла: mp3.
Продолжительный звук исчезновения текста ил картинки, а может и слайда
[132,66 Kb] (cкачиваний: 1327). Тип файла: mp3.
Звук вылета картинки или другого объекта, например, текста для видео
На этой странице Вы можете скачать Звуки для переходов и появления картинок в высоком качестве (320Kbps) на компьютер, телефон, андроид, айфон или айпад. Слушайте музыку Звуки для переходов и появления картинок онлайн и другие рингтоны и минусовки.
В недавней публикации здесь на сайте описывалось устройство, позволяющее незрячим людям «видеть» изображение, преобразуя его с помощью звуковых волн. С технической точки зрения, в той статье не было никаких деталей вообще (а вдруг украдут идею за миллион), но сама концепция показалась интересной. Имея некоторый опыт обработки сигналов, я решил поэкспериментировать самостоятельно.
Что из этого получилось, подробности и примеры файлов под катом.
Преобразуем 2D в 1D
Первая очевидная задача, которая нас ожидает — это преобразовать двухмерное «плоское» изображение в «одномерную» звуковую волну. Как подсказали в комментариях к той статье, для этого удобно воспользоваться кривой Гильберта.
Она по своей сути похожа на фрактал, и идея в том, что при увеличении разрешения изображения, относительное расположение объектов не меняется (если объект был в верхнем левом углу картинки, то он останется там же). Различные размерности кривых Гильберта могут дать нам разные изображения: 32×32 для N=5, 64×64 для N=6, и так далее. «Обходя» изображение по этой кривой, мы получаем линию, одномерный объект.
Следующий вопрос это размер картинки. Интуитивно хочется взять изображение побольше, но тут есть большое «но»: даже картинка 512х512, это 262144 точек. Если преобразовать каждую точку в звуковой импульс, то при частоте дискретизации 44100, мы получим последовательность длиной в целых 6 секунд, а это слишком долго — изображения должны обновляться быстро, например с использованием web-камеры. Делать частоту дискретизации выше бесмысленно, мы получим ультразвуковые частоты, неслышимые ухом (хотя для совы или летучей мыши может и пойдет). В итоге методом научного тыка было выбрано разрешение 128х128, которое даст импульсы длиной 0.37c — с одной стороны, это достаточно быстро чтобы ориентироваться в реальном времени, с другой вполне достаточно, чтобы уловить на слух какие-то изменения в форме сигнала.
Обработка изображения
Первым шагом мы загружаем изображение, преобразуем его в ч/б и масштабируем до нужного размера. Размер изображения зависит от размерности кривой Гильберта.
Следующим шагом формируем звуковую волну. Тут разумеется, может быть великое множество алгоритмов и ноухау, для теста я просто взял яркостную составляющую. Разумеется, наверняка есть способы лучше.
Из кода, надеюсь, все понятно. Функция coordinates_from_distance делает за нас всю работу по преобразованию координат (х, у) в расстояние на кривой Гильберта, значение яркости L мы инвертируем и преобразуем в цвет.
Это еще не все. Т.к. на изображении могут быть большие блоки одного цвета, это может привести к появлению в звуке «dc-компоненты» — длинного ряда отличных от нуля значений, например [100,100,100. ]. Чтобы их убрать, применим к нашему массиву high-pass filter (фильтр Баттерворта) с частотой среза 50Гц (совпадение с частотой сети случайно). Синтез фильтров есть в библиотеке scipy, которым мы и воспользуемся.
Последним шагом сохраним изображение. Т.к. длина одного импульса короткая, мы повторяем его 10 раз, это будет на слух более приближено к реальному повторяющемуся изображению, например с веб-камеры.
Результаты
Вышеприведенный алгоритм, разумеется, совсем примитивный. Я хотел проверить три момента — насколько можно различать разные несложные фигуры, и насколько можно оценить расстояние до фигур.
Изображению соответствует такой звуковой сигнал:
Идея этого теста — сравнить «звучание» объекта другой формы. Звуковой сигнал:
Можно заметить, что звучание действительно другое, и на слух разница есть.
Идея теста — проверить объект меньшего размера. Звуковой сигнал:
В принципе, чем меньше размеры объекта, тем меньше будет «всплесков» в звуке, так что зависимость тут вполне прямая.
Как подсказали в комментариях, можно использовать преобразование Фурье для непосредственной конвертации картинки в звук. Сделанный по-быстрому тест показывает такие результаты (картинки те же):
Тест-1: cloud.mail.ru/public/2C5Z/5MEQ8Swjo
Тест-2: cloud.mail.ru/public/2dxp/3sz8mjAib
Тест-3: cloud.mail.ru/public/3NjJ/ZYrfdTYrk
Тесты звучат интересно, по крайней мере, для маленького и большого квадратов (файлы 1 и 3) разница на слух хорошо ощутима. А вот форма фигур (1 и 2) практически не различается, так что тут тоже есть над чем подумать. Но в целом, звучание полученное с помощью FFT, на слух мне нравится больше.
Заключение
Данный тест, разумеется, не диссертация, а просто proof of concept, сделанный за несколько часов свободного времени. Но даже так, оно в принципе работает, и разницу ощущать на слух вполне реально. Я не знаю, можно ли научиться ориентироваться в пространстве по таким звукам, гипотетически наверно можно после некоторой тренировки. Хотя тут огромное поле для улучшений и экспериментов, например, можно использовать стереозвук, что позволит лучше разделять объекты с разных сторон, можно экспериментировать с другими способами конвертации изображения в звук, например, кодировать цвет разными частотами, и пр. И наконец, перспективным тут является использование 3d-камер, способных воспринимать глубину (увы, такой камеры в наличии нет). Кстати, с помощью несложного кода на OpenCV, вышеприведенный алгоритм можно адаптировать к использованию web-камеры, что позволит экспериментировать с динамическими изображениями.
Ну и как обычно, всем удачных экспериментов.