Искусственный интеллект отгадывает рисунки

Исследователи из Института искусственного интеллекта Пола Аллена (AI2) представили онлайн-игру Iconary для обучения ИИ. Система AllenAI будет угадывать рисунки пользователей и строить фразы на их основе.

Согласно исследователю Ани Кембхави, игра проверяет способность ИИ логически мыслить. Алгоритмы должны не просто идентифицировать элементы на изображении, но и понять, как они друг с другом связаны. В результате искусственный интеллект должен составить фразу, которая объяснит, что нарисовано на картинке.

«Видеоигры часто оторваны от реальности, а в игре на угадывание необходимо выстраивать логические цепочки на основе имеющихся знаний», – объясняет Кембхави.

Пользователи будут рисовать картинки по заранее подготовленным фразам. Например, чтобы изобразить или угадать фразу «члены семьи разговаривают на кухне», необходимо понимать, что такое семья, что из себя представляет кухня, что такое процесс разговора.

Ученые предполагают, что сбор этих данных поможет алгоритмам в будущем. Для эффективного обучения и совершенствования ИИ должен играть именно с человеком.

«Если AllenAI будет играть сам, он разработает свою упрощенную систему игры на основе уже известной ему информации, но в реальном мире он не сможет распознать ситуации», – рассказывает Кембхави.

Поиграть в игру-угадайку с искусственным интеллектом можно здесь.

«Нарисуй кошку за 30 секунд. О, я знаю, это кошка… А может быть, нет» — примерно в таком формате выдаёт результат распознавания рисунков нейросеть Quick, Draw!

Quick, Draw! — одна из новых игр, которую выпустили разработчики Google в рамках проекта A.I. Experiments. Здесь публикуются прикольные игрушки, которые позволяют даже ребёнку поиграть с искусственным интеллектом. Но есть игры и для взрослых.

Кроме удовольствия от игры и развлечения, эксперименты A.I. Experiments дают ещё и некоторое понимание того, на что способны нейросети и как их можно использовать на практике. Не только для развлечений.

Первая игра на сайте A.I. Experiments. Вероятно, самая интересная, по мнению разработчиков. Поместите объект перед объективом камеры на смартфоне или ПК, а нейросеть мгновенно составит стишок по итогу результата распознавания — и положит его под музыку! Иногда результат очень смешной. Особенно если навести камеру на необычные объекты.

Читайте также:  Что происходит при сжатии газа

В данном проекте используются программы MaryTTS, Tone.js, и Google Cloud Vision API. Исходный код Giorgio Cam опубликован, как и всех других игр на проекте.

В игре Quick, Draw! искусственный интеллект даёт задание. Человек пытается быстро нарисовать, например, пальцем на планшете, а ИИ определяет, что изображено на рисунке. Получается весело, особенно если вы не очень умеете рисовать.

Что важно, нейросеть обучают следить за направлением движения пальца/курсора. За счёт этого она гораздо лучше распознаёт образцы.

Infinite Drum Machine показывает карту, на которой разные звуки инструментов размещены в соответствии со степенью их схожести. Если проводить мышкой по этому облаку, то звуки воспроизводятся по очереди. Если какой-то звук понравился, то размещаем его на драм-машине с четырьмя дорожками. Ну а затем запускаем на воспроизведение. Такое приложение стало бы хитом в Google Play. Впрочем, как и остальные игры на сайте A.I. Experiments.

Как сказано в описании, при разработке использовалась техника t-SNE, то есть нелинейного снижения размерности и визуализации многомерных переменных (t-distributed stochastic neighbor embedding). Алгоритм вычисляет цифровой отпечаток каждого звука и размещает его в многомерном пространстве, в соотношении с другими отпечатками. Для взаимодействия с человеком многомерное пространство пришлось сплющить до двухмерного.

Как и в предыдущей игре, здесь система с помощью техники t-SNE организовала по степени схожести тысячи звуков. Только звуки не инструментов, а птичьих голосов. Орнитологи десятилетиями собирали эту коллекцию.

«Переводчик вещей» переводит с одного языка на другой не слова, а предметы. Он буквально произносит вслух, как звучит любой предмет на выбранном вами языке.

Это всего лишь один пример того, что можно сделать, используя программные интерфейсы машинного обучения Google (Cloud Vision API + Translate API) — даже ничего не зная о машинном обучении.

Читайте также:  Enter intel at suspend mode что это

Ещё одна интересная музыкальная игра от Google. Вы начинаете играть мелодию — а компьютер продолжает её за вас, используя наиболее красивое и логичное продолжение.

Как несложно догадаться, при обучении нейросети воспроизводились тысячи существующих мелодий. ИИ постепенно начал понимать ноты и распознавать гармонию в мелодическом рисунке. Понимать, в каких местах мелодия должна менять направление, в каком ритме продолжать мелодию и т.д. Он постепенно сам составил карту наиболее популярных, то есть гармоничных последовательностей и переходов.

Для максимального кайфа к компьютеру, конечно, желательно подключить MIDI-клавиатуру. Тогда с ИИ можно организовать полноценный композиторский дуэт, играя мелодию по очереди. Он продолжает начатое вами, а вы подыгрываете его варианту.

Этот эксперимент помогает понять, что творится в «мозгах» искусственного интеллекта. Программа визуализирует это на экране. Именно здесь можно своими глазами увидеть многомерное пространство, которое упоминалось ранее, и понять, как работает волшебная техника t-SNE. Каким образом организуются данные в пространствах, где количество измерений больше трёх.

Одна из авторов объясняет в демонстрационном видеоролике, что даже людей можно представить в виде многомерных объектов в многомерном пространстве. Это легко. В одном измерении у нас параметр «дата рождения» — и в этом измерении мы связаны с другими такими же многомерными объектами (людьми). В следующем измерении у нас параметр «место работы» — в этом измерении совершенно другие взаимосвязи. И так далее. Абсолютно все люди на планете входят в эту многомерную сеть. Такое же многомерное пространство строится для значений слов, для изображений, для мелодий и для любых других данных. Всё это потом используется в реальных приложениях, когда нейросеть обучается распознавать образы, понимать значения отдельных слов в пространстве смыслов.

Разработанная Google техника визуализации будет полезна всем разработчикам, которые работают с многомерными пространствами, t-SNE и нейросетями.

Ещё один эксперимент, который показывает внутренности «компьютерного мозга». В данном случае речь идёт не об измерениях многомерного пространства, а о слоях нейросети, каждый из которых реагирует на определённые сигналы. При последовательной обработке многими слоями нейросети, где каждый следующий слой обрабатывает результат предыдущего, ИИ начинает распознавать фичи всё более высокого уровня.

Читайте также:  Математическая настройка dpi мыши для варфейс

И помните, чем больше вы играете с искусственным интеллектом Google — тем быстрее он обучается, используя ваши рисунки и наблюдая за поведением. К сожалению, люди могут не только обучить, но и испортить ИИ. Например, из-за неграмотности многие люди рисуют ураган в виде торнадо. И постепенно нейросеть откажется признавать ураганом рисунок тропического циклона, а будет считать ураганом только рисунок торнадо. В общем, всё как в жизни.

Очередь просмотра

Очередь

  • Удалить все
  • Отключить

YouTube Premium

Хотите сохраните это видео?

  • Пожаловаться

Пожаловаться на видео?

Выполните вход, чтобы сообщить о неприемлемом контенте.

Понравилось?

Не понравилось?

Текст видео

-Онлайн игра, разработанная Google, которая бросает вызов игрокам нарисовать изображение объекта или идеи, а затем использует нейронную сеть искусственного интеллекта, чтобы угадать, что представляют собой рисунки.
-ИИ учится на каждом рисунке, увеличивая свою способность правильно угадывать в будущем.
-Игра похожа на Pictionary в том, что у игрока есть только ограниченное время для рисования.
-Понятия, которые он угадывает, могут быть простыми, как "нога", или более сложными, как "миграция животных".
-Эта игра является одной из многих простых игр, созданных Google, которые основаны AI в рамках проекта, известного как ‘A.I. Experiments’.
••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••
И ВСЕМ ПРИВЕТ С ВАМ Tatarelka
На моем канале есть очень много веселых видео, а также смешных стримов которые не дадут вам соскучиться.
.
👤 Social Club: https://ru.socialclub.rockstargames.c.
👤 ГРУППА С РОЗЫГРЫШАМИ: https://vk.com/tatarelkindvor
👤 ТРЕЙД ССЫЛКА: http://steamcommunity.com/id/Tatarelk.
👤 Мой Steam: http://steamcommunity.com/id/Tatarelk.

👤 МОЙ VK: https://vk.com/artemka_petrovsky
👤 МОЙ ДИСКОРД: Tatarelka#8292
👤 МОЙ СКАЙП: tatarelka8888
.
ХАРАКТЕРИСТИКА МОЕГО ЖЕЛЕЗА

Intel(R) Core(TM) i5-7400 CPU @ 3.00GHz, 3001 МГц
Ядер: 4, Логических процессоров: 4
ОЗУ: 8 ГБ От HYPERX
Видеокарта: GTX 1060 6 ГБ От Geforce
Клавиатура: BloodY B314
Мышка: iMICE X9 Gaming
Наушники: KOTION EACH G2000
Веб-Камера: Китайская 🙂 Aoni FULL HD 1920×1080
Монитор: SAMSUNG S24D330 1920х1080
.

Оцените статью
Добавить комментарий

Adblock
detector