Канал RecSys PhD-студента о современных технологиях и исследованиях.
Работа, ссылки и обзоры прочтенного.
Для связи: @tgurbanov
Поделиться с друзьями:
В машинном обучении есть базовые вещи, о которых обычно либо не договаривают преподаватели, либо забывают студенты/практикующие. Речь конечно же о bias/variancetrade-off, irreducibleerror, и анализе кривых тренировочной и валидирующей ошибки. Не зная или не используя данную теория вам всегда будет казаться, что чем больше тренировочных данных, тем лучше результат. Так победим же безграмотность :)!
https://www.dataquest.io/blog/learning-curves-machine-learning/
2018-02-01 18:19:24
Качество современной фото и видео съемки все больше зависит от инженерных решений, используемых для корректировки захватываемого изображения. Посмотрите сколько исправлений и модификаций производит Pixel 2 во время записи видео. Здесь вам и стабилизация, и машинное обучение, и даже использований знаний о свойствах мозга, концентрирующего меньше внимания на некоторых частях видимого пространства.
https://research.googleblog.com/2017/11/fused-video-stabilization-on-pixel-2.html
2018-01-18 13:16:10
Что происходит внутри искусственных нейронных сетей? Как они учатся распознавать различные паттерны? За что отвечают различные слои сети? Попытки найти ответы на эти вопросы ведутся уже давно. Пожалуй единственный на данный момент способ, позволяющий хоть немного приоткрыть занавес тайн - это визуализация фич (feature visualization). Идея способа лежит на поверхности: если сеть по входящему сигналу умеет распознавать исходящий сигнал, то почему бы не заставить ее сгенерировать такой входящий сигнал, который максимизирует качество исходящего сигнала. Например, в случае с распознаванием объектов на изображениях, можно сгенерировать изображение, отображающее паттерны на которые сеть пытается обратить внимание при распознавании объекта. Ниже по ссылке интерактивная статья об уже существующих достижениях в области feature visualization. Очень красиво:)
https://distill.pub/2017/feature-visualization/
2018-01-17 13:16:31
А самым любопытным, ссылка на статью про создание звуков для No Man’s Sky:
https://www.newyorker.com/tech/elements/what-a-dragons-mating-scream-sounds-like
2018-01-05 02:10:56
Когда-то, на первых курсах университета, мой друг Леша и я пытались писать компьютерные игры. Как-то Леша нашел на ютубе видео где алгоритм в реал-тайме создавал города (прокладывал дороги, возводил здания и парки). Мы тогда долго обсуждали как это круто и что надо бы создать игру с использованием подобного алгоритма. Конечно же мы были не первые и не единственные кто так думал. Сейчас уже никого не удивишь играми с автоматически генерируемыми ландшафтами. Подобные игры обычно генерируют прямоугольник карты на котором затем происходят действия игры. Но создатели No Man’s Sky пошли дальше и создали игру в которой машина генерирует бесконечную вселенную с планетами (которые можно открывать и называть своим именем), физику для планет, флору и фауну, звуки и многое-многое другое. К сожалению, новые статьи про No Man’s Sky либо длинные, либо слишком технические поэтому я поделюсь ссылкой на старую.
https://www.technologyreview.com/s/529136/no-mans-sky-a-vast-game-crafted-by-algorithms/
2018-01-05 02:05:33
Дорогие читатели RSPHD, 2017 был не простым (математики могут не согласиться), но очень интересным годом. К сожалению, его концовка была настолько насыщенной, что я не успевал писать посты. За что я, конечно же, извиняюсь. Надеюсь, что в 2018 году каналу (и мне) удастся вернуться в строй и продолжить радовать вас интересными новостями. С наступающим🎉❄️🎄!
2017-12-31 17:50:23
Laurence Kemball-Cook, основатель компании Pavegen, пытается решить задачу генерации чистой энергии довольно необычным способом. Он предлагает накапливать и использовать энергию, которая образуется при хождении, в момент наступания на пол или сгибания подошвы. При этом энергия собирается либо при помощи специального покрытия пола (плиток), либо самой подошвой. К сожалению, подошва, судя по тому что о ней ничего не слышно с 2015 года, большим успехом не пользуется. А вот с полом все очень хорошо. Его использовали для освещения некоторых помещений аэропорта Хитроу и стадиона в Рио-де-Жанейро, а в этом году он представлен на фестивале света в Берлине.
https://www.technologyreview.com/s/543591/the-quest-to-make-your-shoe-a-power-source/
2017-11-06 00:51:35
Существующие технологии распознавания речи работают плохо в ситуациях, когда несколько человек говорят одновременно в один микрофон. Т.е. грубо говоря, в одновременном разговоре трех людей, такие системы не способны выделить высказывания каждого автора. Представленная Mitsubishi Electric Research Laboratory технология "deep clustering" позволяет решить эту проблему. Технологию предполагается использовать для голосового управления лифтами и кондиционерами (сразу вспоминается ролик про шотландцев в лифте: https://www.youtube.com/watch?v=5FFRoYhTJQQ). Но вообще, мне кажется, что "обратное" применение технологии куда интереснее. Например, можно попробовать распознать ваш голос и выделить его из общего шума. Ваш собеседник больше не будет страдать когда вы звоните из клуба где играет громкая музыка или идете по Оксфорд стрит.
https://www.newscientist.com/article/2151268-an-ai-has-learned-how-to-pick-a-single-voice-out-of-a-crowd/
2017-11-02 13:34:10
Есть такое понятие - AI winter - это периоды времени в которые происходил упад интереса (в основном финансового) к исследованиям в области AI. Последняя такая зима закончилась в 2010 году, когда исследователям таки удалось заставить DL работать. Первые успешные DL модели использовали для весов значения типа float32, но оказалось, что это слишком ресурсоемко (особенно для мобильных устройств). Сейчас, чтобы оптимизировать объем используемой памяти применяют метод квантования: float32 хитро заменяется на 8 битное представление. При этом качество модели почти не изменяется. О том, как устроено квантование в tensorflow можно почитать по ссылке внизу:
https://petewarden.com/2016/05/03/how-to-quantize-neural-networks-with-tensorflow/
2017-10-31 20:07:57
Исследователи из MIT, во главе с Joshua Siege, создают приложение способное провести диагностику автомобиля на основе анализа звуков, вибраций и траекторий движения автомобиля. Говорят, что точность диагностирования больше 90%.
http://news.mit.edu/2017/software-let-your-car-tell-you-what-it-needs-1026
2017-10-30 18:04:33