Архив рубрики: Без рубрики

Преобразование изображения в вид сверху

В этом заметке будет рассмотрено преобразование изображения в вид сверху с помощью матрицы гомографии. В жаргоне компьютерного зрения вид сверху называется вид с высоты птичьего полета (bird eye view).

Читать далее

09.03.01 — Информатика и вычислительная техника|Первый раз на первый курс

Привет! На связи вчерашний первокурсник специальности 09.03.01 кафедры САПР, факультета КТИ — Информатика и вычислительная техника. Давайте разбираться, что к чему.

Если ты считаешь, что хочешь стать программистом, стоит обратить внимание на ФКТИ, потому что дальше — интереснее. Здесь представлены 6 специальностей, а если считать с разделением на кафедры — 8. (Так получается, когда на одну специальность приходится 2 выпускающие кафедры). Теперь дальше: САПР — системы автоматизированного проектирования. Звучит непонятно, не так ли? Если верить описанию кафедры на сайте ЛЭТИ (а ему можно верить), то САПР подготовит тебя к работе с наукоёмким и прикладным софтом, позволит податься в экономику или заниматься чем-нибудь полезным в электронике и машиностроении. Как по мне, звучит интересно. По факту, после обучения здесь твоей специализацией может быть компьютерное моделирование, проектирование киберфизических систем или технологии виртуализации. А теперь то, зачем я сюда пришла – ИВТ. Из интересных профессий, ты можешь работать программистом, специалистом по информационным системам, тестировщиком, веб-разработчиком.

Читать далее

Сверточные нейронные сети для компьютерного зрения [1.1] Классификация изображений: Data-driven подход, k-Nearest Neighbor, train/val/test разделение

Это вводная статья, призванная познакомить людей, не знакомых с компьютерным зрением, с проблемой классификации изображений и data-driven подходом.

Читать далее

Сверточные нейронные сети для компьютерного зрения [0.3] Инструкция по использованию IPython

В этом разделе будет рассмотрены IPython notebooks (часто более известный как Jupyter notebooks) для работы над задачами курса. IPython notebook позволяет писать и исполнять Python код в веб-браузере. IPython notebooks позволяет очень легко править код и выполнять его частями; По этой причине IPython notebooks широко используется в научных вычислениях.

Читать далее

Сверточные нейронные сети для компьютерного зрения [0.2] Инструкция по использованию Python/Numpy

Оригинал инструкции был составлен Джастином Джонсоном.

Мы будем использовать язык программирования Python для всех заданий этого курса. Python это отличный универсальный язык программирования сам по себе, но с помощью некоторых популярных библиотек (numpy, scipy, matplotlib) он становиться мощным окружением для научных вычислений.

Несмотря на предположение, что читатель имеет некоторый опыт использования Python и numpy, для этот раздел послужит быстрым вводным курсом по языку программирования Python и использовании Python для научных вычислений для читателей с недостаточными навыками.

Читать далее

Сверточные нейронные сети для компьютерного зрения [0.1] Введение и установка

Эта статья открывает цикл статей, основанных на переводе лекций и практических заданий курса CS231n Convolutional Neural Networks for Visual Recognition Стэнфордовского университета, этот курс является вводным в использование сверточных нейронных сетей для задач компьютерного зрения. В первой части рассмотрены вопросы структуры курса и подготовки рабочей среды. В рамках перевода некоторые термины не будут переводится в силу редкости русскоязычных ресурсов и повсеместного использования оригинальных названий. Кроме того, статьи не являются точным переводом и могут быть дополнены авторами. 

Отдельная просьба к читателям: при наличии вопросов, задавайте их в сообщениях сообщества в VK.

Читать далее

Automatic Estimation of Dog Age: The DogAge Dataset

Automatic age estimation is a challenging problem attracting attention of the computer vision and pattern recognition communities due to its many practical applications. Artificial neural networks, such as CNNs are a popular tool for tackling this problem, and several datasets which can be used for training models are available.
Despite the fact that dogs are the most well studied species in animal science, and that ageing processes in dogs are in many aspects similar to those of humans, the problem of age estimation for dogs has so far been overlooked. In this paper we present the DogAge dataset and an associated challenge, hoping to spark the interest of the scientific community in the yet unexplored problem of automatic dog age estimation.

Читать далее

Компьютерное зрение. Машиное обучение с использовнием нейронных сетей (Keras)

Следующим этапом введения в компьютерное зрение является переход к более широкораспространенному инструменту в современных исследованиях, а именно нейронным сетям.

Знакомство с нейронными сетями начнем с фреймворка Keras. И на базе того же датасета MNIST попробуем сначала обучить собственную сверточную нейронную сеть.

По умолчанию Keras имеет в своей основе TensorFlow, который имеет достаточно хорошую поддержку GPU.

Читать далее

Компьютерное зрение. Машинное обучение без нейронных сетей (scikit-learn)

В качестве простейшей иллюстрации рассмотрим классификацию датасета MNIST двумя подходами, и. заодно, познакомимся с двумя инструментами.

Датасет MNIST представляет собой набор из 70000 изображений рукописных цифр от 0 до 9, который делится на 60000 обучающих изображений и 10000 тестовых. Подробное его описание и он сам доступены по адресу https://www.openml.org/d/554.

Цифры были нормализованы по размеру и центрированы на изображении фиксированного размера. Исходные черно-белые изображения из NIST были нормализованы по размеру, чтобы поместиться в поле размером 20×20 пикселей при сохранении их соотношения сторон. После нормализации изображения сглажены, вследствие чего содержат уровни серого. Полученные изображения центрированы в поле 28×28 путем вычисления центра масс пикселей и перемещения изображения таким образом, чтобы расположить эту точку в центре.

Когда-то этот датасет был одним из соревновательных датасетов для научных исследований в области классификации изображений, однако, на данный момент современными средствами и методами точность классификации приблизилась к 100%, а датасет получил роль учебного и является хорошей базой для первых шагов в машинном обучении.

Одним из наиболее известных фреймворков для машинного обучения с использованием классических методов является scikit-learn.

Читать далее

Компьютерное зрение. Введение

Статья является вводной в проблему компьютерного зрения. Разумеется, в рамках одной статьи невозможно подробно рассказать об инструментах и научить ими пользоваться, однако целью ставится введение в задачу реализации компьютерного зрения, зачем оно нужно и где применяется на данный момент, а где планируется.

Читать далее