Точность машинного зрения
Машинное зрение получает изображение, обрабатывает и использует информацию для решения без участия человека прикладных задач.
В робототехнике, в связанных с ним технологиях, которые направлены на получение объектов из реального мира в изображениях, и в области искусственного интеллекта есть специальное направление для этого – машинное зрение.
Хронология развития
Начало развития обработки изображений оптического источника взяло своё начало в 1955 году в опубликованной статье «Глаза и уши компьютера», автором которой был Оливер Селфридж. В статье он описывал реальность, в который мы уже сейчас живем, почти предсказал сегодняшнюю действительность. Главным примером была система распознавания лиц, которая в 2020 году есть даже во многих моделях телефонов.
После Оливера Селфриджа каждое десятилетие выходили большие работы ученых, направленные на анализ и разработку машинного зрения. В 80-х годах его начали использовать в производстве товаров, чтобы сделать бизнес более эффективным. Первой компанией, которая начала использовать его в производстве, является Automatix. В 1980-х на их производстве появились модели машин с аналоговыми камерами, которые были созданы, чтобы паять микросхемы. Они анализировали данные и в дальнейшем передавали изображение на обработку процессору, который давал команды остальным частям системы для дальнейшей работы.
Сейчас искусственный интеллект способен проанализировать любую фотографию, выложенную в социальную сеть, и определить на ней друга человека, который выложил фото.
Чем машинное зрение превосходит человеческое?
Наша зрительная система сложна, хрупка и не является самой продвинутой. Световые частицы попадают в сетчатку, где 126 миллионов клеток расшифровывают и отправляют информацию в мозг. В мозгу частицы разделяются на 2 направления: одно отвечает за цвета, другие за их оттенки.
Машинное зрение работает по-другому, здесь есть два сценария. В первом системы с умными камерами, которые самостоятельно анализируют информацию и разгружают процессоры системы. Во втором варианте система с обычными цифровыми камерами, которые обрабатывают и распознают элементы, передавая сигнал дальше.
Машины узнают объекты с точностью 98%, чем не может похвастаться человек. Каждый глаз индивидуален, дополнительно на который действует усталость, внешние и возрастные факторы. Машина не выдаст ошибку «замылилась и устала камера», она может ошибиться только в случаях, когда мало критериев для определения предмета, возможно, из-за дефектов или брака. Однако в нестандартных ситуациях машина не справится, здесь понадобится взгляд опытного мастера.
Сейчас машины способно не только узнать предмет, но и понять, что с ним нужно делать дальше. Они охватывают абсолютно все объекты, поступающие в процессоры, когда человек может максимально сосредоточить своё внимание только на 7 объектах. Также человек подвержен внешней среде, его легко может отвлечь громкий звук или собственные мысли, когда машина не знает, что это такое, для неё всё вокруг имеет равное значение.
Задачи машинного зрения:
- Распознавание. Определение у объекта определенного характера, активности или особенность, которую нужно зафиксировать.
- Обнаружение. Определение наличия нужного условия. Иногда используется для анализа изображения, чтобы найти в нем нужные небольшие участки.
- Идентификация. Определяет принадлежность к какому-либо классу анализируемый экземпляр, например, отпечаток пальца.
- Распознавание текста. Распознавание знаков и символов на изображениях текста любого вида (рукописного или печатного).
- Восстановление сцены. Воссоздание трёхмерной модели или модели набора точек в трёхмерном пространстве, отображающие сцену.
- Оценка движения. Обрабатывают видеоданные для определения скорости точки, например, машин или людей.
- Восстановление изображений. Удаление шума с изображений. Часто с помощью фильтров средних и нижних частот.