Система распознавания лиц
Введение
В последнее время системы распознавания лиц используются все шире, область применения этой технологии поистине огромна: от обычных селфи-дронов до дронов-полицейских. Ее интеграция в различные устройства проводится повсеместно. Сам процесс распознавания реально завораживает, и это сподвигло меня сделать проект связанный именно с этим. Целью моего стажерского проекта является создание простой open source-ной системы распознавания лиц с квадрокоптера Клевер. Данная программа берет изображения с камеры квадрокоптера, а его обработка происходит уже на компьютере. Поэтому все оставшиеся инструкции выполняются на ПК.
Разработка
Первой задачей было найти алгоритм самого распознавания. В качестве пути решения проблемы было выбрано использовать готовое API для Python. Данное API сочетает в себе ряд преимуществ: скорость и точность распознавания, а также простота использования.
Установка
Для начала нужно установить все необходимые библиотеки:
pip install face_recognition
pip install opencv-python
Затем скачать сам скрипт из репозитория:
git clone https://github.com/mmkuznecov/face_recognition_from_clever.git
Объяснение кода
Подключаем библиотеки:
import face_recognition
import cv2
import os
import urllib.request
import numpy as np
Данный кусок кода предназначен для Python 3. В Python 2.7 подключаем urllib2 вместо urllib:
import urllib2
Создаем список кодировок изображений и список имен:
faces_images=[]
for i in os.listdir('faces/'):
faces_images.append(face_recognition.load_image_file('faces/'+i))
known_face_encodings=[]
for i in faces_images:
known_face_encodings.append(face_recognition.face_encodings(i)[0])
known_face_names=[]url
for i in os.listdir('faces/'):
i=i.split('.')[0]
known_face_names.append(i)
Дополнение: все изображения хранятся в папке faces в формате name.jpg
Инициализируем некоторые переменные:
face_locations = []
face_encodings = []
face_names = []
process_this_frame = True
Берем изображение с сервера и преобразуем его в cv2 формат:
req = urllib.request.urlopen('http://192.168.11.1:8080/snapshot?topic=/main_camera/image_raw')
arr = np.asarray(bytearray(req.read()), dtype=np.uint8)
frame = cv2.imdecode(arr, -1)
Для Python 2.7:
req = urllib2.urlopen('http://192.168.11.1:8080/snapshot?topic=/main_camera/image_raw')
arr = np.asarray(bytearray(req.read()), dtype=np.uint8)
frame = cv2.imdecode(arr, -1)
Объяснение дальнейшего кода можно найти на GitHub’е используемого API в комментариях к следующему скрипту
Использование
Достаточно подключиться к "Клеверу" через Wi-Fi и проверить, корректно ли работает видеострим с камеры.
Затем просто запускаем скрипт:
python recog.py
И на выходе:
Возможные трудности
При запуске скрипта может выскочить следующая ошибка:
known_face_encodings.append(face_recognition.face_encodings(i)[0])
IndexError: list index out of range
В этом случае постарайтесь переделать изображения в папке faces, возможно из-за плохого качества программа не распознает лиц на изображениях.
Использование калибровки
Для повышения точности распознавания можно использовать калибровку камеры. Модуль для калибровки можно установить, используя специальный пакет. Инструкцию по установке и использованию можно найти в файле calibration.md. Программа с использованием калибровочного пакета называется recog_undist.py
Краткое пояснение кода:
Подключаем установленный пакет:
import clever_cam_calibration.clevercamcalib as ccc
Добавляем следующие строки:
height_or, width_or, depth_or = frame.shape
Таким образом получаем информацию о размере изображения, где height_or-это высота оригинального изображения в пикселях, а width_or-ширина. Затем исправляем искажения оригинального изображения и получаем уже его параметры:
if height_or==240 and width_or==320:
frame=ccc.get_undistorted_image(frame,ccc.CLEVER_FISHEYE_CAM_320)
elif height_or==480 and width_or==640:
frame=ccc.get_undistorted_image(frame,ccc.CLEVER_FISHEYE_CAM_640)
else:
frame=ccc.get_undistorted_image(frame,input("Input your path to the .yaml file: "))
height_unz, width_unz, depth_unz = frame.shape
В данном случае мы передаем аргумент ссс.CLEVER_FISHEYE_CAM_640, т.к. разрешение изображения в приведенном примере составляет 640x480, также можно использовать ссс.CLEVER_FISHEYE_CAM_320 для разрешения 320x240, в противном случае необходимо в качестве второго аргумента передать путь до калибровочного .yaml файла.
И, наконец, возвращаем изображение к изначальному размеру:
frame=cv2.resize(frame,(0,0), fx=(width_or/width_unz),fy=(height_or/height_unz))
Благодаря этому можно значительно повысить точность распознавания, т.к. обрабатываемое изображение будет уже не так сильно искажено.