Arquitectura FRVS (Face Recognition Video Sensor)

Es un m�dulo software que cumple con la arquitectura VISOR. Su funci�n es verificar la identidad de una persona en el contexto de un sistema de control de acceso. Este video sensor es un subsistema dentro del sistema global de control de acceso.

Las entradas a este sistema son un PIN (Personal Information Number, que tendr� que introducir el usuario del sistema, y la imagen captada del mismo (ver figuras Figura 3 y Figura 4). El PIN ser� el �ndice por el que buscar en una base de datos que contienen las caracter�sticas faciales del sujeto. Por otro lado el sistema extraer� caracter�sticas faciales de la imagen tomada y las comparar� con las almacenadas, dando un PCD (Personal Confidence Degree), un n�mero que indica el grado de similitud.

Figura 3. Arquitectura del FRVS

Figura 4. FRVS Core

Existen dos m�todos internos para extraer las caracter�sticas faciales, que ser�n detallados en el siguiente cap�tulo:

Una vez obtenida la informaci�n se usar� una Red Neuronal tipo Multi-Layer Perceptron Neuronal Network(MLP-NN) para el reconocimiento.

Figura 5. FRVS por dentro

El funcionamiento interno del m�dulo se puede apreciar la figura Figura 5. Se introduce una imagen y un PIN, que son comunicados mediante un interfaz CORBA al m�dulo. Por un lado, el PIN sirve de �ndice para buscar en una base de datos, que extraer� las caracter�sticas faciales de la identidad propuesta por el usuario. Estas caracter�sticas son comparadas con las que se extraen de la imagen introducida, ya sea por PCA(Principal Component Analysis) o por Gabor y se da un porcentaje de acierto, que ser� lo que se devuelva a trav�s del interfaz CORBA.

Detecci�n de la cara

El objetivo de este modulo inicial es encontrar y encuadrar la cara (o las posibles caras) que aparecen en la imagen. El m�todo desarrollado barre la imagen buscando aquellos pixels con una textura correspondiente a la de la piel, determinando cuales de ellos constituyen una hip�tesis aceptable de rostro.

M�todo PCA

La idea principal es la de reducir las grandes dimensiones de estas regiones de imagen, e intentar perder el m�nimo posible de informaci�n. Esto se hace con un cambio de base, pasando de un espacio a otro de menor dimensi�n.

No es necesaria mucha informaci�n para representar una cara, y con esta reducci�n conseguimos que ya sea viable la comparaci�n directa de las caracter�sticas faciales almacenadas con las extra�das de la imagen.

Filtro de Gabor

Gabor se centra en la extracci�n de puntos para luego usar el filtro de Wavelet. Las t�cnicas de an�lisis wavelet emplean regiones de tama�o variable, para el an�lisis de im�genes nos permite utilizar regiones grandes donde se necesita informaci�n que precisa poca frecuencia (regiones m�s o menos homog�neas) y peque�as regiones donde la informaci�n necesita altas frecuencias (regiones v�rtices, aristas o cambios bruscos de color). El an�lisis wavelet es capaz de mostrar aspectos de la se�al que otras t�cnicas no logran encontrar. El c�lculo de la transformada wavelet para todas las posibles escalas supone una gran cantidad de informaci�n. Escoger s�lo aquellas escalas y posiciones que resulten interesantes para ciertos estudios es una tarea dif�cil.

El objetivo del proceso es encontrar 12 puntos de control sobre el rostro del sujeto para ajustar a continuaci�n una m�scara. Esta m�scara se compone de 31 puntos sobre los que se aplicar� la transformada Wavelet con los que se entrenar� la Red Neuronal (ver figura Figura 6). El proceso para encontrar los puntos de control es el siguiente:

Figura 6. M�scara. En rojo los puntos de control

Encontrar ojos y boca

Un peque�o cuadro, con tama�o suficiente para abarcar un ojo o una boca recorrer� la imagen para encontrar un ojo o boca. Este cuadro ser� la entrada para una red neuronal entrenada con ojos y bocas que nos indicar� si el cuadro contiene alguno de estos elementos (ver figura Figura 7).

Figura 7. Ejemplo de cuadro de un ojo

Transformaciones sobre la imagen

Una vez que tenemos localizado un ojo o una boca se proceder� a aplicarles filtros sucesivos, a fin de extraer la informaci�n que nos facilitar� la extracci�n de los puntos de control.

  1. Detecci�n de bordes. Se hace una detecci�n de bordes con varios grados diferentes de inclinaci�n (Horizontal, vertical, 45 y 315) y se funden en una sola para tener toda la informaci�n posible de los bordes.

  2. Binarizado. Se pasa la imagen resultante de la detecci�n de bordes, que se encontraba en niveles de gris a blanco y negro para trabajar solo con valores de 1 o 0.

  3. Thinning. Se hace un adelgazamiento para sacar unas l�neas claras sin grosor. Esto facilitar� enormemente la deducci�n de caracter�sticas.

  4. Deducci�n de puntos. Seg�n sea una boca o un ojo derecho o un izquierdo, al tener muy poco ruido y l�neas sin grosor, ya se puede deducir cuales son los puntos del ojo.

Figura 8. Filtros sobre un ojo

Una vez obtenidos los puntos de control se pasa al proceso de ajuste y deformaci�n de la m�scara. De esta manera cada sujeto tendr� su propia m�scara diferente a la de cualquier otro sujeto. Las transformaciones son las siguientes:

  1. Rotaci�n. Se calcula la diferencia de inclinaci�n los puntos de los ojos, tanto de los de control como de la m�scara, y se rota la m�scara adecuadamente.

  2. Translaci�n. Se calcula la diferencia de coordenadas de los puntos de control y sus hom�logos en la m�scara y se mueve la m�scara.

  3. Deformaci�n. Se deforma la m�scara para que los puntos que est�n m�s cerca de los de control son m�s atraidos hacia ellos.

Una vez terminado este proceso obtendremos 31 puntos en 2D propios y �nicos de ese sujeto, que ser�n usados como caracter�sticas faciales para entrenar la Red Neuronal, una vez aplicada la tranformada Wavelet.

Redes Neuronales

Las redes neuronales forman parte de un importante sector dentro de la Inteligencia Artificial. Son ampliamente usadas para el reconocimiento de formas en la Visi�n computacional.

Las redes neuronales y otros m�todos estad�sticos avanzados son teor�as muy �tiles para hallar la soluci�n a problemas de clasificaci�n y predicci�n. Las redes neuronales proporcionan una herramienta muy potente para la resoluci�n de problemas complejos en los �mbitos cient�fico, tecnol�gico y empresarial. La caracter�stica principal de este tipo de programas es su capacidad de tratar problemas de clasificaci�n y predicci�n mediante un aprendizaje realizado sobre ejemplos.