En la actualidad, uno de los mayores retos en el mundo de la informática es conseguir que un ordenador sea capaz de analizar imágenes y explicar lo que es capaz de ver en ella, a esto se le llama visión artificial. Como comentamos en la última sesión con el grupo de 2º de Desarrollo de aplicaciones multiplataforma es un campo con grandes avances.

Pongamos el ejemplo de una persona lanzando una pelota y otra encargada de cogerla en el aire. El evento es sencillo, la primera persona lanza la pelota; la segunda observa el evento, recoge las imágenes en su retina, la que envía la información a el cerebro. El cortex visual analiza la imagen y la difunde al resto del cerebro para comparar con datos de experiencias anteriores. Se analiza el tamaño, la trayectoria y entonces se toma una decisión, levantar la mano para coger la pelota. Todo esto ocurre en una fracción de segundo, sin esfuerzo y en una fracción de segundo. Por lo que nos damos cuenta que recrear la visión humana no es sólo un problema, sino más bien un conjunto de ellos.

La investigación en este sector empezó en los 50 y empezó con 3 objetivos: replicar el funcionamiento del ojo (difícil), replicar el cortex visual (muy difícil) y replicar el resto del cerebro (aún más difícil).

Visión Artificial – El ojo

Reinventar el ojo humano es el campo en el que más hemos avanzado desde los 50. A lo largo de las últimas décadas hemos creado sensores y procesadores de imagen igual o más avanzados que el ojo humano. Cada vez con ópticas más grandes y subpíxeles más pequeños.

Además en los últimos años la capacidad de los sensores de grabar cientos de imágenes por segundo e incluso medir distancias.

Visión Artificial – El Cortex Visual

En la actualidad la técnica más utilizada se basa en procesar las imágenes para buscar bordes y los objetos a los que limitan, las perspectiva, movimiento si se presentan varias imágenes, y más parámetros.

Vision artificial

En una imagen como la que podemos observar en la parte superior; el ordenador es capaz de distinguir los distintos objetos que la componen, y nombrar cada uno de ellos.

Visión Artificial – El resto del cerebro

Podríamos crear un sistema capaz de reconocer un objeto desde cualquier ángulo, distancia o situación. Pero seguiríamos con el problema de que el ordenador no sería capaz de decir para que sirve ese objeto, si es comestible, etc.

El problema es que incluso el mejor hardware y software no funcionan sin un sistema operativo. Esta es la mayor frontera con la que los investigadores se están encontrando, replicar el funcionamiento del cerebro humano cuando aún no sabemos muy bien cómo funciona.

Conclusión

La visión artificial es muy útil y un campo con mucha mejora. Los avances los tenemos en nuestras cámaras digitales y smartphones, capaces de reconocer caras y sonrisas. En los coches autónomos capaces de conducir y reaccionar a situaciones. Incluso en las fábricas donde los robots monitorizan todo el proceso de producción. Aún falta por avanzar en este campo, pero hemos hecho unos grandes avances.

Fuente: TechCrunch