On peut avoir trois principaux objets dans l'étude de la vérité: l'un, de la découvrir quand on la cherche; l'autre, de la démontrer quand on la possède; le dernier, de la discerner d'avec le faux quand on l'examine." Blaise Pascal.
La visión por computadora consiste en dotar a una máquina de capacidades visuales similares a las humanas. Para ello, se utiliza una cámara fotográfica, que detecta y captura datos, y una unidad de procesamiento de información. Se dice que la cámara fotográfica es un dispositivo proyectivo, ya que las imágenes se forman por la transformación perspectiva del mundo 3D al plano bidimensional de la imagen. Por lo tanto, la geometría se encuentra en el corazón de los problemas de visión por computadora. Mi investigación se centra en aplicar propiedades y conceptos geométricos en el diseño de algoritmos de visión por computadora. Una característica distintiva de mi investigación es el uso del álgebra geométrica como herramienta para modelar e implementar conceptos, principios y algoritmos.
Mi programa de investigación está dedicado a reivindicar el uso de principios geométricos en el desarrollo de algoritmos de visión por computadora, mostrar cómo se pueden usar para mejorar los métodos del estado del arte y ejemplificar cómo el álgebra geométrica simplifica el modelado, cómputo y aplicación de tales principios.
Este estudio establece las bases teóricas y los detalles de implementación de redes neuronales convolucionales que utilizan representación de cuaterniones. En particular, se propone: el modelo básico de capas de convolución cuaterniónica, capas de submuestreo cuaterniónica, el mecanismo de retropropagación y la conexión entre la convolución y transformada de Fourier cuaterniónicas.
[1] Gerardo Altamirano-Gómez, “Geometric methods of perceptual organisation for computer vision,” Ph.D. dissertation, Centro de Investigación y de Estudios Avanzados del Instituto Politécnico Nacional (Cinvestav), México, 2017.
[2] Gerardo Altamirano-Gómez and Carlos Gershenson, “Quaternion Convolutional Neural Networks: Current Advances and Future Directions,” In: Advances in Applied Clifford Algebras 34 (2024).
[3] Gerardo Altamirano-Gómez and Carlos Gershenson, “Statistical Analysis of the Impact of Quaternion Components in Convolutional Neural Networks,” 2024, preprint at https://arxiv.org/abs/2409.00140.
Se propone un nuevo algoritmo de votación para extracción de características en imágenes. En particular, nuestro algoritmo combina el uso de funciones de prominencia perceptual y banderas geométricas con una técnica de agrupamiento, todo dentro del marco matemático del modelo conforme del álgebra geométrica. El esquema de votación propuesto permite representar configuraciones complejas de datos visuales que queremos detectar; además, este algoritmo se puede utilizar como bloques de construcción para diseñar arquitecturas jerárquicas complejas. Los resultados experimentales muestran su capacidad para extraer pares de puntos, líneas, círculos y ejes de simetría de imágenes sintéticas y reales.
[1] Gerardo Altamirano-Gómez and Eduardo Bayro-Corrochano. “Conformal Geometric Method for Voting”. In: Journal of Intelligent Data Analysis 20 (2016), S69-S82.
[2] Gerardo Altamirano-Gómez and Eduardo Bayro-Corrochano. “Conformal Geometric Algebra Method for Detection of Geometric Primitives”. In: 23nd International Conference on Pattern Recognition (ICPR). 2016.
[3] Gerardo Soria-Garcı́a et. al. “Conformal Geometric Algebra Voting Scheme implemented in reconfigurable devices for geometric entities extraction”. In: IEEE Transactions on Industrial Electronics (2017).
Este trabajo propone un método geométríco para calcular la posición de una cámara dentro de un sistema no calibrado. La solución se formaliza usando el álgebra de Grassmann-Cayley.
[1] Gerardo Altamirano Gómez. “¿Dónde está el fotógrafo? Usando álgebra de Grassmann-Cayley”. Master thesis. Baja California, México: Centro de Investigación Cientı́fica y de Educación Superior de Ensenada, 2012.
[2] Mariana Chan-Ley et.al. “Método no-calibrado para localización automática de una cámara aplicable en robótica”. In: Congreso Mexicano de Robótica (COMROB), 2018.
[3] Mariana Chan-Ley et.al. "Self-localization of an uncalibrated camera through invariant properties and coded target location," Appl. Opt. 59, D239-D245, 2020.
En este proyecto, se utiliza álgebra geométrica para redefinir el operador de torque sobre imágenes, propuesto por Nishigaki et. al (2012). Nuestra definición generaliza este operador a altas dimensiones y permite el uso de momentos de alto orden. Así, proponemos un algoritmo que implementa el principio de agrupación por cerradura, de la teoría del Gestalt, para construir mapas de prominencia a partir de datos n-dimensionales.
Se propone una arquitectura de sistema abierto en tiempo real, basada en Linux RTAI, para un robot industrial de 6DOF. Nuestro sistema permite implementar diferentes algoritmos de control, integrar diferentes tipos de sensores al sistema (cámara de video, sensores de fuerza, etc.) e implementar tareas a ejecutarse en tiempo real.