Cibernetia > Tesis doctorales
Búsqueda personalizada

Índice > CIENCIAS TECNOLOGICAS > TECNOLOGIA DE LOS ORDENADORES >

VISION ARTIFICIAL



67 tesis en 4 páginas: 1 | 2 | 3 | 4
  • APLICACIÓN DE LA VISIÓN ARTIFICIAL EN LA CLASIFICACIÓN Y CONTROL DE CALIDAD DE PRODUCTOS ALIMENTARIOS .
    Autor: SÁNCHEZ FERNÁNDEZ CARLOS.
    Año: 2004.
    Universidad: PUBLICA DE NAVARRA.
    Centro de lectura: E.T.S DE INGENIEROS AGRÓNOMOS.
    Centro de realización: E.T.S DE INGENIEROS AGRÓNOMOS.
    Resumen: El objetivo de esta tesis es desarrollar la posible aplicación de la visión artificial en los procesos de clasificación y en el control de calidad de los productos alimentarios, mediante un sistema de visión artificial que no dispone de herramientas específicas para esta aplicación.Y conseguir una inspección objetiva, automática, rápida e higiénica de varios vegetales por un sistema de visión artificial.A la vista de los resultados obtenidos se puede afirmar que el equipamiento estándar utilizado en este experimento puede aplicarse a multitud de procesos en la industria alimentaría, bien sea utilizando en cada situación la herramienta del programa apropiada o desarrollando una serie de funciones discriminantes que ayuden a predecir el resultado que buscamos.
  • Local Structure Tensor for Multidimensional Signal Processing. Applications to Medical Image Analysis .
    Autor: San José Estépar Raúl.
    Año: 2004.
    Universidad: VALLADOLID.
    Centro de lectura: E.T.S. de Ingenieros de Telecomunicación.
    Centro de realización: Escuela Técnica Superior de Ingenieros de Telecomunicación.
    Resumen: Feature extraction and, particularly, orientation estimation of multidimensional images is of paramount importance for the Image Processing and Computer Vision communities. This dissertation focuses on this topic; specifically, we deal with the problem of local structure tensor (LST) estimation, as a mean of characterizing the local behavior of a multidimensional signal. The LST can be seen as a measure of the uncertainty of a multidimensional signal with respect to a given orientation. LST estimation can be achieved by estimating the local energy of a signal in different orientations. Then, the LST is computed as a linear combination of the local energy for each orientation with a tensor basis whose elements are calculated for each orientation. This kind of methods for the estimation of the LST is based on quadrature filters to obtain the local energy of the signal.
  • New methods for triangulation-based shape acquisition using laser scanners .
    Autor: Forest Collado Josep.
    Año: 2004.
    Universidad: GIRONA.
    Centro de lectura: Escola Politècnica Superior.
    Centro de realización: Escola Politècnica Superior.
    Resumen: Tradicionalment, la reproduccio del mon real sen's ha mostrat a traves d'imatges planes. Aquestes imatges se solien materialitzar mitjancant pintures sobre tela o be amb dibuixos. Avui, per sort, encara podem veure pintures fetes a ma, tot i que la majoria d'imatges s'adquireixen mitjancant cameres, i es mostren directament a una audiencia, com en el cinema, la televisio o exposicions de fotografes, o be son processades per un sistema computeritzat per tal d'obtenir un resultat en particular. Aquests processaments s'apliquen en camps com en el control de qualitat industrial o be en la recerca mes puntera en intelligencia articial. Aplicant algorismes de processament de nivell mitja es poden obtenir imatges 3D a partir d'imatges 2D, utilitzant tecniques ben conegudes anomenades Shape From X, on Xes el metode per obtenir la tercera dimensio, i varia en funcio de la tecnica que s'utilitza a tal nalitat. Tot i que l'evolucio cap a la camera 3D va comenar en els 90, cal que les tecniques per obtenir les formes tridimensionals siguin mes i mes acurades. Les aplicacions dels escaners 3D han augmentat considerablement en els darrers anys, especialment en camps com el lleure, diagnosi/cirurgia assistida, robotica, etc. Una de les tecniques mes utilitzades per obtenir informacio 3D d'una escena, es la triangulacio, i mes concretament, la utilitzacio d'escaners laser tridimensionals. Des de la seva aparicio formal en publicacions cientques al 1971 [SS71], hi ha hagut contribucions per solucionar problemes inherents com ara la disminucio d'oclusions, millora de la precisio, velocitat d'adquisicio, descripcio de la forma, etc. Tots i cadascun dels metodes per obtenir punts 3D d'una escena te associat un proces de calibracio, i aquest proces juga un paper decisiu en el rendiment d'un dispositiu d'adquisicio tridimensional. La nalitat d'aquesta tesi es la d'abordar el problema de l'adquisicio de forma 3D, des d'un punt de vista total, reportant un estat de l'art sobre escaners laser basats en triangulacio, provant el funcionament i rendiment de diferents sistemes, i fent aportacions per millorar la precisio en la deteccio del feix laser, especialment en condicions adverses, i solucionant el problema de la calibracio a partir de metodes geometrics projectius.
  • ECUACIONES DIFERENCIALES GEOMÉTRICAS EN VISIÓN POR ORDENADOR Y APLICACIONES.
    Autor: SANTANA PÉREZ FRANCISCO JOSÉ.
    Año: 2004.
    Universidad: LAS PALMAS DE GRAN CANARIA.
    Centro de lectura: I.U. CIENCIAS Y TECNOLOGÍAS CIBERNÉTICAS.
    Centro de realización: EDIFICIO DE INFORMÁTICA Y MATEMÁTICAS.
    Resumen: Una de las maneras en las que las Matemáticas han contribuido a la mejora o a la descripción de escenas o formas (imágenes en general) es a través de la aplicación de operadores diferenciales a las imágenes, persiguiendo siempre el propósito del análisis o reconocimiento de algunas formas. No es algo nuevo estudiar trabajos que involucran el uso de operadores diferenciales aplicados a imágenes. Muchos de ellos trabajan con el Análisis Multiescala que como se verá no es más que el análisis de una imagen a diferentes escalas en las que, en cada una de ellas, vamos eliminando elementos que la componen que sean más irrelevantes o menos importantes, de forma que en distintas escalas tengamos información sobre la escena que nos permitan o ayuden posteriormente a su descripción. Una de nuestras inquietudes al comienzo de la realización de este trabajo era analizar detalladamente la forma en que se discretizaban los operadores diferenciales que aparecían en algunos de dichos análisis. Pues bien, este problema, cuando se utilizan operadores no lineales, resulta una tarea que no es fácil de realizar, y existe el riesgo de propagación de errores inherentes a dicha discretización. El camino más fácil es el discretizar cada operador no lineal como operadores lineales por separado y sustituir dicha discretización dentro de la ecuación no lineal original, aunque no sea la mejor forma de hacerlo. Uno de los objetivos que hemos perseguido ha sido el descubrir alguna otra técnica alternativa (a la anteriormente descrita y a la que otros autores han realizado hasta el momento de la realización de este trabajo) que permitiera utilizar un tipo de discretización de algunos operadores que aparecen en ciertas ecuaciones diferenciales, que al ser aplicados como filtros, resultan importantes. Por otro lado, uno de los objetivos de la visión por computador se basa en, dada una escena, intentar identificar objetos que forman parte de la misma. El principal problema de ello es que los objetos no tienen siempre las mismas proporciones en una escena o en otra, sino que pueden estar rotados, desplazados, deformados, o con otra transformación. Es por ello que su identificación resulta, en muchos casos, muy difícil de realizar. En este trabajo hemos pretendido, como segundo objetivo de nuestras ivestigaciones, establecer una representación invariante de formas (figuras) geométricas planas, utilizando el análisis morfológico multiescala y sus propiedades. Para ello, en primer lugar se utilizan algunos resultados teóricos sobre la evolución del perímetro y el área de las formas. Esto nos permitirá aprender y averiguar algunos mecanismos que nos ayudarán posteriormente a encontrar fórmulas, basadas en los análisis multiescala, que nos ayuden a identificar determinadas figuras planas, basándonos en la evolución su área y de su perímetro en las distintas escalas. En caso de tener transformaciones de similitud, el invariante geométrico propuesto se basa en la evolución normalizada en escala del cociente isoperimétrico de la forma. En caso de transformaciones geométricas afines generales el invariante geométrico se basa en la evolución normalizada en escala del área. Presentamos además algunos resultados numéricos para evaluar el rendimiento de los modelos propuestos. El método que nosotros proponemos en este trabajo consiste en utilizar la evolución del área y/o perímetro de la forma a través de las escalas utilizando diferentes análisis multiescala morfológicos como herramientas básicas para extraer una representación global escala-espacial de la forma.
  • LOCALIZACIÓN DE CONTORNOS CON PRECISIÓN SUB-PIXEL EN IMÁGENES BIDIMENSIONALES Y TRIDIMENSIONALES.
    Autor: TRUJILLO PINO AGUSTÍN RAFAEL.
    Año: 2004.
    Universidad: LAS PALMAS DE GRAN CANARIA.
    Centro de lectura: I.U. CIENCIAS Y TECNOLOGÍAS CIBERNÉTICAS.
    Centro de realización: EDIFICIO DE INFORMÁTICA Y MATEMÁTICAS.
    Resumen: La presente tesis lleva por título "Localización de Contornos con Precisión Sub-Pixel en Imágenes Bidimensionales y Tridimensionales", y está enmarcada dentro del área de Visión Artificial. El trabajo principal consiste en la detección precisa de los contornos tanto en imágenes bidimensionales como tridimensionales. El objetivo es obtener estimaciones de la posición, orientación y curvatura del contorno en el interior de cada pixel / voxel por el que dicho contorno atraviesa. Para ello se proponen diversos algoritmos novedosos que, sin un coste computacional muy alto, obtengan medidas de error inferiores que con las técnicas actuales. Principalmente se hará un mayor énfasis en imágenes angiográficas, en donde el principal objetivo consiste en detectar los bordes de los vasos sanguíneos, con el fin de poder indicar medidas sobre el vaso (grosor, curvatura) que puedan ayudar al médico en su diagnóstico. Tres son las partes en las que la tesis puede dividirse: 1. La mayoría de los trabajos de detección de bordes están enfocados a nivel pixel. Sin embargo, cuando se requiere una precisión más fina, habría que tratar de encontrar la posición exacta del contorno en el interior de cada pixel. En esta tesis se realiza un estudio en profundidad de este problema, y se proponen métodos para resolverlo. 2. En los últimos años, con los nuevos dispositivos presentes en la mayoría de los hospitales (scanners 3D, resonancia magnética), ya es posible obtener imágenes tridimensionales. La generalización de los trabajos hechos para dos dimensiones para adaptarlos a las 3 dimensiones implica mayor complejidad. La segunda parte de la tesis aborda este problema. 3. Finalmente, las imágenes adquiridas por este tipo de dispositivos contienen un cierto nivel de ruido la adquisición. Por lo tanto, es preciso procesar la imagen previamente para tratar de eliminar en lo posible dicho ruido. En la última parte de la tesis se propone un nuevo algoritmo que mejore la calidad de la imagen eliminando el ruido, para poder estimar los contornos con gran precisión sobre la imagen final.
  • ESQUEMAS EFICIENTES DE GEOMETRIA COMPUTACIONAL APLICADOS A LA SEGMENTACION DE IMAGENES MEDICAS .
    Autor: CARDENES ALMEIDA RUBEN ISIDRO.
    Año: 2003.
    Universidad: LAS PALMAS DE GRAN CANARIA.
    Centro de lectura: TELECOMUNICACIONES.
    Centro de realización: FACULTAD DE INFORMATICA.
    Resumen: La segmentación de imágenes es un concepto de visión artificial que en la identificación de objetos en una imagen, tal como el ser humano hace en su cerebro al percibir una imagen a través de sus ojos. En este campo se han realizado una gran cantidad de avances en las últimas décadas, en parte gracias a la necesidad de procesar imágenes médicas, para ayudar al médico a realizar diagnósticos por imagen o para planificar operaciones quirúrgicas, entre otras muchas aplicaciones. Se han propuesto innumerables métodos de segmentación, sin embargo, muchos de ellos carecen de la eficiencia necesaria para poder ser utilizados en la práctica en aplicaciones clínicas rutinarias. Para tratar de solucionar este problema, es esta tesis se proponen una serie de algoritmos de {\em geometría computacional basados en transformadas rápidas de distancias, además de otras técnicas como la computación paralela en multiprocesadores, que dan lugar a unos esquemas altamente eficientes para la aplicación práctica de métodos de segmentación de imágenes. Entre las contribuciones más significativas introducidas en esta tesis, se encuentran la mejora en eficiencia y la generalización a dominios arbitrarios de un tipo de transformadas de distancias basadas en propagación ordenada con una nueva métrica geodésica más rápida y precisa que cualquiera de las propuestas hasta la fecha. Estas nuevas transformadas de distancias permiten el desarrollo de algoritmos de geometría computacional como diagramas de Voronoi, diagrama de Voronoi de orden k, transformada de los k-vecinos más cercanos, triangularizaiones de Delaunay, esqueletonizaciones, etc. Algunos de ellos son válidos incluso para dominios arbitrarios 2D y 3D. Estos algoritmos consiguen acelerar los métodos basados en búsqueda de vecinos más cercanos en segmentación supervisada, y además permiten mejorarlos añadiendo canales de información espacial basados en distancias geodésicas que se muestran viables en aplicaciones clínicas reales como la segmentación del cartílago de la rodilla y la segmentación de lesiones de esclerosis múltiple en imágenes de resonancia magnética. También es posible aplicar alguno de estos nuevos algoritmos a métodos no supervisados, aunque éstos últimos carecen de la versatilidad y eficacia de los métodos supervisados.
  • TECNICAS DE RECONOCIMEINTO FACIAL MEDIANTE REDES NEURONALES .
    Autor: CABELLO PARDOS ENRIQUE.
    Año: 2003.
    Universidad: POLITECNICA DE MADRID.
    Centro de lectura: FACULTAD DE INFORMATICA.
    Centro de realización: FACULTAD INFORMATICA.
    Resumen: En esta Tesis se exploran soluciones a la verificación facial. Se han estudiado técnicas basadas en imágenes bidimensionales y se ha realizado un estudio inicial basado en un modelo tridimensional de la cara. Se han comparado tres clasificadores (k vecinos más cercanos, redes neuronales del tipo funciones de base radial y máquinas de vector soporte), mostrando los resultados obtenidos con los diferentes datos de entrada.
  • RECONOCIMIENTO FACIAL AUTOMATICO MEDIANTE TECNICAS DE VISION TRIDIMENSIONAL .
    Autor: MORENO DIAZ ANA BELEN.
    Año: 2003.
    Universidad: POLITECNICA DE MADRID.
    Centro de lectura: FACULTAD DE INFORMATICA.
    Centro de realización: E.T.S.I. TELECOMUNICACION.
    Resumen: En esta Tesis se presentan nuevas soluciones al problema del Reconocimiento Facial Automático enmarcadas dentro de la Visión Tridimensional. La Visión Tridimensional es la parte de la Visión por Computador que utiliza las propiedades tridimensionales de una escena real (obtenidas de su digitalización) para realizar una interpretación sobre la misma. En este caso, se trata de reconocer la cara humana, usando para ello información 3D. Este trabajo de investigación se ha centrado en la búsqueda de nuevos planteamientos que mejoren la robustez de los Sistemas de Reconocimiento Facial Automático ante variaciones de las distintas imágenes faciales de cada individuo. Así, se ha profundizado en metodologías que liberen en gran medida a estos sistemas, de su dependencia respecto de las condiciones de adquisición de las imágenes (iluminación, maquillaje, sombras, transformaciones geométricas, expresiones faciales, etc.), así como en la búsqueda de información 3D extraíble de las imágenes de caras humanas, que aporte un mayor poder de discriminación entre individuos. Para la evaluación de las técnicas propuestas, se ha creado una Base de Datos de imágenes faciales 3D, suficientemente amplia en cuanto a número de individuos y rica en variaciones entre imágenes de cada individuo. Dichas imágenes consisten en mallados tridimensionales que representan a las superficies faciales de forma realista, adquiridos mediante un digitalizador 3D. En este trabajo de Tesis se ha trabajado fundamentalmente con este tipo de imágenes desprovistas de su información de color, con objeto de conseguir eficiencia en los sistemas propuestos y de evitar los efectos perniciosos en estos sistemas causados por la variabilidad de las imágenes cuando aparecen sombras y cambios del tipo de iluminación. A continuación, se ha realizado un análisis en profundidad de la capacidad de discriminación de un gran número de posibles descriptores faciales 3D (un total de 86), que se han extraído automáticamente de los mallados de superficie. Este análisis ha fructificado en la obtención de un conjunto reducido de descriptores con gran capacidad de discriminación. Tales descriptores son invariantes ante transformaciones geométricas (rotaciones, traslaciones y escalados) pues se obtienen de regiones segmentadas de acuerdo al signo de los valores de curvatura local media y gaussiana. Por otra parte, estos descriptores se encuentran en zonas de la cara visibles, donde no hay presencia de barba, bigote, etc., y que sufren poca variación cuando se producen expresiones faciales. Tras este análisis, se propone como aportación de esta Tesis un sistema de reconocimiento facial automático que utiliza este conjunto de descriptores de las superficies faciales 3D, del que se ha abordado la metodología para automatizar todas sus etapas. Una de las etapas necesarias en numerosos sistemas de reconocimiento facial automático es la de corrección o normalización de la pose (posición y orientación) de las imágenes. Dicho proceso puede realizarse para imágenes faciales 3D de rango, si se cuenta con un número suficiente de puntos de la superficie facial que se puedan utilizar para el cálculo de la transformación geométrica de normalización. En esta Tesis se aportan dos métodos de localización automática de puntos faciales 3D en mallados tridimensionales de superficie, para este propósito. Por otra parte, en algunas aplicaciones de Medicina Forense, Antropología o de las Fuerzas de Seguridad se precisa la intervención manual de un usuario, para seleccionar puntos faciales. Se aporta en esta Tesis Doctoral una herramienta de software (basada en visión estereoscópica) orientada a la obtención de puntos faciales 3D de forma precisa, a partir de sus proyecciones 2D o correspondencias en varias imágenes, seleccionadas manualmente. Para el diseño de esta herramienta se han tenido en cuenta las necesidades de los usuarios finales. Con objeto de profundizar aún más en la búsqueda de información 3D que discrimine mejor a las caras humanas, se han experimentado otros sistemas de reconocimiento facial que no requieran una etapa de localización de características. Dichos sistemas emplean información holística 3D de la cara, que incluye nuevas representaciones de la forma 3D aportadas en esta Tesis (fundamentalmente composiciones de secciones de volumen). El reconocimiento a partir de diferentes representaciones 3D de este tipo, obtenidas a partir de los mallados faciales, se ha experimentado con éxito sobre dos sistemas basados en técnicas ampliamente utilizadas en la literatura de Reconocimiento Facial Automático aplicadas habitualmente cuando se realiza a partir de imágenes 2D: el Análisis de Componentes Principales (PCA) y Support Vector Machines (SVM), respectivamente. Para que estas técnicas puedan tomar como patrones de entrada representaciones holísticas de mallados tridimensionales, se ha propuesto la inclusión de una etapa previa de corrección de la pose de las imágenes 3D. También se ha aportado una representación volumétrica regular mediante vóxeles (obtenida a partir de los mallados faciales) para disponer de patrones de entrada alternativos a los mapas de profundidad, que se habían empleado hasta el momento en este tipo de sistemas de reconocimiento facial 3D holísticos. Palabras clave: Visión Artificial, Visión Tridimensional, Reconocimiento de Patrones, Reconocimiento Facial Automático, Biometría.
  • TECNICAS AVANZADAS PARA EL CONTROL VISUAL DE ROBOTS BASADAS EN CARACTERISTICAS DE LA IMAGEN. APLICACION A LA SOLUCION DE POSIBLES SINGULARIDADES .
    Autor: GARCIA ARACIL NICOLAS MANUEL .
    Año: 2003.
    Universidad: MIGUEL HERNANDEZ.
    Centro de lectura: ESCUELA POLITECNICA SUPERIOR DE ELCHE.
    Centro de realización: ESCUELA POLITECNICA SUPERIOR DE ELCHE.
    Resumen: El control visual es un tema de investigación mutidisciplinar, ya que engloba conocimientos de diversos campos, como son: la visión artificial, la robótica y el control. Las técnicas de control visual son útiles en un amplio rango de aplicaciones y son usadas para controlar diferentes sistemas dinámicos (manipuladores, robots móviles, vehículos submarinos autónomos, aeronaves, etc). Sin embargo, existen muchos problemas sin resolver y que hacen que no exista todavía un sistema de control visual totalmente fiable. Esta Tesis Doctoral contribuye a hacer las técnicas de control visual basadas en características de la imagen un poco más robustas. Para ello, primero se propone una solución particular basada en un esquema de control visual cooperativo que permite solucionar los problemas de singularidad de la tarea, errores en la extracción de características, desaparición de características en el plano de la imagen, etc propios de las técnicas de control visual de robots basadas en características de la imagen. También se presenta en esta tesis una novedosa solución general a la restricción de visibilidad impuesta a todas las técnicas de control visual basadas directa o indirectamente en características de la imagen. Esta solución permite la variación en la visibilidad de las características durante la ejecución de la tarea de control frente a las soluciones propuestas hasta la fecha que se basaban en evitar a toda costa la pérdida de visibilidad de las características durante el control. Teniendo presente este concepto se han definido y desarrollado las bases teóricas de una aproximación al control visual estable y continua que permitiera la presencia temporal de características en la imagen. Se ha reformulado, utilizando las bases teóricas desarrolladas, la aproximación al control visual en el espacio invariante respecto a los parámetros intrínsecos de la cámara para adaptarlo a la variabilidad en la visibilidad de las características durante el control. Por último, se ha extendido este concepto de una forma totalmente novedosa al control visual continuo de la navegación de un robot móvil.
  • MODELADO DE SISTEMAS PARA VISIÓN REALISTA EN CONDICIONES ADVERSAS Y ESCENAS SIN ESTRUCTURA .
    Autor: FUSTER GUILLÓ ANDRÉS.
    Año: 2002.
    Universidad: ALICANTE.
    Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR.
    Centro de realización: ESCUELA POLITÉCNICA SUPERIOR.
    Resumen: Los problemas de visión artificial relacionados con la operatividad de entornos reales, donde las condiciones de percepción pueden ser adversas, constituyen una de las líneas de investigación que más esta interesando recientemente, toda vez que otros aspectos de la visión más inmediatos y más fáciles de abordar van encontrando soluciones aceptables. Uno de los principales objetivos que se ha perseguido es proporcionar soluciones que puedan aplicarse en diferentes situaciones: segmentar imágenes aunque la luz ambiente sea muy débil y los objetos aparezcan en penumbra; así como en el caso de deslumbramiento; también cuando la profundidad de campo sea elevada y objetos iguales sean vistos con tamaños desiguales; etc. El objetivo de obtener solución generalista tiene como primera consecuencia que la formulación que se presenta del problema es abierta, en términos de expresar la imagen como el resultado de la contribución de los motivos de la escena, de las condiciones del entorno y de las características de la cámara. La formulación es independiente de los parámetros que traten; o lo qu es lo mismo, válida cualesquiera que sean las características particulares de cada variable. La solución se plantea en términos de estimar el desafino que separa al punto de trabajo que establece el entorno respecto de la sintonización derivada del calibrado de la cámara. A partir de la imagen percibida en condiciones desfavorables, basándose en el desafino estimado, se estable un transformación de la imagen mediante un proceso de normalización. En este sentido se proponen transformaciones en diferentes niveles de los sistemas de visión. Una transformación de síntesis de imagen normalizada en el nivel bajo y transformaciones de nivel medio de etiquetado de motivos con independencia de las condiciones de percepción y de etiquetado de desafino para la estimación de las condiciones del entorno. Estas transformaciones utilizan bases de datos que contienen diferentes motivos percebidos en diferentes condiciones del entorno. Las bases de datos han sido construidas con caracterizadores no específicos proporcionando la generalidad buscada en la solución. Se propone un esquema de utilización de información de contexto para atenuar la complejidad de las consultas a las bases de datos. A fin de poner de relieve la generalidad del modelo, su corrección y la viabilidad desde el punto de vista de la implantación práctica, se diferencian dos líneas de experimentación: La aplicación en el estudio aislado de parámetros, concretamente escala e iluminación, que ha permitido el análisis de amplios rangos de variación incluidas las situaciones extremas. En aras de la viabilidad práctica, también se consideran conjuntamente varios parámetros, permitiendo la representación de situaciones más próximas a la realidad. El estudio de los casos reales aporta ejemplos de aplicación tanto en exteriores como en interiores. El modelo se ha concretado en una arquitectura a nivel de implementación hardware mediante una propuesta segmentada para el tratamiento del caso en que las condiciones de iluminación son adversas. Los resultados del prototipo basado en hardware reconfigurable dan una medida de las posibilidades de implementación a bajo nivel además del interés de tratar diferentes problemas mediante reconfiguraciones del hardware.
  • MÉTODOS VISUALES DE RECONSTRUCCIÓN 3D EN ROBOTS MÓVILES .
    Autor: VICENTO CRESPO JOSÉ.
    Año: 2002.
    Universidad: POLITECNICA DE MADRID.
    Centro de lectura: INGENIEROS DE TELECOMUNICACIÓN.
    Centro de realización: ESCUELA TÉCNICA SUPERIOR DE INGENIEROS DE TELECOMUNICACIÓN.
    Resumen: En eta tesis se proponen un modelo de integración percepción-acción en robots móviles basado en una representación dinámica del espacio tridimensional. El objetivo que se pretende es conseguir una realimentación continua entre el entorno y el robot cuyo efecto sea la generación y actualización de un modelo interno espacial del mundo. Para ello, se ha desarrollado un sistema software orientado al tiempo real capaz de construir incrementalmente una representación del espacio a partir de información visual obtenida desde una torreta estereoscópica. Junto a este sistema se ha construido íntegramente un robot móvil dotado de una torreta de visión esteroescópica y que incorpora los elementos de proceso, alimetnación y control a bordo. Los algoritmos desarrollados para la reconstrucción 3D parte de los principios de la geometría epipolar para obtener un conjunto inicial de correspondencias. A partir de estas medidas, se extrae información adicional utilizando criterios de planaridad en el espacio. Finalmente, se utiliza la ecuación de difusión del calor para interpolar incrementalmente el resto del espacio no medido. En cualquier punto del proceso es posible calcular el error de reproyección existente en el modelo 3D interno y utilizarlo para generar movimientos de reorientación de las cámaras y del robot. Con estos movimientos se accede a nuevas regiones del entorno que aportan información complementaria y contribuyen a mejorar la representación. La información espacial y de luminosidad se integran en el tiempo sobre una geometría esférica de representación centrada en el robot. Este sistema funciona como una memoria predictiva directamente acoplada al sistema de control de movimientos. Los resultados obtenidos sobre el robot muestran la viabilidad de este enfoque y sugieren nuevas investigaciones dirigidas a conseguir un mayor nivel de autonomía y fiabilidad en la navegación visual de robots móviles.
  • APLICACIÓN DE LA VISIÓN ARTIFICIAL A LA CUANTIFICACIÓN DE LA CALIDAD SUPERFICIAL DEL ALAMBRÓN DE COBRE .
    Autor: MADRID CUEVAS FRANCISCO JOSÉ.
    Año: 2002.
    Universidad: POLITECNICA DE MADRID.
    Centro de lectura: INFORMÁTICA.
    Centro de realización: FACULTAD DE INFORMÁTICA.
    Resumen: El objetivo de esta tesis es la construcción de un Sistema de Inspección Visual Automatizado (SIVA) para la cuantificación de la calidad superficial del alambrón de cobre. La tesis aborda el estudio, diseño, y desarrollo de las fases de adquisición y segmentación del citado SIVA. Durante el proceso de fabricación del alambrón de cobre se pueden producir una serie de defectos que influirán directamente en su calidad. Actualmente el control de la calidad se realiza mediante operarios que inspeccionan muestras del alambrón asignándoles una calidad que determina el coste del producto, así como sus posibles usos futuros. En este proceso manual se ha constatado una componente de subjetividad importante en la determinación de los defectos así como de la posterior clasificación de calidad. A partir de las características del material a inspeccionar así como las muestras obtenidas, se ha desarrollado un sistema de adquisición (sensor, lente, iluminación y hardware de digitalización) y se han desarrollado dos técnicas para tratar el problema de los reflejos especulares inherentes a las superficies metálicas. Para la fase global de segmentación se han estudiado dos alternativas: umbralización global y adaptativa y el análisis estadístico de texturas. Para evaluar los resultados de las estas técnicas se ha utilizado una metodología basada en la medida empírica de discrepancia. Se han estudiado distintas medidas empíricas de discrepancia, encontrándose que la medida de Baddeley es superior al resto. Se ha desarrollado una técnica de segmentación no supervisada de texturas que ha mostrado ser superior, en los experimentos realizados, a la mejor de la técnicas de umbralización estudiadas.
  • SISTEMA DE RECONOCIMIENTO VISUAL DE OBJETOS ORIENTADO A LA NAVEGACIÓN TOPOLÓGICA DE ROBOTS MÓVILES AUTÓNOMOS .
    Autor: MATA ORTEGA MARIO.
    Año: 2002.
    Universidad: CARLOS III DE MADRID.
    Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR.
    Centro de realización: UNIVERSIDAD CARLOS III DE MADRID.
    Resumen: En la presente tesis se ha desarrollado un sistema de percepción basado en visión por computador, para la detección robusta de marcas del entorno utilizadas en navegación topológica de robots móviles autónomos. La principal característica del sistema es su capacidad para aprender de forma autónoma cualquier objeto 2D (o una cara de un objeto 3D) que se desee utilizar como marcar, a partir de imágenes de entrenamiento; la intervención de un humano se limita a recuadrar en ellas las apariencias de la marca que se desea aprender. Además, el sistema incluye la capacidad de reconocer el contenido simbólico de las marcas (texto o iconos), si lo hay, utilizando un OCR. El funcionamiento se estructura en tres etapas. En la primera etapa, se centra la atención del sistema sobre zonas de la imagen que potencialmente puedan corresponder a la marca buscada mediante un análisis del color (con los parámetros aprendidos para cada marca). En la segunda etapa, se trata de confirmar o recharzar estas hipótesis de presencia de la marca; para ello, se utilizan modelos deformables que tratan de adaptarse a su posible aspecto (posición, tamaño y deformaciones perspectivas). La similitud entre un modelo deformado y la zona de la imagen a estudiar se convierte a una función de coste, que se optimiza empleando un algortimo genético (AG). Cada individuo del AG presenta un modelo deformado; la evolución del algortimo explora las zonas de interés, y también el resto de laimagen, si se desea. Sin ninguna de las zonas de interés se confirma como la marca buscada, el proceso acaba. Si se ha confirmado la detección de una (o varias) marcas, se pasa a la tercera etapa, para la interpretación de la información. Los parámetros geométricos de las marcas encontradas se extraen directamente de los modelos deformados que se ajustan en ellas. Si se desea leer contenido simbólico, el interior de las marcas se pasa a un sistema OCR basado en redes neuronales que automáticamente segmenta y trata de reconocer cada símbolo contenido. Para permitir una aplicación práctica y flible y una intergración eficaz, el sistema se ha encapsulado como un objeto CORBA asíncrono distribuido. De este modo, el sistema puede ser utilizado por la arquitectura de control empleada en los robots móviles del Departamento, así como por cualquier otro cliente que conozca la interfaz del objeto y requiera sus servicios.
  • IMAGE SEGMENTATION INTEGRATING COLOUR, TEXTURE AND BOUNDARY INFORMATION .
    Autor: MUÑOZ PUJOL XAVIER.
    Año: 2002.
    Universidad: GIRONA.
    Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR.
    Centro de realización: ESCUELA POLITÉCNICA SUPERIOR.
    Resumen: La tesis se centra en la Visión por Computador y, más concretamente, en la segmentación de imágenes, la cual es una de las etapas básicas en el análisis de imágenes y consiste en la división de la imagen en un conjunto de regiones visualmente distintas y uniformes considerando su intensidad, color o textura. Se propone una estrategia basada en el uso complementario de la información de región y de frontera durante el proceso de segmentación, integración que permite paliar algunos de los problemas básicos de la segmentación tradicional. La información de frontera permite inicialmente identificar el número de regiones presentes en la imagen y colocar en el interior de cada una de ellas una semilla, con el objetivo de modelar estadísticamente las características de las regiones y definir de esta forma la información de región. Esta información, conjuntamente con la información de frontera, es utilizada en la definición de una función de energía que expresa las propiedades requeridas a la segmentación deseada: uniformidad en el interior de las regiones y contraste con las regiones vecinas en los límites. Un conjunto de regiones activas inician entonces su crecimiento, compitiendo por los píxeles de la imagen, con el objetivo de optimizar la función de energía o, en otras palabras, encontrar la segmentación que mejor se adecua a los requerimientos expresados en dicha función. Finalmente, todo este proceso ha sido considerado en una estructura piramidal, lo que nos permite refinar progresivamente el resultado de la segmentación y mejorar su coste computacional. La estrategia ha sido extendida al problema de segmentación de texturas, lo que implica algunas consideración básicas como el modelaje de las regiones a partir de un conjunto de características de textura y la extracción de la información de frontera cuando la textura es presente en la imagen. Finalmente, se ha llevado a cabo la extensión a la segmentación de imágenes teniendo en cuenta las propiedades de color y textura. En este sentido, el uso conjunto de técnicas no-paramétricas de estimación de la función de densidad para la descripción del color, y de características texturales basadas en la matriz de co-ocurrencia, ha sido propuesto para modelar adecuadamente y de forma completa las regiones de la imagen. La propuesta ha sido evaluada de forma objetiva y comparada con distintas técnicas de integración utilizando imágenes sintéticas. Además, se han incluido experimentos con imágenes reales con resultados muy positivos.
  • SISTEMA BINOCULAR DE VISION ACTICA PARA LA LOCALIZACION DE OBJETOS SOBRE ENTORNOS PARCIALMENTE DESCONOCIDOS .
    Autor: SANCHEZ SALMERON ANTONIO J..
    Año: 2001.
    Universidad: POLITECNICA DE VALENCIA.
    Resumen: El objetivo global de esta tesis es diseñar un sistema de vision flexible para dotar a un robot tanto de la capacidad de auto-localizacion como de la capacidad de localizacion de objetos de interes, de forma que pueda actuar "inteligentemente" en un entorno poco estructurado. Para avanzar en este sentido , esta Tesis Doctoral presenta un trabajo encaminado en tres direcciones: -diseñar y desarrollar una plataforma hardware/software abierta sobre la que se puedan desarrollar y verificar diferentes estrategias de vision activa con prestaciones adecuadas para diferentes problemas y aplicaciones. -Aportar nuevos metodos y algoritmos para resolver el problema de localizacion visual que resulten eficientes y robustos para cada caso. -analizar la influencia de las incertidumbres en la fusion de informacion visual redundante para la reconstruccion 3D. Con respecto al primer punto, se ha diseñado un sistema binocular de vision activa denominado sivis. Este sistema de vision, en comparacion con los existentes actualmente amplia el campo de posibles aplicaciones al permitir el control de la linea base entre camaras, lo que permite trabajar con precisiones elevadas en un rango de distacias amplio. Sivis es un sistema adaptable porque dispone de una arquitectura software modular que permite planificar de una forma flexible los comportamientos motores y visuales del sistema. Ademas, lo que se considera mas importante en este sistema es que se ofrece un nexo de cooperacion entre el paradigma de vision de Marr y el paradigma de vision cualitativa. En el caso de trabajar sobre un entorno parcialmente desconocido, se puede aprovehar la informacion disponible para dotar a la localizacion de mayor eficiencia y robustez. En la tesis se presenta y se aplica una tecnica de localizacion visual robusta y eficiente denominada Transformada de Hough de N-puntos, que es una generalizacion de la conocida Transformada de Hough, donde se minimizan los costes temporales de la fase de acumulacion. Finalmente, para poder obtener algoritmos robustos, en el caso de trabajar sobre entornos totalmente desconocidos, se deben relajar las restricciones temporales. En estos casos, la robustez puede obtenerse a partir de la fusion de informacion redundante. En este sentido, para permitir una reconstruccion 3D robusta se aporta y aplica el calculo de la incertidumbre para las tecnicas monoculares y binoculares mas utilizadas en los sistemas binoculares de vision activa. Ademas se han diseñado y aplicado tecnicas de tratamiento de imagen que filtran los ruidos producidos por las sombras y los reflejos de las imagenes adquiridas en los entornos de iluminacion natural. A lo largo del trabajo de desarrollo realizado en esta Tesis Doctoral, estas aportaciones se han aplicado en diferentes proyectos de investigacion a casos practicos en entornos controlados (laboratorios), semi-controlados (industriales) y abiertos (maritimo y agricola).
  • A PROPOSAL TO ESTIMATE THE MOTION OF AN UNDERWATER VEHICLE THROUGH VISUAL MOSAICKING .
    Autor: GARCÍA CAMPOS RAFAEL.
    Año: 2001.
    Universidad: GIRONA.
    Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR.
    Centro de realización: ESCUELA POLITÉCNICA SUPERIOR.
    Resumen: Esta tesis propone una solución al problema de estimar el movimiento de un vehículo submarino no tripulado (UUV) a partir de la utilización de la visión por computador. Mediante este sistema, cuando el vehículo se halla cerca del fondo marino va construyendo un mapa de la zona en que está realizando la misión, la mismo tiempo que se localiza sobre dicho mapa ("Concurente Mapping and Localization"). Para conseguir este objetivo se propone un algoritmo de construcción de mosaicos visuales basado en la detección de características en una imagen y sus correspondencias en la siguiente imagen de la secuencia. El problema de las correspondencia se soluciona mediante una metodología mixta de correlación en nivel de fris y el análisis exhaustivo de las componentes textuales de la imagen. Una vez se han establecido las correspondencias entre imágenes sucesivas se elimina aquellas que describan movimientos que no se correspondan con el movimiento dominante en la imagen. A continuación se determina una transformación plana (o homografía) que describe el movimiento aparente de la imagen. Finalmente se fusiona la imagen procesada con las imágenes anteriores dando lugar a la creación de un mosaico. A partir de este mosaico se estima el movimiento del robot. Como la eventual trayectoria del robot intersecta sobre ella misma, un Filtro de Kalman de Estado Aumentado ASKF fusiona toda la información disponible proporcionando no sólo una estimación de la posición del robot sinó también de la trayectoria descrita por el mimso. Los resultados experimentales muestran funcionamiento del sistema tanto en un entorno de laboratorio como en mar abierto mediante la teleoperación del robot submarino URIS.
  • ARQUITECTURA NEURONAL DE INSPIRACION BIOLOGICA PARA LA INTEGRACION TACTL EN SISTEMAS VISUOMOTORES .
    Autor: PEDREÑO MOLINA JUAN LUIS.
    Año: 2001.
    Universidad: POLITECNICA DE CARTAGENA.
    Centro de lectura: INGENIEROS DE TELECOMUNICACION.
    Centro de realización: ETSI TELECOMUNICACION.
    Resumen: DISEÑO E IMPLEMENTACION DE UN SISTEMA CONTROL INTEGRADO QUE, BASADO EN TECNICAS NEURONALES, PERMITA ENVIAR EL COMPORTAMIENTO BIOLOGICO DE UN SISTEMA ROBOT ANTROPOMORFICO. DE ESTA FORMA SE CONSIGUE LA ADAPTACION DE LAS TEORIAS NEURONALES APLICADAS A ROBOTICA EN SISTEMAS QUE PRECISAN DE UN APRENDIZAJE CONTINUO DE LOS ESTIMULOS VISUALES Y -----. LA APLICACIÓN DE LOS MODELOS DE TRATAMIENTO DE LA INFORMACION RESUELVE EL PROBLEMA DE LA REBUNDANCIA Y ACOMODACION EN PROCESOS INTEGRADA DE ALCANCE AGARRE Y MANIPULACION.
  • DISEÑO DE CHIPS PROGRAMABLES DE SEÑAL MIXTA CON BAJO CONSUMO DE POTENCIA PARA SISTEMAS DE VISIÓN EN TIEMPO REAL .
    Autor: LIÑÁN CEMBRANO GUSTAVO.
    Año: 2001.
    Universidad: SEVILLA.
    Centro de lectura: FÍSICA .
    Centro de realización: FACULTAD DE FÍSICA.
    Resumen: Esta Tesis presenta distitnas contribuciones relacionadas con el diseño de chips de señal-mixta programables, reconfigurables y flexibles para procesar imágenes en el plano focal. Estos chips están concebidos para lo que se conoce como tratamiento de imágenes a bajo nivel, llamado también "early-visión", tratamiento que es parte muy importante en el proceso de interpretación de la información visual puesto que permite reducir enormemente la cantidad de información a transmitir a las estapas posteriores del flujo de procesamiento, etapas encargadas de la interpretación de la señal visual. Las principales características novedosas de los chips desarrollados en esta Tesis radican en cuatro puntos: primero en el uso de circuitos analógicos altamente optimizados para las tareas de procesamiento en sí, lo que permite conseguir densidades de integración (y por tanto resoluciones espaciales) altas, y velocidades de operación muy altas en relación con la potencia eléctrica consumida; segundo, en el uso de interfaces de control y de entrada/salida de datos totalmente digitales, lo que hace posible la interconexión de estos chips dentro de sistemas completos de percepción-actuación que incluyan procesadores digitales; tercero, en la integración conjunta, sobre el mismo substrato semiconductor, de los planos sensor y procesador; cuarto, en la incorporación de estructuras de programación y reconfiguración optimizadas que confieren a los circuitos diseñados las características propias de un microprocesador visual.
  • MODELOS DE PERCEPCIÓN VISUAL BASADOS EN LA ORIENTACIÓN DE CONTORNOS .
    Autor: ALEMÁN FLORES MIGUEL.
    Año: 2001.
    Universidad: LAS PALMAS DE GRAN CANARIA.
    Centro de lectura: INFORMÁTICA.
    Centro de realización: FACULTAD DE INFORMÁTICA.
    Resumen: En esta tesis proponemos un nuevo marco para el procesamiento de la información visual en varios canales que están especializados en diferentes aspectos, tales como la forma, el movimiento, la textura y el color, pero que mantienen unos ciertos elementos de cohesión y hacen uso del mismo tipo de herramientas básicas. La identificación de un objeto está proporcionada, en la mayoría de los casos, por una descripción de su forma, lo cual requiere una localización y caracterización precisa de sus bordes. Además, es importante que cambios en la orientación, el tamaño o el contraste entre el objeto y el fondo no alteren la salida del mecanismo usado para el reconocimiento. Hemos introducido un nuevo conjunto de herramientas formales, basadas en los filtros de Newton, que permiten estimar la orientación de los bordes y cuya salida no varía cuando cierto tipo de transformaciones se produce en la señal de entrada. La interpolación de los valores proporcionados por estos filtros no permite estimar de forma precisa la orientación de los contornos. Hemos combinado esta información para extraer funciones de orientación que describen la forma de los objetos y permiten comparar diferente imágenes o analizar el movimiento de un objeto. Del mismo modo, la textura de una región es caracterizada mediante un histograma de orientación, con el cual es posible compararla con otras texturas. Mediante un posterior análisis de las funciones e hitogramas de orientación a partir de sus coeficientes de Fourier, la introducción de funciones de peso en la minimización de las energías que miden las diferencias entre las distintas formas y texturas, y el uso de un análisis multiescala para el estudio de las últimas, hemos realizado caracterizaciones y clasificaciones con resultados numéricos muy satisfactorios.
  • EXTENSIÓN DE TÉCNICAS DE PLANIFICACIÓN ESPACIO-TEMPORAL A SISTEMAS DE VISIÓN POR COMPUTADOR .
    Autor: CANDELAS HERÍAS FRANCISCO ANDRÉS.
    Año: 2001.
    Universidad: ALICANTE.
    Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR .
    Centro de realización: ESCUELA POLITÉCNICA SUPERIOR.
    Resumen: La motivación fundamental de las investigaciones de esta tesis ha sido la carencia que existen en el estado del arte de técnicas de asignación y planificación de tareas específicas para sistemas de visión por computador, que tengan en cuenta las diferentes particularidades de estos sistemas. Estas son principalmente las relaciones de precedencia y exclusión entre tareas y la existencia de procesadores con funcionalidad diferente. Así, se han desarrollado un conjunto de nuevas técnicas de asignación y planificación estática que tienen en cuenta las características de las aplicaciones de visión por computador en general, y que están destinadas a las etapas de investigación y desarrollo de esas aplicaciones. Las técnicas más básicas realizan la planificación temporal o la asignación espacial de forma independiente. Estás consideran también la posibilidad de interrupción de tareas para mejorar el resultado. A partir de estas se han desarrollado varios algoritmos que realizan la asignación y la planificación de forma conjunta. Las versiones más sofisticadas consideran además los costes de interrupción o comunicación. Además de implementar las técnicas propuestas, se han creado un conjunto de herramientas que permite, no solo la especificación gráfica de alto nivel de algoritmos de visión por computador y su simulación, sino también generar el grafo de tareas elementales y realizar la planificación estática de esos algoritmos. Finalmente las técnicas diseñadas han sido evaluadas con una aplicación real de visión por computador: un algoritmo de correspondencia de imágenes esteresocópicas.
67 tesis en 4 páginas: 1 | 2 | 3 | 4
Búsqueda personalizada
Manuales | Tesis: Ordenadores, Circuitos integrados...
english
Cibernetia