Cibernetia > Tesis doctorales
Google
Web www.cibernetia.com

Índice > MATEMATICAS > CIENCIA DE LOS ORDENADORES >

INTELIGENCIA ARTIFICIAL, 4



398 tesis en 20 páginas: 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20
  • CONSECUENCIAS COMPUTACIONALES DE LA DEPRESIÓN SINÁPTICA DE CORTA DURACIÓN .
    Autor: ROCHA VÁZQUEZ JAIME DE LA.
    Año: 2002.
    Universidad: AUTONOMA DE MADRID.
    Centro de lectura: CIENCIAS.
    Centro de realización: DEPARTAMENTO DE FÍSICA TEÓRICA, FACULTAD DE CIENCIAS.
    Resumen: La tesis presenta un estudio teórico sobre las implicaciones computacionales de la depresión sináptica de corta-duración (STD). Se propone un modelo de terminal presináptica que recoge varias características biofísicas de las sinapsis corticales: en primer lugar la liberación de neurotransmisor es estocástica es decir esta parametrizada con una probabilidad distinta de uno. En segundo lugar, la terminal contiene un conjunto de vesículas sinápitcas listas para ser liberadas, cuyo agotamiento provoca la disminución en la probabilidad de fusión. Esto produce el efecto conocido como short-term depression. Además las conexiones entre neuronas están modeladas por un número arbitrario de contactos. En la primera mitad de la tesis se realiza un cálculo teórico sobre la información transmitida entre un tres de espigas y el tren de respuestas sinápticas generado por un único contacto sináptico. La información en la señal de entrada se codifica en la frecuencia de disparo pre-sináptica, mientras que la en la salida es tanto la frecuencia de respuesta como el tiempo entre dos respuestas. El resultado fundamental viene a ser que unicamente cuando el tren de espigas de entrada es correlacionado, la depresión sináptica aumenta la información transmitida. Además, si la sinpasis es depresiva, la probabilidad de liberación de neurotransmisor óptima es menor que uno, es decir, la estocasticidad de la transmisión es beneficiosa. En la segunda parte de la tesis se estudia la respuesta de una neurona de integración y disparo cuando es estimulada con un número de neuronas pre-sinapticas grande, y donde cada una establece M contactos con la neurona de salida. Además se analiza el efecto de que los trenes en el input estén correlacionados. El resultado fundamental es que la frecuencia de salida de la neurona de integración y disparo muestra un comportamiento no monótono en función de la frecuencia de entrada.
  • INFORMATION PROCESSING IN NEURAL SYSTEMS: OSCILLATIONS, NETWORK TOPOLOGIES AND OPTIMAL REPRESENTATIONS .
    Autor: LAGO FERNÁNDEZ LUIS FERNANDO.
    Año: 2002.
    Universidad: AUTONOMA DE MADRID.
    Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR.
    Centro de realización: ESCUELA POLITÉCNICA SUPERIOR.
    Resumen: Se investigan distintos temas relacionados con el procesamiento de la aximizació en sistemas aximizaci. La primera parte de la tesis estudia las arquitecturas que favorecen la rápida aximizac de una red neuronal. Se estudian distintos tipos de arquitecturas que varían entre el orden y el desorden, haciendo especial hincapié en las arquitecturas de tipo "small-world". Se consideran dos modelos azimizaci distintos, cada uno de ellos característico de un tipo de aximización neuronal. Las aximizació de respuesta de la red para cada uno de estos modelos son estudiadas en relación a la arquitectura. Los resultados demuestran que, en muchos casos, arquitecturas situadas entre el orden y el desorden proporcionan las mejores soluciones desde el punto de vista de las aximización y la aximizac de respuesta. La segunda parte estudia los mecanismos que producen aximización y sincronización entre las neuronas, y propone aximización a los problemas de "binding", rivalidad binocular y aximización de aximiza. El problema del "binding" está relacionado con la aximizaci de las distintas características de un objeto que se procesan de forma simultánea a través de distintos canales. Las soluciones exploradas están basadas en la aximizac de la aximizació temporal. Como aximizaci para´ctica de la sincronización, se introduce una red neuronal que segmenta aximiza binarias. Está compuesta por un conjunto de osciladores acoplados por impulsos, con conexiones locales excitadoras e aximizaci global. En respuesta a una imagen binaria, los osciladores que responden a cada una de las componentes conexas en la imagen se sincronizan entre sí. Finalmente, la última parte de la tesis está dedicada al estudio del desarrollo de aximización internas que permiten una codificación óptima del espacio de entrada. Dicha aximización óptima significa (i) conservar toda la aximizació que es relevante, y (ii) expresarla de una forma más conveniente que facilite el aximiza en subsiguientes etapas del procesamiento. Aximización el estudio a espacios de entrada discretos y factoriales, se introduce una nueva medida de la "calidad" de un código, cuya aximización da lugar a una codificación óptima en ausencia de ruido.
  • MODELADO E IMPLEMENTACIÓN DE UN SISTEMA HÍBRIDO DE AYUDA AL DIAGNÓSTICO DE GLAUCOMA .
    Autor: CARMONA SUÁREZ ENRIQUE J..
    Año: 2002.
    Universidad: NACIONAL DE EDUCACION A DISTANCIA.
    Centro de lectura: CIENCIAS .
    Centro de realización: FACULTAD DE CIENCIAS.
    Resumen: A pesar de que hasta la fecha existen diversas aproximaciones al diagnóstico de glaucoma, casi todas ellas están basadas únicamente en la interpretación de los resultados de algunas de sus pruebas clínicas asociadas más significativas. Dada la importancia que supone, en la práctica médica diagnóstica, la valoración de toda la información clínica de un paciente en su conjunto, parece adecuado, la creación de un sistema que tenga en cuenta toda aquella información relacionada con la enfermedad y con el paciente (conocimiento del dominio), así como, aquella otra relacionada con la forma de proceder del médico en su labor diagnóstica (conocimiento de tarea). En este sentido, se plantea la creación de un modelo de conocimiento que permita hacer computable la forma de proceder del médico y que, en última instancia, facilite la construcción de un sistema basado en conocimiento (SBC) en cuya estructura se preserve la de dicho modelo. Por tanto, el propósito del trabajo escrito en esta memoria se puede ver desde dos puntos de vista. Desde un punto de vista global, estableciendo como objetivo al contribuir a la metodología para el desarrollo de SBC's mediante la adaptación de las metodologías actuales en la perspectiva del reuso de componentes de modelado, tales como CommonKADS, PROTÉGÉ, etc., al campo de la arquitecturas híbridas donde se integran inferencias simbólicas y conexionistas y, desde un punto de vista más particular, ilustrando la aplicación de los nuevos aspectos metodológicos propuestos al desarrollo de un sistema de ayuda al diagnóstico de glaucoma mediante la pormenorización de todas las fases implicadas en este desarrollo de un SBC: modelado conceptual, operacionalización, implementación, validación y evaluación.
  • INTERPRETACIÓN DE IMÁGENES BASADA EN MODELOS DE CONOCIMIENTO: APLICACIÓN A LA IDENTIFICACIÓN DE LA CABEZA DEL NERVIO ÓPTICO EN DIAGEN .
    Autor: RINCÓN ZAMORANO MARIANO.
    Año: 2002.
    Universidad: NACIONAL DE EDUCACION A DISTANCIA.
    Centro de lectura: CIENCIAS.
    Centro de realización: FACULTAD DE CIENCIAS UNED.
    Resumen: El objetivo de la interpretación de imágenes es obtener una descripción de la imagen con un nivel de abstracción adecuado para cualquier tarea que lo solicite (diagnóstico, monitorización, etc.). Se ha reconocido la necesdidad de utilizar conocimiento del dominio en este proceso de interpretación, pero hasta la fecha, y debido a la gran carga computacional del problema, los sistemas han sido definidos directamente en el nivel de implementación, no en el nivel del conocimiento. En las últimas décadas se ha demostrado la utilidad de descomponer un problema en tareas genéricas en el nivel del comportamiento. La principal ventaja es que ha permitido entender el problema de la ingeniería del conocimiento como una actividad de modelado, en la que existe una estructura inicial, propia de la tarea, que hay que enganchar con el conocimiento propio del dominio de aplicación mediante la asignación de ese conocimiento a papeles propios de la tarea. De este modo queda explícito cuál es el uso del conocimiento del dominio en la tarea, lo que facilita y guía el diálogo con el experto del dominio durante la fase de adquisición de su conocimiento y, posteriormente, facilita el mantenimiento del sistema. Esta tesis analiza el problema de la interpretación de imágenes como una tarea de diseño. Más concretamente, de diseño rutinario, dado que, en principio, se conocen todos los componentes que podemos utilizar para construir la solución. Y propone un método genérico y reutilizable para su solución. El cual, para confirmar su utilidad, se aplica al caso particular de la interpretación de imágenes médicas de fondo de ojo. El objetivo es identificar la cabeza del nervio óptico para, en una fase posterior, obtener los hallazgos de interés para la tarea de diagnóstico, la cual ha sido objeto de estudio en el proyecto DIAGEN.
  • REDES BAYESIANAS TEMPORALES: APLICACIONES MÉDICAS E INDUSTRIALES .
    Autor: FERNÁNDEZ GALÁN SEVERINO.
    Año: 2002.
    Universidad: NACIONAL DE EDUCACION A DISTANCIA.
    Centro de lectura: CIENCIAS.
    Centro de realización: FACULTAD DE CIENCIAS DE LA SALUD.
    Resumen: El objetivo principal de la presente tesis doctoral es el desarrollo de un sistema que modele la evolución de la extensión de un cáncer de nasofaringe. Este sistema sirve de ayuda a los oncólogos de una unidad de oncología radioterápica en la determinación del desarrollo alcanzado por este tipo de cáncer en un paciente antes de aplicar la terapia adecuada. En la parte I de la memoria presentamos el marco conceptual de modelado de conocimiento en que hemos realizado nuestro trabajo. Debido a la naturaleza de los procesos que tiene lugar en el dominio médico del que nos ocupamos, decidimos basarnos en el uso de redes bayesianas con representación explícita del tiempo para la definición de nuestro modelo de crecimiento cancerígeno. En la parte II, primeramente revisamos los diferentes tipos existentes de redes bayesianas para razonamiento temporal y analizamos las ventajas e inconvencientes de cada uno. Más adelante formalizamos un nuevo método que denominamos "red de eventos probabilistas en tiempo discreto", el cual resulta adecuado para el modelado de los mecanismos causales de carácter incierto a los que se ven sujetos un conjunto de eventos temporales. Como principal aportación del nuevo método, destacamos el uso de diferentes modelos temporales de interacción causal para cada familia de nodos de la red. Estos modelos representan una adaptación para procesos temporales de los modelos canónicos probabilistas tradicionales; por esta razón decidimos denominarlos "puertas probabilistas temporales". También incluimos la aplicación de un nuevo algoritmo que permite la factorización de las probabilidades condicionales correspondientes a familias de nodos que interactúan según un modelo de puerta probabilista temporal. En la parte III describimos NasoNet, un sistema que aplica al dominio de cáncer de nasofaringe el nuevo método para razonamiento temporal con redes bayesianas desarrollado en la parte II. Por otra parte, mostramos el carácter general de las redes de eventos probabilistas en tiempo discreto a través de su aplicación en un dominio industrial: el diagnóstico y predicción de fallos que ocurren en un generador de vapor de una central termoeléctrica. La memoria concluye con un resumen de las principales aportaciones realizadas y con una reseña del futuro previsible en nuestras líneas de investigación.
  • ESTRATIFICACIÓN DEL RIESGO EN LA CARDIOPATIA ISQUEMICA MEDIANTE ALGORITMOS DE INTELIGENCIA ARTIFICIAL .
    Autor: SEPÚLVEDA SANCHIS JOSE R..
    Año: 2002.
    Universidad: VALENCIA.
    Centro de lectura: FÍSICA .
    Centro de realización: FACULTAD DE CIENCIAS FÍSICAS.
    Resumen: El objetivo de esta tesis doctoral es crear un sistema automático de clasificación, que permita determinar el estado de un paciente después de un episodio de cardiopatía isquémica, mediante el análisis de sus características clínicas. Como métodos de clasificación se han empleado la regresión logística, los árboles de decisión y las redes neuronales artificiales. Los resultados obtenidos permiten clasificar a los pacientes reduciendo la población de alto riesgo al 50%.
  • ESPECIFICACIÓN Y VERIFICACIÓN DE PROGRAMAS MOLECULARES EN PVS .
    Autor: GRACIANI DÍAZ M. CARMEN.
    Año: 2002.
    Universidad: SEVILLA.
    Centro de lectura: INFORMÁTICA.
    Centro de realización: FACULTAD DE MATEMÁTICAS.
    Resumen: La Computación Molecular y, en concreto, la Computación con ADN, es una disciplina que se enmarca dentro del campo de investigación conocido como Computación Natural. Tiene como objetivo el desarrollo de modelos de computación inspirados en el comportamiento de las moléculas de ADN, y en las posibilidades que abren las técnicas de laboratorio para su manipulación. En la memoria se han estudiado distintas adaptaciones del marco formal en que se describen distintos modelos de computación con ADN al lenguaje de especificaciones de PVS, que es un sistema de verificación cuyo lenguaje está basado en la lógica clásica de segundo orden con un sistema de tipos acorde con la teoría de conjuntos de Zermelo-Fraenkel con el axioma de elección. El demostrador del sistema está basado en cálculos de secuentes combinando la interacción con el usuario y el automatismo. Como aportaciones originales señalar la descripción en PVS del modelo restringido de Adleman y el modelo sticker, y la representación y verificación en PVS de programas moleculares que resuelven problemas clásicos NP-completos. En una primera aproximación al modelo sticker se ha realizado una implementación de la metodología presentada por Fernando Sancho en su tesis doctoral para la verificación de programas en el citado modelo. Así mismo, la consideración de los programas en este modelo como meros programas imperativos ha llevado a la descripción de la lógica de primer orden para dos tipos (indpendiente de la del sistema) y del cálculo de Floyd-Hoare, desarrollando un conjunto de estrategias que permiten simi-automatizar el proceso de verificación de programas imperativos. El desarrollo del trabajo ha llevado también a la elaboración de un conjunto de teorías que permiten mejorar de forma natural y eficiente distintas estructuras de datos como son: multiconjuntos de elementos, conjuntos finitos de números naturales y aplicaciones sobre los mismos, entre otras.
  • ANÁLISIS SINTÁCTICO EFICIENTE DE GRAMÁTICAS DE ADJUNCIÓN E INSERCIÓN DE ÁRBOLES .
    Autor: CARRILLO MONTERO VICENTE.
    Año: 2002.
    Universidad: SEVILLA.
    Centro de lectura: INFORMÁTICA.
    Centro de realización: E.T.S. INGENIERÍA INFORMÁTICA.
    Resumen: Las gramáticas de adjunción de árboles TAG constituyen un formalismo muy adecuado para la descripción de lenguajes naturales. Sin embargo, presentan un alto coste computacional para su análisis sintáctico. En esta Tesis se presentan dos técnicas para mejorar el comportamiento de: estos analizadores. La primera basada en la aplicación de filtros Left corner a los analizadores tipo EARLE. Y la segunda en la fusión de analizaremos para TAG con otros de iguales estrategias para TIG (Tree Insertion Grammars). Todos los analizadores se describen con esquemas de análisis sintáctico y se establecen las relaciones formales existentes entre ellas.
  • COMPLEJIDAD Y UNIVERSALIDAD EN MODELOS DE COMPUTACIÓN CELULAR .
    Autor: ROMERO JIMÉNEZ ÁLVARO.
    Año: 2002.
    Universidad: SEVILLA.
    Centro de lectura: INFORMÁTICA.
    Centro de realización: FACULTAD DE MATEMÁTICAS.
    Resumen: La Computación Celular es una disciplina que se enmarca dentro del campo de investigación conocido como Computación Natural. Tiene como objetivo fundamental el desarrollo de modelos de computación inspirados en los procesos que tienen lugar en el interior de las células y que son susceptibles de ser interpretados como procedimientos de cálculo. En el presente proyecto se persiguen dos objetivos fundamentales: por un lado, se pretende establecer, y en su caso verificar, la completitud computacional de ciertas variante de sistemas P, usando herramientas distintas de las habituales; por otro lado, se pretende iniciar el desarrollo de una Teoría de la Complejidad para estos sistemas y estudiar la potencia computacional de diversas variantes. La demostración de la completitud computacional de los sistemas de computación celular suele realizarse vía los lenguajes formales. En este proyecto abordamos dicha cuestión intentando resolverla utilizando otros modelos universales, tales como las máquinas de Turing, las funciones recursivas y los conjuntos diofánticos, con la esperanza de que las técnicas de resolución de problemas desarrolladas para estos modelos se puedan de alguna manera adaptar a los sistemas P. Por otra parte, es necesario disponer de una Teoría de la Complejidad en modelos de computación celular que cuantifiquen de manera precisa la cantidad de recursos utilizados en la resolución de un determinado problema. Esto es en verdad así ya que las resoluciones en tiempo polinomial de probles "difíciles", usando estos sistemas, que se han presentado hasta el momento adolecen de cierto grado de informalidad.
  • ELECTRONIC INSTITUTIONS: FRONM ESPECIFICATION TO DEVELOPMENT .
    Autor: ESTEVA VIVANCO MARC.
    Año: 2002.
    Universidad: POLITECNICA DE CATALUÑA.
    Centro de realización: LLENGUATGES I SISTEMES INFORMÀTICS UNIVERSITAT POLITÈCNICA CATALUNYA.
  • AN ISLAND-DRIVEN PARSING SYSTEM .
    Autor: AGENO PÚLIDO ALICIA M..
    Año: 2002.
    Universidad: POLITECNICA DE CATALUÑA .
    Centro de realización: LLENGUATGES I SISTEMES INFORMÁTICS UNIVERSITAT POLITÉCNICA CATALUNYA.
  • KNOWLEDGE DISCOVERY IN REPEATED AND VERY SHORT SERIAL MEASURES WITH A BLOCKING FACTOR .
    Autor: RODAS OSOLLO JORGE ENRIQUE.
    Año: 2002.
    Universidad: POLITECNICA DE CATALUÑA.
    Centro de realización: LLENGUATGES I SISTEMES INFORMÀTICS UNIVERSITAT POLITÈCNICA CATALUNYA.
  • THE ROLE OF NORMS AND ELECTRONIC INSTITUTIONS IN MULTI-AGENT SYSTEMS APPLIED TO COMPLEX DOMAINS. THE HARMONIA FRAMEWORK .
    Autor: VÁZQUEZ SALCEDA JAVIER.
    Año: 2002.
    Universidad: POLITECNICA DE CATALUÑA.
    Centro de realización: LLENGUATGES I SISTEMES INFORMÁTICS UNIVERSITAT POLITÉCNICA CATALUNYA .
  • CLUSDM: A MULTIPLE CRITERIA DECISION MAKING METHOD FOR HETEROGENEOUS DATA SETS .
    Autor: VALLS MATEU AÏDA.
    Año: 2002.
    Universidad: POLITECNICA DE CATALUÑA.
    Centro de realización: LLENGUATGES I SISTEMES INFORMÀTICS UNIVERSITAT POLITÈCNIA CATALUNYA.
  • AN INFORMATION EXTRACTION SYSTEM PORTABLE TO NEW DOMAINS .
    Autor: TURMO BORRAS JORDI.
    Año: 2002.
    Universidad: POLITECNICA DE CATALUÑA.
    Centro de realización: LLENGUATGES I SISTEMES INFORMÀTICS UNIVERSITAT POLITÈCNICA CATALUNYA.
  • VISIÓN COMÚN DEL CAMPO DE BATALLA .
    Autor: GARCÍA JULIA IGNACIO.
    Año: 2002.
    Universidad: POLITECNICA DE MADRID .
    Centro de lectura: INGENIEROS DE TELECOMUNICACIÓN.
    Centro de realización: ESCUELA TÉCNICA SUPERIOR DE INGENIEROS DE TELECOMUNICACIÓN.
    Resumen: Uno de los problemas más acuciantes en el entorno clásico táctico de unidades terrestres, es el disponer en todo momento de una Visión Común del Campo de Batalla (COE, Common Operational Picture). Actualmente, todos los Ejércitos disponen de múltiples sensores que proporcionan información a los escalones superiores, pero esta información se ve afectada por parámetros difíciles de medir, como son la precisión de los sensores, el grado de adiestramiento del personal que los opera, las condiciones ambientales, la ortografía, el grado de profesionalización, e incluso la moral del operador. El efecto producido es que en los niveles superiores se reciben múltiples trazas que son muy difíciles de precisar y agrupar para obtener una imagen con el mayor grado de certidumbre posible de la realidad. En esta Tesis se propone una Metodología para la Fusión de Datos y una serie de técnicas basadas en Lógica Difusa para ayudar en la obtención de una imagen lo menos distorsionada posible de la situación que se está produciendo.
  • CONTRIBUCIÓN AL ESTUDIO Y CLASIFICACIÓN DE LAS FUNCIONES DE IMPLICACIÓN BORROSAS .
    Autor: CAMPO CAMPOS CRISTINA DEL.
    Año: 2002.
    Universidad: POLITECNICA DE MADRID.
    Centro de lectura: INFORMÁTICA.
    Centro de realización: FACULTAD DE INFORMÁTICA.
    Resumen: La tesis doctoral "contribución al estudio y clasificación de las funciones de implicación borrosas" constituye a la vez una revisión y un conjunto de aportaciones a la modelización de enunciados condicionales, o enunciados del tipo "Si P, entonces Q". Dentro del marco de la lógica borrosa; tradicionalmente, se considera que la mayor parte de las funciones de implicación, que modelizan los enunciados condicionales, deberían generalizar la implicaicón material booleana. En esta memoria se apoya el argumento de que la implicación booleana no es siempre el modelo más adecuado para la modelización de los enunciados condicionales, por lo que se definen y estudian clases o grupos de funciones de implicación que se adecuén a las necesidades de cada caso de aplicación. Así pues, tras un capítulo introductorio, en el capítulo 2 se plantean clases de funciones de implicación que sirvan de apoyo en la definición de aplicaciones de carácter borroso más allá de las funciones de implicaicón borrosas derivadas de la implicación material booleana. Asi se llega a conclusión de que son necesarios, por lo menos, cuatro clases de funciones de implicación de las que se estudian sus propiedades. En el tercer capítulo se aborda el estudio de la verificación tanto de la regla del Modus Ponens como de la regla del Modus Tolless por parte de las funciones de implicación pertenecientes a cada una de las clases planteadas. Por último, en el capítulo 4 se presenta un estudio de los operadores citados como implicaciones borrosas en la literatura bajo el enfoque presentado en esta memoria, ampliándose estudios realizados por otros autores.
  • MARCO METODOLÓGICO PARA LA CONSTRUCCIÓN DE SISTEMAS DE GENERACIÓN DE LENGUAJE NATURAL .
    Autor: BERNARDOS GALINDO M. SOCORRO.
    Año: 2002.
    Universidad: POLITECNICA DE MADRID.
    Centro de lectura: INFORMÁTICA .
    Centro de realización: FACULTAD DE INFORMÁTICA.
    Resumen: La Tesis tiene como objetivo elaborar un marco metodológico que sirva de guia en el desarrollo de un sistema de generación de lenguaje natural, para conseguir esto se proporciona: * Una revisión crítica de la GLN. Para ello se establecen definiciones de los diferentes conceptos, unificando visiones complementarias y relacionando los términos empleados por distintos investigadores. * Un conjunto de actividades que hay que realizar para construir un sistema de este tipo. Se toma como base el estándar IEEE 1074-1997 y se modifica para poder manejar las peculiaridades de la generación. * Una indicación de cómo llevar a cabo esas actividades, centrándose en aquellas que presentan diferencias con el estándar. Para algunas de ellas se presentan, además, métodos nuevos. * Una estrategia de construcción, que determina un cierto orden de ejecución entre las actividades. Todas estas aportaciones se validan mediante la realización de un sistema de consulta sobre plantas medicinales.
  • LA CADENA MEDIA Y SU APLICACIÓN EN RECONOCIMIENTO DE FORMAS .
    Autor: MARTÍNEZ HINAREJOS CARLOS DAVID.
    Año: 2002.
    Universidad: POLITECNICA DE VALENCIA.
    Centro de lectura: INFORMÁTICA.
    Centro de realización: FACULTAD DE INFORMÁTICA.
    Resumen: En el campo del Reconocimiento de Formas, las técnicas de clasificación basadas en distancia (y más especificamente el clasificador k-NN) necesitan de la obtención de prototipos adecaudos para cada clase. Una de las posibilidades es usar la media de la clase (o el conjunto formado por la media de las diversas subclases que componen la clase) como prototipo de la misma. Cuando se habla de espacios eculídeos (representación vectorial), hallar la media es un problema sencillo, pero no así si usamos la representación por cadenas. En dicho caso, el problema de hallar la cadena media es NP-Duro. Así, se pasan al definir aproximaciones sobre la cadena media para dichos usos. La aproximación clásica es la cadena mediana. Nuevas aproximaciones se proponen siguiendo diversos esquemas: en primer lugar, una aproximación voraz, que no resulta competitiva respecto a la cadena mediana. Posteriormente, se presentan dos aproximaciones basadas en perturbación iterativa que sí resultan competitivas a nivel de clasificación con respecto a la cadena mediana, a costa de un mayor coste computacional. Posteriormente, se tratan diversos aspectos interesantes sobre este tema. Se da una definición alterantiva de cadena media (que no otorga diferencias significativas con respecto a la definición clásica). Se introducen técnicas específicas de reducción de coste computacional en los algoritmos de perturbación iterativa (a costa de una cierta degradación en la calidad de los prototipos). Se realiza también el cálculo exacto de la cadena media mediante Ramificación y Poda, revelando los resultados. La buena calidad de las aproximaciones propuestas respecto a la solución exacta. Seguidamente, se aplican las aproximaciones a la realización de agrupamientos en las clases, mostrando un mejor comportamiento de las nuevas propuestas respecto al método usado habitualmente (k-medianas). Se hace una aplicación de las aproximaciones propuestas también para cadenas cíclicas, revelando resultados competitivos respecto al uso de la cadena mediana también en esta circunstancia. Por último, se realiza una comparativa entre los métodos paramétricos y los basados en distancias para este problema de clasificación, revelando un mejor comportamiento de los métodos no paramétricos a medida que aumenta el número de agrupamientos usado en cada clase.
  • TÉCNICAS PARA LA MEJORA DE LA CLASIFICACIÓN POR EL VECINO MAS CERCANO .
    Autor: PAREDES PALACIOS ROBERTO.
    Año: 2002.
    Universidad: POLITECNICA DE VALENCIA.
    Centro de lectura: INFORMÁTICA.
    Centro de realización: UNIVERSIDAD POLITECNICA DE VALENCIA.
    Resumen: En la tesis aquí presentada se aborda el problema de la mejora de la clasificación por el vecino más cercano. El comportamiento de esta técnica de clasificación presenta una serie de problemas, la mayoría de ellos relacionados con la función de distancia utilizada. Por ello esta tesis propone funciones de distancia alternativas a las ya conocidas. Estas medidas de distancia se basan en la ponderación, tanto de las características que definen los vectores de datos, como de los propios vectores. Estos pesos se aprenden a partir de los datos de aprendizaje disponibles. A diferencia de otras técnicas donde este aprendizaje no está explícitamente relacionado con el objetivo final (mejorar la tasa de acierto del clasificador), en el presente trabajo se propone un aprendizaje basado en la minimización de un índice estrechamente ligado con dicho objetivo. El índice propuesto a minimizar es una aproximación a la estimación mediante exclusión individual del error de clasificación. Las distancias que se proponen son las siguientes: distnacia Clase Ponderada L2, CPL2, distancia Local Ponderada L2, LPL2, distancia Prototipo Ponderada, DPP y distancia Clase Prototipo Ponderada L2, CPPL2. El coste computacional de los algoritmos de optimización correspondientes ha sido abordado. Se ha provisto de una técnica que reduce considerablemente este coste al utilizar subconjuntos reducidos del conjunto de aprendizaje original, pero sin apenas diferencia significativa en los resultados de clasificación. A partir de los pesos asignados a cada una de las características empleadas para representar los objetos a reconocer, se ha desarrollado una técnica de selección de características. Con el empleo de esta técnica se obtienen conjuntos reducidos de características que mejora claramente la tasa de acierto en tareas con características correladas o redundantes. También se ha obtenido una técnica de edición a partir de los pesos asignados a cada prototipo en la distancia DPP. El objetivo de las técnicas de edición es eliminar los prototipos de la zona de solapamiento de las clases para que el error de clasificación del vecino más cercano se aproxime a la tasa de error de Bayes. La técnica de edición presentada en esta tesis, a diferencia de técnicas de edición clásica, también consigue ciertos niveles de condensado, o lo que es lo mismo, de reducción de los datos de aprendizaje sin pérdida de eficacia reconocedora.
398 tesis en 20 páginas: 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20
Google
Web www.cibernetia.com
Manuales | Directorio | Tesis: Ordenadores, Circuitos integrados...
english
Cibernetia