Cibernetia > Tesis doctorales
Google
Web www.cibernetia.com

Índice > MATEMATICAS > ESTADISTICA >

ANALISIS MULTIVARIANTE, 2



122 tesis en 7 páginas: 1 | 2 | 3 | 4 | 5 | 6 | 7
  • DESARROLLO DE UN SISTEMA DE MINERIA DE DATOS BASADO EN LOS MÉTODOS BIPLOT .
    Autor: VAIRINHOS MARTINS VALTER.
    Año: 2002.
    Universidad: SALAMANCA.
    Centro de lectura: MATEMATICAS.
    Centro de realización: SALON DE GRADOS. EDIFICIO HISTORICO.
    Resumen: Se demuestra que es posible y deseable usar las representaciones biplot como núcleo de un sistema de minería de datos. Para probarlo, se construyó un prototipo de tal sistema - el programa BiplotsPMS-Biplots Para Minería de Datos. Cuando el conjunto de datos es muy largo, es necesario que el ordenador colabore activamente con el analista sugiriendo interpretaciones para los resultados. La construcción de algoritmos con esa capacidad llevó a una investigación de las actividades de interpretación de per si, sin considerar las técnicas que producen los resultados por interpretar. El resultado de esa investigación ha sido una formulación matemática del problema de interpretación como un problema de aproximación de conjuntos de individuos/observaciones (representando el significado de grandes familias de resultados) por los significados elementales o atómicos asociados a las variables observadas y sus valores. El problema así formulado puede ser representado por un grafo de intersección, lo que permite desarrollar algoritmos, integrados en el programa BiplostPMD, que generan sugestiones de interpretación para resultados expresados por conjuntos de individuos.
  • MODELOS DE RASGOS LATENTES BASADOS EN MÉTODOS BIPLOT .
    Autor: YAÑEZ ALVARADO MIGUEL SEGUNDO.
    Año: 2002.
    Universidad: SALAMANCA.
    Centro de lectura: MATEMÁTICAS.
    Centro de realización: UNIVERSIDAD DE SALAMANCA.
    Resumen: El objetivo de este trabajo de tesis es el estudio de los modelos de variables latentes para variables manifiestas categóricas (dicotómicas y politómicas) y variables latentes continuas. Para ello, se realiza una revisión exhaustiva de estos modelos, conocidos en la literatura como Modelos de Rasgos Latentes. La propiedad particular de estos modelos, que los diferencia de otros, es que conectan las variables manifiestas con las variables manifiestas con las variables latentes a través de una distribución de probabilidad. El marco teórico de los modelos lineales generalizados se utiliza para la formulación del Modelo de Rasgos Latentes Lineal General. De esta forma, se pueden ajustar no sólo variables categóricas, sino también variables continuas, mixtas y ordinales. La interpretación de los parámetros de los Modelos de Rasgos Latentes, se realiza en forma similar a las saturaciones del Análisis Factorial, de tal manera que se puden identificar estructuras de correlación entre las variables estudiadas. Los individuos en este contexto sólo son relevantes en cuanto a su cantidad para la estimación de los parámetros. Por esta razón, se desarrolla una propuesta de investigación con el objetivo de construir Biplot basados en modelos de rasgos latentes para datos categóricos, destacando la importancia de los individuos y variables en la visualización resulante. Los Biplot construidos en esta tesis al igual que los Biplot clásicos, producen configuraciones conjuntas de individuos y variables; la proximidad entre individuos se interpreta en términos de similitud y la proximidad entre variables en términos de covariación. La estimación de los marcadores fila sy columnas del Biplot, se efectúa por el método de máxima verosimilitud conjunta vía una reformulación del algoritmo newton-raphson, conocido como Método de Greenstadt. Además, el considerar la distribución de probabilidad de las variables en la estimación de los marcadores filas y columnas, permite calcular los errores estándar de estos estimadore sy la bondad del ajuste del modelo, lo cual los diferencia de los Biplots tradicionales.
  • DESENVOLUPAMENT DE PROCEDIMENTS CINÈTICS PER L'ANÀLISI DE MULTICOMPONENTS .
    Autor: VILLEGAS FORN NURIA.
    Año: 2002.
    Universidad: AUTONOMA DE BARCELONA.
    Centro de lectura: CIENCIAS.
    Centro de realización: ESCUELA DE DOCTORADO Y DE FORMACIÓN CONTINUADA.
    Resumen: El objetivo de esta memoria es el desarrollo de procedimientos cinéticos, basados en el registro del espectro UV-visible a lo largo del tiempo de reacción y su tratamiento mediante técnicas de calibración multivariable, para el análisis simultáneo de mezclas de especies químicas que se encuentran en muestras comerciales de naturaleza y complejidad variada, obviando la etapa de separación previa de los analitos y demostrando su aplicabilidad en situaciones de elevada complejidad, tanto por el mecanismo cinético segundo, como por la matriz de las muestras. Los sistemas, se presentan de forma cronológica a su realización, que coincide con el de su complejidad. En el primero, se cuantifica un único analito, acetato de hidrocortisona, en un preparado farmacéutico en forma de pomada, que contiene otro corticosteroide. En segundo, se determinan dos catecolaminas (levodopa y benserazida), de estructura química similar, contenidas en compromidos. En el tercero, se cuantifican mezclas ternarias de formaldehído, glioxal y glutaraldehído, contenidas, en detergentes desinfectante comerciales de uso hospitalario. En este último sistema se han utilizado dos metódicas experimentales distintas, debido a la interferencia producida por la elevada concentración de tensoactivos en la muestra. En la primera la muestra se diluye, evitando dicho efecto, mientras que en el segundo se analiza la muestra directamente, utilizando un sistema mixto en la matriz de calibración. En el cuarto y último se analizan mezclas de hasta cuatro sulfonamidas, utilizadas conjuntamente en diferentes preparados farmacéuticos para uso veterinario. La metódica seguida en todos los trabajos ha sido la misma. Primero, se intenta encontrar las condiciones experimentales adecuadas para obtener la mayor discreminación cinético-espectral entre los diferentes analitos. Entonces se preparan un conjunto de mezclas que contienen los analitos de interés a diferentes concentraciones, siguiendo diseños de tipo factorial, y se construyen los modelos de calibración. Como métodos de calibración se han utilizado la Regresión en Componentes Principales (PCR), la regresión Parcial por Mínimos Cuadrados bilineal (PLS), la regresión Parcial por Mínimos Quadrados Multi Via (nPLS) y las Redes Neuronales Artificiales (ANN). Los resultados obtenidos se comparan con los hallados por cromatografía líquida alta resolución (HPLC), utilizada como método de referencia. En ningún caso se ha encontrado diferencias significativas en los valores medios y precisión, excepto en uno en que el método cinético se muestra más preciso al evitar el paso previo de extracción de los analitos de la muestra. Las conclusiones generales de la memoria son: Se ha demostrado el gran potencial analítico de la simbiosis entre un método cinético y una calibración multivariable. El PLS bilineal se ha demostrado como un procedimiento prácticamente general de calibración, capaz de modelar un gran número de situaciones no lineales. El nPLS no mejora su capacidad predictiva, pero facilita la interpretación cualitativa de los resultados. El uso de sistemas tan complejos de calibración como ANN, sólo se justifica en casos excepcionales.
  • CONTROL DE CALIDAD DE LECHE Y QUESO DE OVEJA MEDIANTE ESPECTROSCOPÍA DE INFRARROJO CERCANO (NIRS) .
    Autor: NÚÑEZ SÁNCHEZ M. NIEVES.
    Año: 2002.
    Universidad: CORDOBA.
    Centro de lectura: INGENIEROS AGRÓNOMOS.
    Centro de realización: ESCUELA TÉCNICA SUPERIOR INGENIEROS AGRÓNOMOS Y MONTE.
    Resumen: El objetivo general de la presente tesis fue profundizar en las bases científico-técnicas del análisis cuantitativo NIRS de leche y queso de oveja en respuesta a la demanda del sector lácteo de métodos analíticos que permitan un control de calidad rápido y fiable de todos sus productos (leche, queso, suero, mantequilla, etc.). Los análisis NIRs de la leche se realizaron en un monocromador Foss NIRSystems 6500 SYI (400-2500 nm), con módulo de giro, en reflectancia (leche desecada, método DESIR), y doble transmisión (leche líquida, en cápsula de líquidos de 0,1 mm). Los análisis NIRS de queso se realizaron con un monocromador Foss NIRSystems 6500 SYII (400-2500 nm) dotado de sonda de fibra óptica para los análisis en interactancia-reflectancia (IR) y con monocromador Foss NIRSystems 6500 SYI para los análisis en reflectancia. La capacidad predictiva de las ecuaciones NIRS desarrolladas en leche, en reflectancia y doble transmisión, fueron evaluadas de buenas a excelentes para proteína, caseína, grasa y extracto seco. En términos de exactitud y rapidez de respuesta analítica, se recomienda el análisis NIRs en doble transmisión frente al análisis en reflectancia. Las ecuaciones NIRS obtenidas para la predicción del RCS en leche de oveja mostraron resultados muy satisfactorios, indicando un gran interés científico y aplicado el uso de la tecnología NIRS para el control de mamitis ovina. El estudio de factores que afectan a la repetibilidad espectral del análisis NIRS de leche permitieron hacer recomendaciones concretas sobre la metodología a seguir, referentes al modo de preparación de los filtros, al tiempo de desecación en estufa de los mismos y al uso de desecador en el proceso de enfriamiento previo al análisis NIRS de los filtros. La capacidad predictiva de las ecuaciones NIRS desarrolladas para la predicción cuantitativa de proteína, grasa y extracto seco de queso de oveja en los tres modos de análisis NIRS fue de buena a excelente, si bien, en términos de exactitud y rapidez de respuesta analítica, se recomienda el análisis NIRS de queso en forma intacta en el modo de interactancia-reflectancia.
  • DESARROLLO COMUNAL EN CHILE: ANÁLISIS DE LAS DISPARIDADES ESPACIALES .
    Autor: FIGUEROA ARCILA VÍCTOR FERNANDO.
    Año: 2002.
    Universidad: VALLADOLID.
    Centro de lectura: CIENCIAS ECONÓMICAS Y EMPRESARIALES .
    Centro de realización: DEPARTAMENTO DE ECONOMÍA APLICADA.
    Resumen: La doble apertura que enfrentan los países, hacia el exterior empujados por los procesos de globalización, y hacia el interior a través de las tendencias de descentralización política y administrativa, obliga a disponer de un mayor conocimiento del nivel de desarrollo y de las disparidades económicas intraterritoriales. En este sentido, en esta tesis se propone una metodología para caracterizar las condiciones de desarrollo de unidades territoriales menores y analizar su evolución temporal. Dicha metodología, basada en una concepción multidimensional del desarrollo y siguiendo el enfoque de los indicadores sociales, comienza por determinar los sectores en los cuales se puede dividir el bienestar social; para luego identificar y captar variables de caracterización de aspectos particulares dentro de cada sector, a partir de las cuales, con la utilización de técnicas estadísticas multivariantes, concretamente el análisis de componentes principales y de conglomerados, se construye un indicador de desarrollo global e indicadores por áreas temáticas, los que permiten realizar, en primer lugar, estudios transversales mediante jerarquización, creación de tipologías y construcción de cartografías, así como también estudios temporales, mediante modelos de sección transversal, específicamente convergencia beta y sigma, y modelos de dinámica de la distribución, tanto interna a través de funciones de densidad, como externa con la utilización de procesos de Cadenas de Markov. En una segunda parte, y aplicando el modelo propuesto, se realiza una caracterización de las condiciones de desarrollo de las comunas de la República de Chile, para disponer de un conocimiento más exhaustivo de las disparidades territoriales de este país, que permita en los ámbitos de decisión, tanto públicos como privados, contar con mayores antecedentes para la distribución de los recursos y decisiones puntuales que afecten el desarrollo, y en consecuencia al bienestar social.
  • CONTROL ESTADÍSTICO MULTIVARIANTE DE PROCESOS CON DATOS FALTANTES MEDIANTE ANÁLISIS DE COMPONENTES PRINCIPALES .
    Autor: ARTEAGA MORENO FRANCISCO JAVIER.
    Año: 2002.
    Universidad: POLITECNICA DE VALENCIA.
    Centro de realización: DPTO. DE ESTADÍSTICA E INV. OP. APLICADAS Y CALIDAD.
    Resumen: En la Tesis se aborda el problema de la explotación de un modelo PCA, dado, fijo y conocido para la monitorización estadística multivariante de procesos, cuando las nuevas observaciones a monitorizar tienen datos faltantes. Este problema se desglosa en dos objetivos generales; la estimación de las variables latentes de las nuevas observaciones completas y la adaptación de los esquemas de monitorización multivariante con modelos PCA, para monitorizar nuevas observaciones incompletas. En relación al primer objetivo, se repasan algunos métodos conocidos de estimación de scores, se desarrollan nuevos métodos, se establecen equivalencias entre los diferentes métodos, se construye un marco común en el que los diferentes métodos son casos particulares, se analizan los factores que influyen en el error de estimación de cada método y se compara la eficiencia de los diferentes métodos a partir de datos industriales y datos simulados. En relación al segundo objetivo, se analiza un método de la literatura para caracterizar la incertidumbre, originada por los datos faltantes, para ser incorporada a los esquemas de monitorización, consistente en asumir normalidad multivariante para los datos y construir regiones de incertidumbre para los estadísticos de monitorización, a partir de su distribución condicional, dadas las variables de proceso cuyo valor se conoce y dado el modelo PCA bajo control. Después se propone un método alternativo, según el cual la distribución de los estadísticos se condiciona a la contribución de las variables medidas al vector de scores (scores truncados) y al modelo bajo control, en lugar de condicionar al valor de las variables medidas. El comportamiento de ambos métodos permiten llegar a las mismas conclusiones, pero con una menor complejidad computacional y algorítmica para el método propuesto.
  • INTEGRACIÓN DE TÉCNICAS DE ANÁLISIS Y CLASIFICACIÓN DE DATOS MEIDANTE UN SISTEMA BASADO EN EL CONOCIMIETNO PARA EL DIAGNÓSTICO DE PATOLOGÍAS CEREBRALES Y DISLEXIAS.
    Autor: SIGUT SAAVEDRA JOSÉ FRANCISCO.
    Año: 2001.
    Universidad: LA LAGUNA.
    Centro de lectura: INFORMÁTICA.
    Centro de realización: FACULTAD DE FÍSICA.
    Resumen: En este trabajo se han desarrollado una serie de herramientas de análisis y clasificación de datos que automatizan el proceso de diagnóstico.Estas herramientas se han integrado conjutamente, mediante un Sistema Basado en el conocimiento, diseñado siguiendo la metodología CommonKADS e implementado a través de una serie de librerías en lenguaje CLIPS. El proceso de diagnóstico se ha contemplado como un proceso de diseño de clasificadores, que dependiendo de los datos disponibles y del conocimiento experto introducido en el sistema, propone el clasificador o clasificadores más adecuados, atendiendo a unos criterios preestablecidos. Especial atención se ha dedicado al estudio de la normalidad de un conjunto de datos.Se han propuesto dos enfoques alternativos al clásico, basado encontrastes de significación con una sola hipótesis. El primero de los enfoques consistió en utilizar una red neuronal para combinar diferentes estadísticos, usados habitualmente en la determinación de la normalida. En la segunda aproximación al problema, se utilizó Teoría de las Grandes Desviaciones para seleccionar un conjunto reducido de distribuciones alternativas a la normalidad que permitieron diseñar un test informativo y eficiente.La filosofía de ambas técnicas está inspirada en la combinación de "expertos", cuya acción conjunta puede resultar más efectiva que la individual, y de hecho esto fue confirmado a través de los numerosos experimentos realizados. En lo que se refiere a la validación del SBC con los datos de Alzheimer y Dislexia, se obtuvieron resultados bastante satisfactorios.Para el diagnóstico delAlzeheimer, el error de clasificación logrado fue muy bajo (aproximadamente un 1%), incluso con clasificadores simples como los discriminantes lineal y cuadrático.En el caso de la dislexia, la cifra más baja de error se alcanzó con una red neuronal y con los clasificadores de vecinos próximos (aproximadamente un 25%). Por último, es importante resaltar de nuevo la generalidad de los procedimientos empleados, que los hacen adaptables a otros problemas de diferente naturaleza.
  • APLICACIÓ DE L'ESPECTROMETRIA A L'INFRAROIG PROPER (NIR) AL CONTROL DE QUALITAT A LA INDUSTRIA TÉXTIL .
    Autor: PAGÉS CATEURTA JORDI.
    Año: 2001.
    Universidad: AUTONOMA DE BARCELONA.
    Centro de lectura: CIENCIAS .
    Centro de realización: ESCUELA DE DOCTORADO Y DE FORMACIÓN CONTINUADA.
    Resumen: En la presente tesis se estudia la aplicación de la espectrometría NIR al control del proceso de producción de fibras acrílicas, para ello se determina la concentración de diferentes especies químicas que intervienen en el proceso productivo y tmabién un parámetro físico como es la densidad lineal. Las especies químicas determinadas son los componentes de la disolución de extrusión para obtener la fibra (tiocianato sódico y el copolímero de acrilonitrilo y acetato de vinilo), los aceites de acabado que se aplican al final del proceso para mejorar ciertas propiedades de la fibra y la humedad residual. Para realizar cada una de estas determinaciones se utilizan un modelo de calibración diseñado y optimizado para obtener resultados de calidad. Con el objeto de seleccionar el modelo de calibración correcto para cada aceite de acabado se realizan un estudio de clasificación de las fibras según el aceite aplicado. Las características de la espectrometría NIR tales como: registro rápido de los espectros, nulo tratamiento de la muestra, incorporación tanto de información física como química y rápida obtención de resultados de diversa índole al hacen idónea para este tipo de aplicaciones. Sin embargo, exige la utilización de técnicas de calibración multivariable para la obtención de resultados, tanto para la clasificación como la determinación de los parámetros de interés. Se han utilizado las técnicas de Regresión en Componentes Principales (PCR), Regresión en Mínimos Cuadrados Parciales (PLSR), versiones no lineales de ambas, SIMCA y Redes Neuronales Artificiales (ANN). Se han seleccionado las más adecuadas a cada estudio de determinación para asegurar la calidad de los resultados. Los resultados obtenidos por la aplicación de los diferentes modelos construidos son de calidad y pueden ser utilizados para realizar un correcto del proceso de producción y acabado de las fibras acrílicas.
  • EL ANÁLISIS SIMULTÁNEO. PROPUESTA Y APLICACIÓN DE UN NUEVO MÉTODO DE ANÁLISIS FACTORIAL DE TABLAS DE CONTINGENCIA .
    Autor: GOITISOLO LEZAMA BEATRIZ.
    Año: 2001.
    Universidad: PAIS VASCO.
    Centro de lectura: CIENCIAS ECONÓMICAS Y EMPRESARIALES.
    Centro de realización: FACULTAD DE CC. ECONÓMICAS Y EMPRESARIALES.
    Resumen: El objetivo del presente trabajo consiste en desarrolar un método factorial para el análisis simultáneo de varias tablas de contingencia, o susceptibles de su análisis mediante correspondencias, que permita, de forma semejante al análisis de correspondencia, el estudio de la semejanza entre el conjunto de las filas, de las columnas y las relaciones entre ambos conjuntos. En este análisis simultáneo se considera que dos filas son semejantes so lo son en los análisis de las tablas separadas. Tras una breve mención, en el primer capítulo, a algunos de los métodos de análisis de un conjunto de tablas, se razona, en el capítulo segundo, la necesidad de un nuevo método de análisis simultáneo de tablas de contingencia. Mediante sencillos ejemplos se ilustran los aspectos del análisis conjunto de tablas de contigencia que imposibilitan la obtención de unos resultados adecuados al analizarse mediante técnicas más clásicas. Estos aspectos son el diferente efectivo de las tablas, el distinto orde de magnitud de la inercia proyectada sobre el primer eje en cada tabla y el diferente peso de los perfiles asociados a la misma fila en las diferentes tablas. En el tercer capítulo se propone un nuevo método de análisis factorial de varias tablas de contiengencia, el Análisis Simultáneo. Este nuevo método soluciona los problemas existentes en el tratamiento con las técnicas clásicas, manteniendo las relaciones internas de cada tabla. El Análisis Simultáneo proporciona un referencial común a todas las tablas mediante la definición, en forma apropiada, de un "compromiso" de los perfiles de la misma fila en cada una de las tablas. Este análisis permite obtener también las ayudas a la interpretación habituales en los métodos factoriales de análisis de datos. Además, el análisis se completa con un estudio de las semejanzas y diferencias de las tablas, mediante una visualización donde cada tabla es representada por un punto. El trabajo finaliza con la aplicación del método propuesto a los datos pertenecientes a la encuesta sobre la Sociedad de la Información elaborada por el Instituto Vasco de Estadística -EUSTAT- en el cuarto trimestre del años 2000. Con esta aplicación se consigue y, por otra parte, profundizar en las propiedades del Análisis Simultáneo y sus ventajas respecto a otras técnicas factoriales más clásicas.
  • LAS REDES NEURONALES COMO HERRAMIENTAS DE PREDICCION DE QUIEBRAS. APLICACIÓN A LAS ARTES GRÁFICAS EN ESPAÑA.
    Autor: ELORDUY TRIFOL JUAN.
    Año: 2001.
    Universidad: NACIONAL DE EDUCACION A DISTANCIA.
    Centro de lectura: CIENCIAS ECONÓMICAS Y EMPRESARIALES.
    Centro de realización: UNED FACULTAD DE CC. ECONOMICAS Y EMPRESARIALES.
    Resumen: En este trabajo, tras una breve descripción de la quiebra y de la necesidad de predecirla, se aborda en primer lugar el análisis multivariante como herramienta predictiva mediante la descripción de 16 modelos que van desde finales de los 60 hasta nuestros días. Continua con el estudio de las redes neuronales con la elección de un modelo de entre ellas. Escogida una muestra de empresas del mismo sector se aplican las dos herramientas en la predicción de la quiebra. Termina la tesis demostrando el mayor poder predictivo de una de las dos herramientas.
  • LOS MÉTODOS BIPLOT COMO HERRAMIENTA DE ANÁLISIS DE INTERACCIÓN DE ORDEN SUPERIOR EN UN MODELO LINEAL/BILINEAL .
    Autor: VARELA NUALLES MARIO.
    Año: 2001.
    Universidad: SALAMANCA.
    Centro de lectura: MATEMATICAS .
    Centro de realización: UNIVERSIDAD DE SALAMANCA.
    Resumen: Se ofrecen una serie de técnicas para el análisis de la interacción de orden superior asociada a un modelo lineal. Para el caso de la interacción de segundo orden se consideran los modelos AMMI y la Regresión Factorial en Rango Reducido. En el caso de la interacción de orden superior se considera el Análisis de Componentes Principales de n modos propuestos por KROONENBERG Y DE LEEUVW (1980). Todas las técnicas tratadas permiten una representación simultánea de las categorías de los factores, por lo que pueden ser consideradas métodos gráficos para el análisis de la interacción de orden superior. Se considera además la diagnosis de modelos para tablas de n vías; a partir de una generalización del Biplot (Biplot Interactivo), podremos detectar los diferentes tipos de interacciones presente en los datos. Toda la parte práctica del trabajo trata el problema del análisis de interacción Genotipo-Ambiente; es decir, clasificar genotipos en estables e inestables a partir de su interacción con el ambiente. Descriptores: Interacción Genotipo-Ambiente, Modelos AMMI, Regresión en Rango Reducido, Análisis de Componentes Principales de n modos, Biplot.
  • CONTRIBUCIONES AL ANÁLISIS DE MODELOS PARA VARIABLES CUALITATIVAS QUE CONTEMPLAN VARIABLE RESPUESTA .
    Autor: SALVO GARRIDO SONIA.
    Año: 2001.
    Universidad: SALAMANCA.
    Centro de lectura: MATEMATICAS .
    Centro de realización: DPTO. DE ESTADÍSTICA.
    Resumen: La bibliografía espacializada para el Análisis de Tablas de Contingencias de tres vías con variables Asimétricas, mediante Análisis de Correspondencias No Simétrico (ACNS), utiliza el índice de predictividad múltiple y la descomposición en valores singulares (DVS) clásica, reduciendo las tablas de tres vías a tablas bifactoriales. En esta investigación se utiliza el enfoque de la escuela italiana para el ACNS y una generalización del índice de predictividad, que considera la estructura de las tres vías y una generalización de la DVS propuesta inicialmente por Tucker (1966), el modelo Tuckals3 propuesto pro Kroonenberg (1989). Para seleccionar el número de dimensiones latentes necesarias para poder realizar un ACNS de Tres Vías (ACNSTV), se utiliza el criterio de Timmerman y Kiers, interpretando la matriz que recoge las interacciones entre las dimensiones latentes de los tres modos, podemos determinar el poder predictivo de cada categoría de las variables explicativas, tanto si se trata de un poder predictivo positivo como si es un poder predictivo negativo. Para las representaciones gráficas se utiliza el Biplot Interactivo, propuesto por Carlier y Kroonenberg (1988), de la matriz de residuales, lo que nos permite representar, mediante marcadores, las categorías de la variable respuesta y las categorías de las variables predictoras y visualizar las categorías de la variable respuesta mejor predichas y las categorías de las variables explicativas con mayor poder predictivo. Realizando las proyecciones de las categorías de la variable respuesta sobre los vectores que determinan las respectivas combinaciones de la categorías de las variables explicativas, obtenemos la representación gráfica del grado de asociación entre las variables predictoras y la respuesta. Para realizar una mejor interpretación del biplot interactivo, hemos definido cada una de las contribuciones a los ejes factoriales y sus respectivas calidades de representación, en los planos factoriales.
  • CONTRIBUCIONES AL ESTUDIO DE LA HETEROGENEIDAD Y LA DEPENDENCIA .
    Autor: RODRÍGUEZ PUERTA JULIO.
    Año: 2001.
    Universidad: CARLOS III DE MADRID.
    Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR.
    Centro de realización: UNIVERSIDAD CARLOS III DE MADRID.
    Resumen: El objetivo de esta tesis es proponer nuevos métodos para el análisis descriptivo de datos multivariantes. Por un lado, se proponen nuevas medidas escalares para resumir la variabilidad y la dependencia en datos multivariantes, con la propiedad de que pueden ser usadas para comparar vectores con distinto número de variables aleatorias. También se presentan dos aplicaciones de la nueva medida de dependencia multivariante desde el punto de vista inferencial: proponemos dos nuevos contrastes, uno de bondad de ajuste en modelos ARMA y otro para localizar estructuras no lineales en series temporales univariantes. Por otro, se desarrolla un nuevo método para el análisis de conglomerados, basado en el procedimiento SAR propuesto por Peña y Tiao (2002). Finalmente, se realiza un estudio comparativo del nuevo método con los algoritmos de conglomerados más utilizados.
  • APLICACIÓN DE LOS ESTADÍSTICOS DE ORDEN EN EL ANÁLISIS DE COMPONENTES INDEPENDIENTES .
    Autor: BLANCO ARCHILLA YOLANDA.
    Año: 2001.
    Universidad: POLITECNICA DE MADRID.
    Centro de lectura: INGENIEROS DE TELECOMUNICACIÓN .
    Centro de realización: E.T.S.I. TELECOMUNICACIÓN.
    Resumen: El Análisis de Componentes Independientes, denominado por sus siglas en inglés ICA, está cobrando cada vez una mayor atención en Tratamiento de Señal por su multitud de aplicaciones. En la tesis se han analizado las principales técnicas ICA existentes y se han propuesto nuevos métodos. Se ha orientado el estudio hacia la aplicación más importante de ICA: la solución al problema de la separación ciega de fuentes o BSS. BSS consiste en recuperar un conjunto de señales desconocidas a partir de las señales observables captadas en una serie de sensores, cada una de las cuales en una serie de sensores, cada una de las cuales es una combinación lineal (con o sin memoria) de las fuentes implicadas. La hipótesis fundamental para que el problema tenga solución es que las fuentes sean estadísticamente independientes. En una primera aproximación al problema BSS se puede considerar que las fuentes se mezclan de forma "instantánea", es decir, cada uno de los observables en un instante de tiempo es una combinación de las fuentes en ese mismo instante. No obstante ese modelo no es realista ya que en la práctica en cada observable existen contribuciones de las fuentes en instantes anteriores, ese tipo de mezcla se denomina convolutiva. Existen dos grandes líneas ICA aplicadas a mezclas instantáneas, el ICA tradicional trata de forzar la independencia mediante la minimización de la Información Mutua, realizando el tratamiento simultáneo de todas las salidas del sistema de separación. Además, ha aparecido recientemente una nueva línea ICA denominada "ICA por deflación" que extrae las componentes independientes sucesivamente mediante la maximización de una medida de distancia a la gaussiana en cada canal de acuerdo al Teorema del Límite central. En líneas generales, en esta tesis se proponen y analizan nuevos métodos ICA que se engloban dentro de las técnicas de deflación y que suponen ciertas ventajas sobre las ya existentes como la robustez frente a "outliers". Así se proponen nuevas medidas de gaussianidad tomadas sobre la función de distribución (FD) en lugar de la función densidad de probabilidad (fdp). Más en concreto, se estiman la FD inversas implicadas mediante el uso de los Estadísticos de Orden (EO) que son estimadores consistentes de los percentiles de la distribución. Las nuevas medidas presentan ventajas sobre medidas de gaussianidad tradicionales como la Kurtosis, como es la mayor sencillez y robustez en la estimación para un número bajo de muestras, además de una mayor eficiente estadística. La maximización de las nuevas funciones de coste ICA es una serie sucesiva de etapas se ha de realizar mediante algún algoritmo adaptativo tipo gradiente con una restricción adicional que garantice la independencia entre las fuentes estimadas sucesivamente, dicha restricción se basa en la ortonormalidad de los vectores de separación obtenidos. Se propone un nuevo algoritmo "serie" multi-etapa que mejora la convergencia respecto al ya existente algoritmo "paralelo". Por otra parte, la generalización de las nuevas medidas y algoritmos a las mezclas con coeficientes complejos, permite la separabilidad con éxito en cada una de las bandas frecuenciales en que se descompone la mezcla convolutiva al realizar su transfomada local de Fourier (STFT). La mejora de algunas técnicas existentes para solucionar los problemas del escalado y la permutación que aparecen en el dominio de la frecuencia concluye la tesis. Se ha aplicado con éxito el nuevo método "ICA con EO" a la separación de mezclas de señales de diversos tipos: artificiales, voz, imágenes y señales de comunicación.
  • TÉCNICAS MULTIVARIANTES PARA EL ENLACE DE ENCUESTAS .
    Autor: BÁRCENA RUIZ M. JESÚS.
    Año: 2000.
    Universidad: PAIS VASCO .
    Centro de lectura: CIENCIAS ECONÓMICAS Y EMPRESARIALES.
    Centro de realización: FACULTAD DE CIENCIAS ECONÓMICAS Y EMPRESARIALES.
    Resumen: Este trabajo aborda el problema de imputación en dos encuestas que sobre distintos temas se han realizado en una misma población, cara a enlazar la información que contienen. Las encuestas tienen un grupo de variables en común y cada una serie, además, otro grupo de variables específicas. Se estudian técnicas de inserción y fusión. La inserción se realiza mediante métodos de análisis factorial descriptivo mutlivariante. Consiste en proyectar las variables específicas de las dos encuestas sobre un subespacio común de representación, formado por los ejes obtenidos del análisis de las variables comunes.Se estudian formas de determinar si existe ese subespacio común de representación. Describimos dos métodos de inserción e ilustramos su funcionamiento insertando los dos ficheros que contienen los datos de la Encuesta de Presupuestos de Tiempo. EPT (realizada en la Comunidad Autónoma Vasca, en los años 1992-1993). Por último, mediante bootstrap parcial, estudiamos la estabilidad de los resultados de esta inserción. Fusionar encuestas consiste en imputar los valores de las variables específicas de una encuesta para los individuos de la otra, en función de los valores de las variables comunes. Es un caso particular de análisis de datos incompletos. Por ello, se estudia la aplicación de varios métodos de análisis de datos no completos a la fusión de encuestas. Proponemos dos métodos para llevar a cabo la imputación conjunta mediante árboles de regresión y/o clasificación. Ambos se aplican a datos de EPT. Se realiza imputación múltiple. Se evaluán los resultados y se comparan con los logrados al repetir el mismo experimento de imputación utilizando redes neuronales.Por útlimo, se estudia el comportamiento de los métodos de imputación mediantes árboles (métodos no paramétricos) en relación a un método paramétrico en diferentes situaciones.Para ello, se aplicabamos tipos de técnicas apra compeltar las mismas matrices de datos simulados.
  • MEDIDAS DE DIFERENCIA Y CLASIFICACIÓN AUTOMÁTICA NO PARAMÉTRICA DE DATOS COMPOSICIONALES .
    Autor: MARTÍN FERNÁNDEZ JOSEP ANTONI.
    Año: 2000.
    Universidad: POLITECNICA DE CATALUÑA.
    Centro de lectura: MATEMATICAS .
    Centro de realización: FACULTAT DE MATEMÁTIQUES I ESTADISTICA.
    Resumen: Es muy frecuente encontrar datos de tipo composicional en disciplinas tan dispares como son, entre otras, las ciencias de la tierra, la medicina, y la economía. También es frecuente en estos ámbitos el uso de técncias de clasificación no pramétrica para la detección de investigació investiga en los datos. Sin embargo, una búsqueda bibliográfica bastante exhaustiva y la presentación de resultados proliminares sobre el etema en congresos de ámbito investigación han permitido constatar la inexistencia de un cuerpo teórico y metodológico apropiado que permita desarrollar pautas y investigación a seguir en el momento de realizar una clasificación no paramétrica de datos composicionales. Por estos motivos se ha elegido como tema de tesis la investigac y desarrollo de métodos de investigac adecuados a datos de naturaleza composicional, es decir, datos tales que el valor de cada una de sus compoentes expresa una investigac respecto de un total. El título de la misma, "Medidas de diferencia y clasificación automática no paramétrica de datos composicionales", recoge no sólo este propótisot, sino que añade la investiga "medidas de diferencia" con el propósito de reflejar el peso específico importante que tiene el estudio de este tipo de medida en el desarrollo del trabajo. La investiga "no paramétrica" se refiere a que en la misma no se considerarán técnicas de clasificación que presuponen la existencia de un modelo de investigació para las inevstigación objeto de la investigac. La memoria de la tesis se inicia con un capítulo introductorio donde se presentan los elementos básicos de las técnicas de clasificaicón automática no paramétrica. Se pone especial investi en aquellos elementos susceptibles de ser adaptados para su investigac en clasificaciones de datos composicionales. En el segundo capítulo se aborda el investig de los conceptos más importantes en torno a los datos composiconales. En este capítulo, los esfuerzos se han concentrado investigación es estudiar las medidas de diferencia entre datos composicionales junto con las medidas de tendencia central y de investigac. Con ello se dispone de las herramientas necesarias para proceder al desarrollo de una metodología apropiada para la clasificación no pramétrica de datos composicionales, consistente en incorporar los elementos anteriores da las técnicas habituales y adaptarlas en la medida de los necesario. El tercer capítulo se dedica investigación a proponer nuevas medidas de diferencia entre datos composicionales basadas en las medidas de divergencia entre investigación de investigació. En el cuarto capítulo se incorporan las investigación de los datos composicionales a las técnicas de clasificación y se exponen las pautas a seguir en el uso prácitco de estas técncias. El capítulo se completa con la investigac de la metodología expuesta a un caso práctico. En el quinto capítulo de esta tesis se aborda el denominado problema de los ceros. Se analizan los inconvenientes de los métodos investi de substitución y se propone una nueva fórmula de substitución de los ceros por redondeo., El capítulo finaliza con el estudio de un caso práctico. En el epílogo de esta memoria se presentan las conclusiones del trabajo de investigación y se indican las líneas futuras de trabajo. En los apéndices finales de esta memoria se recogen los conjuntos de datos utilizados en los casos prácticos que se han desarrollado enl a presente tesis. Esta memoria se completa con la lista de las referencias bilbiográficas más relevantes que se han consultado para llevar a cabo este trabajo de investigación.
  • MEDICIÓN Y ANÁLISIS DE LAS INFRAESTRUCTURAS. UNA NUEVA METODOLOGÍA BASADA EN EL ANÁLISIS FACTORIAL MÚLTIPLE.
    Autor: GARCÍA LAUTRE IGNACIO.
    Año: 2000.
    Universidad: PUBLICA DE NAVARRA.
    Centro de lectura: CIENCIAS ECONOMICAS Y EMPRESARIALES.
    Centro de realización: UNIVERSIDAD PÚBLICA DE NAVARRA.
    Resumen: El objetivo general de este trabajo es proporcionar una metodología para la medición y análisis de las dotaciones de infraestructura de un conjunto de regiones, así como el estudio de su evolución a lo largo del tiempo. Este trabajo está estructurado en dos parte, una teórica que consta de tres capítulos y otra empírica, de dos. En los dos primeros capítulos se contextualiza el problema de la medición y se explican los fundamentos teóricos del método utilizado, el Análisis Factorial Múltiple (AFM). En el tercer capítulo se desarrolla una nueva metodología para la medición de las dotaciones. Se propone utilizar el Análisis de Componentes Principales y, por extensión, el AFM en el estudio de las infraestructuras desde una perspectiva alternativa, complementaria a la de otros métodos. Posteriormente se realiza cuatro propuestas, basadas en el AFM, que introducen nuevos elementos en la medición. Se propone una solución alternativa al problema de la elección de indicadores parciales que miden un mismo concepto; la inclusión de indicadores parciales de tipo cualitativo en la medición de las dotaciones de infrestructura; la obtención de un indicador armonizado a partir de indicadores sintéticos obtenidos mediante diferntes metodologías; y por último,la obtención de un indicador sintético de dotación global de forma directa. Este capítulo finaliza con el estudio de la evolución de las infraestructuras mediante el AFM. La utilización de este método permite recoger los cambios cualitativos que se producen con el paso del tiempo en las infraestructuras que impiden obtener series homogéneas de indicadores parciales. Por otro lado, se proporcionan gráficos en los que se representan las trayectorias de la evolución de cada región en cuanto a su dotación global y en cuanto a aspectos parciales. En la parte empírica se aplican algunas de las propuestas realizadas en el capítulo 3. Se analiza, mediante la realización de dos estudios, la evolución de las dotaciones de infraestructuras de carreteras y educación de las Comunidades Autónomas en el período 1975-1995. El trabajo finaliza con otros dos estudios empíricos. En el primero se obtiene un indicador armonizado para medir la dotación global de las Comunidades Autónomas en el año 1990 a partir de indicadores sintéticos obtenidos mediante tres metodolgías diferentes. En el segundo, se obtiene un indicador global de dotación de infraestructura económica de forma directa a partir del análisis simultáneo de tres categorías: carreteras, ferrocarriles y telecomunicaciones.
  • ANALISIS DEL COSTE HOSPITALARIO. INFORMACION E INSTRUMENTOS PARA EL AJUSTE DE LA FUNCION DE COSTES HOSPITALARIOS.
    Autor: COTS REGUANT FRACESC.
    Año: 2000.
    Universidad: AUTONOMA DE BARCELONA.
    Centro de lectura: CIENCIAS ECONOMICAS Y EMPRESARIALES.
    Centro de realización: ESCUELA DE DOCTORADO Y DE FORMACION CONTINUADA.
    Resumen: El sector hospitalario es mayoritario tanto en Cataluña como en España. En este entorno no se ha primado el análisis de los costes de la provisión de servicios de salud. La variabilidad de los costes y la definición de producto hospitalario se ha basado en los Sistemas de Clasificación de pacientes (SCP) y más concretamente en los Grupos Relacionados por el diagnostico (GRD). La hipótesis de trabajo ha sido que la variabilidad debida a la complejidad del proceso de producción hospitalario no queda bien reflejada con el uso de los SCP ya que solamente aportan información sobre la dimensión de la complejidad del concepto de producto hospitalario. Quedan por explicar la seriedad de la enfermedad, los outliers, los factores socioeconómicos, las características del proceso y los factores estructurales. Todos ellos, junto con el ajuste de los costes relativos (pesos) asociados a los GRD, pueden explicar mucho mejor la variabilidad del coste hospitalario basado en la definición correcta del producto. Se ha analizado una base de datos correspondiente a los hospitales del Institut Municipal d´Assistencia Sanitaria con 35.262 altas y 12.792 millones de pesetas asignados a paciente mediante una metodologia de asignacion basada en actividades (coste sobre base clinica). Se ha determinado.: * La capacidad explicativa de la variabilidad del coste de los pacientes analizados ha aumentado del 19% mediante GRD y pesos asociados estándar, hasta el 50% si se introduce el concepto integral de la definición de producto, se incorpora la medida de casos extremos y se ajustan correctamente los pesos en el entorno europeo. * Se ha modelizado una función de costes que permite analizar el comportamiento de las diferentes dimensiones explicativas del producto y su influencia sobre el coste por paciente. De los resultados se han extraído implicaciones: * La capacidad explicativa del coste no aumenta con el incremento de categorías de los SCP, si no que mejora gracias a la explicación multidimensional del producto hospitalario. Así cuantos menos grupos se utilicen, más racional será el uso de los SCP para la gestión clínico, hospitalaria y sanitaria. * La ausencia de información individual sobre el componente socioeconómico del paciente resta capacidad explicativa de la variabilidad del coste hospitalario. Esta falta de información se debería replantear todo y los problemas éticos que presenta su utilización, ya que es causa de variabilidad justificable del coste no recogida por las actuales sistemas de información. Es, por tanto, causa de riesgo financiero para determinados hospitales.
  • MANOVA BIPLOT PARA DISEÑOS CON VARIOS FACTORES, BASADO EN MODELOS LINEALES GENERALES MULTIVARIANTES .
    Autor: AMARO MARTIN ISIDRO RAFAEL.
    Año: 2000.
    Universidad: SALAMANCA.
    Centro de lectura: MATEMATICAS .
    Centro de realización: DEPARTAMENTO DE ESTADISTICA.
    Resumen: En el presente trabajo se introduce el Manova Biplot para diseños de dos vias a partir del Modelo lineal general multivariante y usando el principio de union-interseccion. Tambien se introducen indices para medir la calidad de representación, tanto para el Manova-Biplot de una vía como para el de dos vias, asi como regiones de confianza basadas en el principio de union-interseccion. El proposito es construir una representación de las filas y columnas de la matriz de medias ponderada de modo que los grupos esten representados como maximo poder discriminante entre ellos. Se proponen cuatro tipos de Biplot para represenar los resultados de una Manova para un diseño de dos vias: el Biplot total, el Biplot de interacción, el Biplot de filas y el Biplot de columnas, y se aplican los resultados teoricos a un conjunto de datos.
  • BIPLOT CON INFORMACION EXTERNA EN MODELOS LINEALES GENERALIZADOS.
    Autor: CARDENAS CARDENAS OLESIA COROMOTO.
    Año: 2000.
    Universidad: SALAMANCA.
    Centro de lectura: MATEMATICAS.
    Centro de realización: DEPARTAMENTO DE ESTADISTICA.
    Resumen: En la ultima decada los aportes en el desarrollo de los métodos Biplot (GABRIEL, 1971) han sido considerables. La posibilidad de interpretar el Biplot de una matriz de datos (individuos pro variables) como un Modelo Bilineal Multiplicativo (GOLLOB, 1968), permite describir aspectos resaltantes en tablas de dos vias, fundamentalmente en lo que se refiere a la descripción en la interacción y la diagnosis de modelos, olvidando asi el propósito original de los Biplots. En esta linea, encontramos muchos aportes respecto a los metodos de estimacion utilizados en las aproximaciones Biplot, al considerar a los modelos utilizados en el ajuste como extensiones de los Modelos Lineales generalizados (NELDER & WEDDERBURN, 1972). Sin embargo, la mayoria de los metodo propuestos hasta el momento, se fundamentan en generalizaciones heurísticas. En esta investigación, se insiste en la utilización de los Biplot en la forma clásica (para describir matrices de datos, individuos por variables) y la contribución está en la proposición matematica de un "metodo de estimación simultanea" para el ajuste de los Biplot a través de los Modelos Bilineales Generalizados Multiplicativos, considerando la posibilidad de inclusión de variables externas que permitan la ordenación grafica de los individuos de acuerdo a los ejes Biplot. Este enfoque se puede relacionar con la forma factorial clasica de la escuela francesa de analisis de datos y con los métodos de ordenación de la escuela biometrica. Nos valemos en el metodo, de las buenas propiedades que los estimadores maximo verosímiles deben tener en otros contextos, aunque su uso se hace finalmente en la forma clasica de los Biplots y no en forma inferencial. Para la interpretación, se analiza la geometria de los Biplot ajustados en terminos de proyecciones sobre los subespacios de mejor ajuste (en el sentido de los minimos cuadrados). Finalmente se realiza una aplicación practica, y se comparan los resultados con los obtenidos por otros investigadores (GOWER & HAND, 1996), observando resultados muy similares. Asi pues, el metodo propuesto se demuestra que es valido y de gran utilidad, por ejemplo en las Ciencias sociales en la obtencion de variables latentes continuas a través de una representación Biplot.
122 tesis en 7 páginas: 1 | 2 | 3 | 4 | 5 | 6 | 7
Google
Web www.cibernetia.com
Manuales | Directorio | Tesis: Ordenadores, Circuitos integrados...
english
Cibernetia