|
|
|
| 75 tesis en 4 páginas: 1 | 2 | 3 | 4 |
Pittsburgh genetic-based machine learning in the data mining era: Representations, Generalization,
and Run-Time . Autor: Bacardit Peñarroya Jaume. Año: 2004. Universidad: RAMON LLULL. Centro de lectura: E.T.S. D'ENGINYERIA
ELECTRÓNICA I INFORMÁTICA. Centro de realización: E.T.S. D'ENGINYERIA ELECTRÓNICA I INFORMÁTICA.
Resumen: El enfoque de Pittsburgh (DeJong, Spears, & Gordon, 1993) del aprendizaje evolutivo es, entre otras alternativas (Wilson, 1955; Venturini, 1993), la aplicación de las técnicas de computación evolutiva (Holland, 1975; Godberg, 1989ª) a las
tareas de aprendizaje artificial. Los sistemas que aplican este enfoque se caracterizan por hacer evolucionar individuos que consisten en un conjunto de reglas, habitualmente de tamaño variable. Por lo tanto, la solución propuesta al problema a
resolver por este tipo de sistemas es el mejor individuo de la población.
Cuando se usa este enfoque es necesario soluciona correctamente algunos asuntos como el control del tamaño de los individuos de la población, aplicar el grado correcto de presión de generalización sobre un conjunto amplio de problemas, reducción
del coste computacional del sistema, tratar problemas con tipos de atributo diversos, etc. Todos estos problemas son todavía más serios cuando se pretende solucionar problemas modernos de minería de datos.
El objetivo general de esta tesis es adaptar el enfoque de Pittsburgh para solucionar con éxito este tipo de problemas. Este objetivo general se divide en tres partes: (1) mejorar la capacidad de generalización, (2) reducir el coste
computacional y (3) representaciones para atributos reales. Estos tres objetivos se han logrado mediante la combinación de cuatro tipos de contribuciones. Algunas de estas propuestas sólo solucionan uno de los objetivos. Otras pueden solucionar más
de un objetivo al mismo tiempo. Todas estas propuestas están integradas en el sistema llamado GAssist (Genetic clASSIfier sySTem),
La experimentación realizada incluye un amplio espectro de problemas de minería de datos. Esta experimentación está dividida en dos partes. En la primera parte se ha experimentado con diversas alternativas por separado para cada uno de los
cuatro tipo de contribuciones realizadas en esta tesis. El objetivo de esta parte de la experimentación es poder proponer un subconjunto reducido de configuraciones del sistema que podamos considerar como "buenas" en general. En la segunda parte de
la experimentación de la tesis este conjunto de configuraciones buenas ha sido comparado a diversos sistemas de aprendizaje artificial que representan diversos tipos de representaciones del conocimiento, de técnicas de aprendizaje, etc. Estos
experimentos muestran como el sistema Gassist tiene un rendimiento competitivo y genera soluciones compactas y altamente interpretables. TECNICAS DE RECUPERACION POR CONTENIDO PARA IMAGEN Y VIDEO EN ARQUITECTURAS PARALELAS
. Autor: ROBLES SANCHEZ OSCAR DAVID. Año: 2004. Universidad: POLITECNICA DE MADRID. Centro de lectura: FACULTAD DE INFORMATICA
. Centro de realización: FACULTAD DE INFORMATICA.
Resumen: Durante la última década del siglo XX el aumento de las capacidades de cálculo y almacenamiento de los computadores, así como su abaratamiento, han hecho que la demanda de información multimedia por parte de los usuarios
crezca de forma incesante. La consecución de una adecuada gestión de esta información supera las capacidades de las técnicas clásicas de los campos de bases de datos y de recuperación de Información textual. Esto ha despertado el interés de la
comunidad científica en los sistemas de recuperación por contenido de información multimedia.
En la problemática asociada a este tipo de sistemas habría que diferenciar entre imágenes y vídeos, ya que los segundos plantean problemas más complejos que las primeras. En la presente tesis doctoral se pretende llegar a realizar recuperación
de vídeo por contenido partiendo de un análisis previo en imágenes bidimensionales, a diferencia de lo que sucede comunmente con este tipo de sistemas, en los cuales se plantean propuestas trabajando directamente sobre secuencias de vídeo.
Las primitivas desarrolladas para recuperación por contenido de imágenes se han basado en la obtención de características de color, forma y combinaciones de ambas en el dominio transformado obtenido tras aplicar las transformadas wavelet. Se ha
realizado un estudio del comportamiento de dichas primitivas a través de los resultados que obtienen, para lo cual se ha partido de métricas de semejanza ya disponibles y se ha implementado, además, una nueva.
Para profundizar en el estudio de las primitivas desde un punto de vista computacional, se han realizado diversas implementaciones en diferentes arquitecturas paralelas con el fin de evaluar su rendimiento desde una perspectiva más aplicada.
Finalmente, algunas de estas primitivas basadas en el color se han utilizado en el proceso de recuperación por contenido de vídeo, tanto en una primera etapa de segmentación del contenido del vídeo como en la selección de fotogramas
representativos y en la etapa de recuperación propiamente dicha. Para las dos primeras fases se han introducido cambios inherentes a la diferente utilización de las primitivas, mientras que en la etapa de recuperación éstas se han podido reutilizar
con el mismo planteamiento que el realizado con las imágenes bidimensionales. LA ESTRUCTURA DE LOS DOCUMENTOS EN EL ÁMBITO DE RECUPERACIÓN DE INFORMACIÓN: PROPUESTAS PARA SU
COMPRESIÓN, INDEXACIÓN Y RECUPERACIÓN . Autor: ADIEGO RODRÍGUEZ JOAQUÍN NICOLÁS
. Año: 2003. Universidad: VALLADOLID. Centro de lectura: E.T.S. DE INGENIERÍA INFORMÁTICA. Centro de realización: E.T.S. DE INGENIERÍA INFORMÁTICA.
Resumen: Se
presentan diferentes técnicas novedosas para comprimir, indexar y recuperar documentos semiestructurados. Respecto a la compresión se ha propuesto un modelo general, denominado modelo de contextos estructurales, que obtiene importantes mejoras
respecto a las técnicas básicas. El modelo de contextos estructurales se puede considerar como una generalización del modelo de alfabetos separados. Por otro lado, se expone una técnica de compresión, inspirada en el esquema de Lempel-Ziv, que
sustituye subárboles repetidos por una referencia a la primera ocurrencia del mismo. Dicha Técnica ha obtenido excelentes resultados al comprimir formularios XML (XFORMS). En el área de Indexación se describe un nuevo tipo de índice invertido para
documentos semiestructurados cuyas prestaciones se encuentran entre el índice con direccionamiento a caracteres y el índice con direccionamiento a palabras. Finalmente, se ha propuesto un modelo de recuperación que mejora la precisión basándose en
el concepto de densidad de información.
COMPLEJIDAD Y ESTRUCTURAS DE DATOS PARA EL PROBLEMA DE LOS RANGOS VARIABLES . Autor: TONI DELGADO ADRIANA. Año: 2003. Universidad: POLITECNICA DE MADRID. Centro de lectura: INFORMÁTICA. Centro de realización: FACULTAD DE INFORMÁTICA (UPM).
Resumen: La tesis trata del diseño y
análisis de complejidad de estructuras de datos y programas que implementen las operaciones de modificación del valor de una posición de un vector y la suma de los valores almacenados en posiciones consecutivas del mismo.
Se utilizan técnicas algebraicas y estructuras de datos como árboles, grafos y matrices para tratar distintos aspectos del problema: cotas inferiores para la complejidad de las operaciones, búsqueda de soluciones eficientes, optimización de la
complejidad según algún criterio etc. EVALUACIÓN DE SISTEMAS DE RECUPERACIÓN DE INFORMACIÓN EN EL ENTORNO JURÍDICO ESPAÑOL
. Autor: ALVITE DÍEZ M. LUISA. Año: 2002. Universidad: LEON. Centro de lectura: FILOSOFÍA Y LETRAS. Centro de realización: FACULTAD DE FILOSOFÍA Y LETRAS.
Resumen: Se expone el origen y conceptualización de la teoría de la Recuperación de Información, abordando, igualmente, el concepto y evolución de los
sistemas de recuperación de información así como los parámetros, objetivos y métodos relacionados con la evaluación de los mismos. Se analizan las principales aproximaciones existentes en la investigación evaluativa.
Se estudian las características de la documentación jurídica española, su adaptación a las tecnologías de la información, las relaciones entre la naturaleza de los documentos jurídicos y la problemática que plantea la recuperación de los
mismos. Se repasa, asimismo, el importante mercado de los distribuidores de contenidos jurídicos en España y los efectos de la globalización económica en este sector. También se exponen las principales tendencias en la investigación sobre
Recuperación de Información jurídica: investigaciones evaluativas, estudios del comportamiento del usuario en la búsqueda de información legal, aplicaciones de la inteligencia artificial de la RI jurídica, trabajos que atienden al procesamiento del
lenguaje natural, y por último, la gestión de la documentación jurídica mediante el empleo de lenguajes de marcas.
Se realiza una evaluación analítica y empírica de una muestra de los sistemas seleccionados a modo de muestra, se evalúan sistemas de recuperación de información legislativa, jurisprudencial y doctrinal, se articulan tres apartados que atienden
a la naturaleza global de los sistemas: evaluación del contenido de las bases de datos, rendimiento de los sistemas en términos de exhaustividad y precisión y evaluación de las interfaces. Se muestran los resultados y exponen las discusiones para
los distintos apartados y parámetros de evaluación establecidos. BASE DE DATOS DE IDENTIFICACIÓN DE PRODUCTOS . Autor: RAPOSO SIMON P. CARLOS. Año: 2002. Universidad: COMPLUTENSE DE
MADRID. Centro de lectura: FARMACIA. Centro de realización: FACULTAD DE
FARMACIA - UNIV. COMPLUTENSE DE MADRID.
Resumen: En este trabajo, se ha propuesto un
diseño metodológico para la construcción de una herramienta informática que permita realizar una explotación eficaz de las características morfológicas de los medicamentos que se encuentran en el mercado, ya sea de forma legal como ilegal o alegal.
Son características de esta Base de Datos de Identificación de Productos:
- Opción de mantenimiento desde la propia Industria Farmacéutica a través de Internet con claves securizadas.
- Sistema centralizado para conseguir la integración de los datos.
- Versatilidad al permitir, sin limitaciones, la incorporación de nuevos atributos y parámetros de codificación.
- Capacidad de almacenamiento de productos nacionales e internacionales.
- Vinculación con otras Bases de Datos de Medicamentos, por medio del código nacional o clave equivalente, con lo que se consigue una información sanitaria global.
FUSIÓN DE CONOCIMIENTO EN BASES DE DATOS RELACIONALES: MEDIDAS DE AGREGACIÓN Y RESUMEN
. Autor: SERRANO CHICA JOSÉ M.. Año: 2002. Universidad: GRANADA. Centro de lectura: INFORMÁTICA. Centro de realización: E.T.S. INGENIERÍA INFORMÁTICA.
Resumen: Los objetivos que se abordan en
esta memoria son los siguientes:
* DEFINICIÓN DE DEPENDENCIA APROXIMADA DIFUSA
Se pretentde definir y desarrollar el concepto de Dependencia Aproximada Difusa, como extensión al caso difuso del concepto ya existente de Dependencia Aproximada. Para ello, se parte de algunos enfoques existentes para el caso "crisp". Además
se estudia el problema de la implementación eficiente, con objeto de optimizar en la medida de lo posible los requisitos necesarios en tiempo de ejecución y espacio de memoria.
Dentro de este mismo apartado, se describen un conjunto de situaciones tipo en las que aplicar esta metodología, para a continuación mostrar dos ejemplos concretos en los que aplicamos nuestros resultados en problemas reales que, de otra forma,
serían mucho más difíciles de abordar.
* MINERÍA DE DATOS Y ANÁLISIS DE CORRESPONDENCIAS
Como un segundo objetivo, se propone el uso de Dependencias Aproximadas para el Análisis de Correspondencias entre Particiones. Se estudia el problema de concordancia de particiones difusas, que puede verse como una extensión del análisis de
correspondencias clásico. Dicho problema puede formularse como un caso particular de la búsqueda de dependencias aproximadas difusas.
Se plantea un ejemplo real y práctico, dentro de un entorno agrícola, en el que estudiar las relaciones que pueden existir entre distintas apreciaciones sobre un mismo concepto como es el suelo de cultivo.
* DESARROLLO DE UNA APLICACIÓN SOFTWARE
Por último, y para que estos resultados sean realmente eficaces, será necesario contar con una herramienta software que lleve a la práctica los resultados teóricos previamente obtenidos. Es por ello que otro de los objetivos presentados en esta
memoria es el desarrollo de una aplicación que englobe la implementación, no sólo de los resultados presentados en esta memoria, sino también de otros necesarios para una buena gestión de un Sistema de Bases de Datos Relacionales Difusas.
RECOMENDACIÓN PERSONALIZADA DE DOCUMENTOS EN SISTEMAS DE RECUPERACIÓN DE LA INFORMACIÓN BASADA EN
OBJETIVOS . Autor: BUENO VALLEJO DAVID. Año: 2002. Universidad: MALAGA. Centro de lectura: INFORMÁTICA
. Centro de realización: E.T.S.I. INFORMÁTICA.
Resumen: Los sistemas de recuperación de
información surgen de la necesidad del hombre de organizar la información contenida en bibliotecas para poder localizar todos los documentos contenidos en ellas. En la actualidad todo el que se conecta a la Web está en contacto con sistemas como
Altavista, Google o Yahoo. El problema de estos buscadores es que a veces devuelven cientos o miles de resultados de los que el usuario sólo va a considerar los 20 ó 30 primeros. La ordenación que realizan devuelve los documentos web que mejor
corresponden a la consulta, pero eso no quiere decir que sean los más interesantes para el usuario. Muchas veces el usuario no experto encuentra dificultades en expresar su necesidad de información en el lenguaje de consulta que le ofrece el
sistema, con lo que no encuentra los documentos aunque éstos estén en el sistema.
Una posible solución al problema de recuperación de información viene dada por la aplicación de un modelo del usuario que permita ofrecer una respuesta personalizada de acuerdo a las preferencias y necesidades de cada individuo. Los aspectos
más importantes a adaptar estarán relacionados con la ordenación de los resultados de acuerdo a las necesidades del usuario y con las facilidades ofrecidas para realizar las búsquedas.
Esta tesis ofrece resultados relativos al estudio de la personalización en los sistemas de recuperación de información. Se ofrece una nueva visión de las personalización en estos sistemas orientada a los objetivos del usuario, frente al
refinamiento de consultas utilizado en otros sistemas. La mayoría de los sistemas que ofrecen algún tipo de personalización suelen tener una visión general de los intereses de los usuarios y tienen un único modelo para cada usuario. En el enfoque
propuesto, un usuario puede tener diferentes intereses que no tienen porque guardar relación. De esta forma, cuando esté interesado en un objetivo, sólo se le ofrecerán documentos relevantes para éste.
En esta tesis se ofrecen algoritmos probabilísticos que permiten aplicar personalización basada en objetivos a distintas bases de datos multimedia o documentales, teniendo en cuenta múltiples parámetros de los datos. Además, se ofrecen
mecanismos que permitan hacer análisis complejos de la base de datos sin necesidad de conocer su contenido. En el caso en que el usuario no sea capaz de encontrar documentos que le satisfagan, se ha desarrollado una arquitectura para que el usuario
encuentre un apoyo de otros usuarios del sistema a través de Internet.
Por último, se ha comprobado la validez de la aportación mediante la implementación de un sistema, METIORE, que incluye las propuestas anteriores y que ha sido evaluado en entornos de aplicaciones convencionales y en entornos webs aplicados a
diferentes bases de datos de referencias bibliográficas. APROXIMACIÓN FORMAL A LAS RESTRICCIONES DE CARDINALIDAD EN UN MARCO METODOLÓGICO DE DESARROLLO DE
BASES DE DATOS RELACIONALES . Autor: CUADAR FERNANDEZ DOLORES. Año: 2002. Universidad: CARLOS III DE MADRID. Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR. Centro de realización: UNIVERSIDAD CARLOS III DE MADRID.
Resumen: Las metodologías de desarrollo de bases de datos constan de tres
fases principales: conceptual, lógica y física. Cada una de las fases se realiza a través de la aplicación de un modelo de datos. La proliferación de modelos de datos conceptuales, en la primera de las fases, y sobre todo las distintas
características que cada uno ofrece, contribuyen a la confusión en su manejo y por ende a que los esquemas construidos en esta fase no reflejen todas las características del sistema a modelar.
Esta tesis realiza un tratamiento formal de los elementos más problemáticos. Para ello define el constructor interrelación y se describen las restricciones de cardinalidad asociadas y la semántica que reflejan. Para facilitar la comprensión de
estas restricciones, difíciles de entender y aplicar, presentamos sus definiciones a partir de la definición formal de interrelación y un conjunto de reglas para su validación. Para la segunda fase de la metodología, utilizamos el modelo relacional
y se realizará un estudio exhaustivo de la repercusión de estas cardinalidades en las estructuras lógicas provenientes de la transformación de esquemas conceptuales en lógicos. Este estudio se basará principalmente en las interrelaciones binarias y
ternarias y se definirán mecanismos de control para conservar la semántica de las restricciones de cadinalidades definidas en la fase anterior. MODELACIÓN DE DATOS EN LA LOCALIZACIÓN DE SOFTWARE . Autor: REINEKE DETLEF. Año: 2002. Universidad: LAS PALMAS DE GRAN
CANARIA. Centro de lectura: FILOLOGÍA. Centro de realización: FACULTAD DE FILOLOGÍA.
Resumen: El objetivo de la tesis doctoral radica en modelar los datos específicos del ámbito de la localización de software para su representación en base de datos terminológicos. Con el modelo de entrada
desarrollado se pretende proporcionar más información para la contextualización de las unidades extraídas del software, y, de esta forma, facilitar aún más su localización. Se estudian las unidades de localización de programas ejecutables
desarrollados en entornos que utilizan el lenguaje de programación C++, sometiéndolas a un exhaustivo análisis terminológico con el fin de determinar su conceptualidad e ideonidad para su representación en bases de datos terminológicos. La
modelación de los datos terminológicos específicos de la localización de software se basa en el método definido en la ISO DIS 16642 que propone un marco genérico para la descripción de todo tipo de recursos lingüísticos y las reglas para la
especificación de lenguajes de marcadores terminológicos. Una vez estudiadas las muestras de entradas terminológicas de fabricantes de foftware y agencias de localización, se desarrolla un modelo de entrada terminológico basado en los principios de
los postulados de la terminología (estructura de entrada orientado al concepto, autonomía de la denominación, elementariedad, granularidad, variación de modelación). Para ello, se recurre a las categorías de datos de la ISO DR 12620-2 y, en caso de
aquellos datos que no pueden ser documentados por medio de estas categorías, se proponen nuevas categorías a base de las reglas de descripción especificadas en la misma norma. Finalmente, se implementa el modelo en un programa de gestión
terminologíca (MultiTerm 5) para su evaluación. SECURITY AND INFORMATION LOSS IN STATISTICAL DATABASE PROTECTION . Autor: OGANIAN ANNA. Año: 2002. Universidad: POLITECNICA DE
CATALUÑA. Centro de lectura: MATEMÁTICAS. Centro de realización: FACULTAD DE MATEMÁTICAS Y ESTADÍSTICA.
ANALISIS DE SEGMENTACION EN EL ANALISIS DE DATOS SIMBOLICOS . Autor: BRAVO LLATAS M. CARMEN. Año: 2001. Universidad: COMPLUTENSE DE MADRID. Centro de lectura: MATEMATICAS. Centro de realización:
FACULTAD DE MATEMATICAS.
Resumen: Esta Memoria se encuadra dentro del marco Analisis de Datos Simbolicos y de las tecnicas de Segmentacion. El analisis de Datos Simbolicos permite la extension de la Estadistica de las intenciones o conceptos, y el paso de la mineria de
datos simbolicos y a la mineria de conocimientos.
Se propone una nueva tecnica de analisis de Datos simbolicos, el Analisis de Segmentacion para datos simbolicos estratificados. Ademas del analisis de datos simbólicos, se incorpora la informacion de los estratos en los algoritmos de
Segmentacion, alcanzandose el doble objetivo de explicacion de una variable clase, de una parte y una clasificacion de los estratos por su comportamiento homogeneo en la explicacion de la variable clase de otra. Se presenta una formalizacion
generalizada del metodo en terminos de objetos simbolicos que permite el analisis de datos monoevaluados y de diversos tipos de datos simbólicos: modales probabilistas, multievaluados, de intervalo y posibilistas. El metodo proporciona una
descripcion por objetos simbólicos de los estratos, como informacion agregada de los mismos, representando una generalizacion o intencion de los mismos, expresada en terminos de reglas de prediccion de las clases.
El metodo de Segmentacion presentado contribuye al analisis de datos consolidados. La informacion consolidada y el conocimiento extraido de la misma se expresan por un unico formalismo. El marco unico de representacion de los datos, del arbol y
de los estratos mediante datos y objetos simbolicos ha permitido identificarlos tres grandes propósitos de un algoritmo general de analisis de Datos Simbólicos: la organización de los datos, la organización del conocimiento y la extraccion de
conocimiento a partir de datos y/o conocimiento.
Se ha desarrollado un software que permite la utilizacion del metodo propuesto y que facilita la investigacion futura para la creacion de nuevos criterios que mejoren la tecnica desarrollada a esta Memoria y la incorporacion de otros tipos de
datos simbolicos. UNA LÓGICA DE DESCRIPCIONES EN UN NIVEL META-ONTOLÓGICO PARA LA GESTIÓN DE SISTEMAS DE INFORMACIÓN
GLOBALES . Autor: BERMÚDEZ DE ANDRÉS JESÚS. Año: 2001. Universidad: PAIS VASCO. Centro de lectura: INFORMÁTICA
. Centro de realización: FACULTAD DE INFORMÁTICA.
Resumen: Esta tesis presenta los fundamentos para
implantar un nivel semántico por encima de las ontologías contempladas por el sistema OBSERVER, en el que las ontologías cumplen un papel central de descripción semánticamente rica de contenido de las fuentes de datos y de interfaz de acceso a la
información por parte del usuario. Ese nivel, que denominamos meta-ontológico, permite describir los elementos de las ontologías, las correspondencias entre términos y vistas relacionales y las relaciones intercontológicas. Definimos una ontología
en ese metanivel para poner a disposición de los administradores del sistema toda esa meta-información del sistema. Además en el nivel meta-ontológico definimos clases de preguntas de usuario que permiten desarrollar una técnica complementaria de
procesamiento de preguntas.
La base para implantar el nivel meta-ontológico es la lógica de descripciones SL(D)+VL(D) que definimos a tal efecto. Formalizamos su semántica y definimos un cálculo consistente y completo para los procesos de razonamiento en la lógica.
ALGORITMOS PARA EL PROCESAMIENTO DE CONSULTAS ESPACIALES UTILIZANDO R-TREES. LA CONSULTA DE LOS
PARES MÁS CERCANOS Y SU APLICACIÓN EN BASES DE DATOS ESPACIALES . Autor: CORRAL LIRIA ANTONIO
LEOPOLDO. Año: 2001. Universidad: ALMERIA. Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR. Centro de realización: UNIVERSIDAD DE ALMERÍA.
DEPENDENCIAS FUNCIONALES,IDEAL-OPERADORES NO DETERMINISTAS Y OPERADORES DE SUSTITUCIÓN.
Autor: MORA BONILLA ÁNGEL. Año: 2001. Universidad: MALAGA. Centro de lectura: INFORMÁTICA. Centro de realización: E.T.S.I. INFORMÁTICA.
Resumen: El trabajo de la Tesis estudia los "Fundamentos Lógicos y algebraicos y Aplicaciones a Dependencias Funcionales (DFs) en Bases de Datos (BD) Relacionales" y tiene como objetivo: "Contribuir a una fundamentación rigurosa y al diseño de
técnicas y herramientas eficientes para BDs". Destacamos a continuación las aportaciones que pueden encontrarse en el trabajo:
* Desarrollamos una nueva teoria algebraica que permite enmarcar el estudio de las DFs como un caso particular y sencillo de desarrollos en el marco más general de la teoría de retículos. Este estudio permitirá "disponer de un marco formal
adecuado para dirigir la búsqueda de algoritmos eficientes para los problemas más significativos en el mantenimiento de bases de datos relacionales". A destacar, la introducción, en el marco de la teoría de retículos, de un nuevo concepto de
operador, al que denominamos ideal-operador no determinista que nos permite:
i) Caracterizar el concepto de relación de Armstrong (f-familia), ampliamente utilizado en la bibliografía de BDs.
ii) Obtener como particularizaciones triviales resultados sobre DFs.
iii) Formalizar el concepto de redundancia que extiende el usado en el contexto de BDs.
iv) Formalizar el concepto de cierre minimal como generador mínimo de un operador no determinista.
v) Extender el concepto de esquema y establecer el marco teórico adecuado para el estudio de las claves y anticlaves.
vi) Dar una definición formal de las formas normales.
vii) Disminuir el espacio de búsqueda de las claves minimales de un esquema.
* Introducimos una nueva lógica de DFs reducidas con operadores de sustitución (LdfsN) más adecuada para las aplicaciones que las existentes en la bibliografía. Dos son las características de nuestra lógica sobre la que basamos su adecuación.
i) Contempla en el lenguaje el atributo vacío.
ii) Incluye reglas de sustitución que definen dos operadores de sustitución, para la eliminación eficiente de redundancia en DFs. También es destacable que la regla de transitividad (regla primitiva indiscutible de todos los sistemas
existentes) es una regla derivada en nuestro sistema axiomático.
* Presentamos un algoritmo eficiente que nos permite obtener el generador canónico (conjunto de DFs equivalente y sin redundancia) de un conjunto de DFs.
* Presentamos un algoritmo eficiente para el cálculo de las claves minimales, cuya descripción y propiedades hacen un uso extensivo de los resultados teóricos descritos como primera aportación.
* Introducimos por último, una nueva tecnología para el modelado de datos. Utilizamos LdfsN como base para la construcción de un modelo de datos conceptual para BDs. Presentamos un diagrama de DFs como herramienta para la captura de las
especificaciones de los requerimientos del usario. Introducimos el modelo de datos de alto nivel llamado Atributo/Dependencia. Se han aplicado estas técnicas en: las BDs Heterogéneas y los Sistemas de Información Cooperativos.
ESTUDIO DE ERRORES EN RASTERIZACIÓN DE BASES CARTOGRÁFICAS NUMÉRICAS . Autor: CRUZ GONZÁLEZ JOSE LUIS DE LA. Año: 2001. Universidad: JAEN. Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR. Centro de realización: ESCUELA POLITÉCNICA SUPERIOR DE JAEN.
Resumen: En esta tesis se estudian y reflejan los métodos de predicción de los errores en la transformación rectorial-raster por los autores que anteriormente trabajaron en dicha transformación.
Se parametizaron dos formulaciones mediante el error relativo en área, comparándolas entre si y con los métodos descritos por otros autores, sin conseguir resultados positivos, en bases de datos (B.D.) de distintas morfologías de polígonos.
Se cambian las variables usando como explicativas el número de celdillas frontera y el error en área procedente de la transformación. Se realiza el ajuste conjunto de todas las B.D., y todos los tamaños raster realizados, obteniéndose dos
formulaciones (capacidad de calor y logarctmo natural) superando en la predicción a los métodos anteriores de forma global pero no en su totalidad.
Posteriormente, se realizan ajustes por tamaños que dan lugar a una función potencial, que si logra superar a todos los métodos anteriores. Esta última función es probada en una B.D., distinta de las usadas en el ajuste con resultados
similares. DEFINICIÓN DE ESQUEMAS EXTERNOS EN BASES DE DATOS ODMG . Autor: TORRES GIL MANUEL. Año: 2001. Universidad: ALMERIA
. Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR. Centro de realización: UNIVERSIDAD DE ALMERÍA.
ESTRUCTURACIÓN CONCEPTUAL Y FORMALIZACIÓN TERMINOGRÁFICA DE FRASEMAS EN EL SUBDOMINIO DE LA
ONCOLOGÍA . Autor: MONTERO MARTÍNEZ SILVIA. Año: 2001. Universidad: VALLADOLID. Centro de lectura: FILOSOFIA Y
LETRAS. Centro de realización: FACULTAD DE FILOSOFÍA Y LETRAS.
Resumen: El trabajo está estructurado en cinco capítulos en los que lleva a cabo un análisis crítico de la bibliografía más relevante.
Así, el primer capítulo, La Variación Discursiva: La Dicotomía General-Especialilzado, gira en torno a la supuesta distinción entre lengua general y lengua especializada y las consecuencias que esta contraposición ha tenido tradicionalmente: la
separación entre la disciplina lexicológica/lexicográfica y la terminológica/terminográfica. Se presenta una introducción acerca de estos conceptos y se exponen los nuevos principios formulados desde el ámbito terminológico/terminográfico para
posteriormente postular que no se trata de una disciplina distinta a la lexicología/lexicografía sino que converge en la idea de lexicografía especializada o lexicología terminográfica.
Como consecuencia de este enfoque, en el capítulo segundo, La Lexicografía Especializada o Lexicología Terminográfica: El Enfoque en ONCOTERM, se refleja la nueva situación observada en el trabajo terminográfico en donde se están empezando a
publicar un gran número de trabajos que tratan de aplicar los planteamientos de la lexicografía general a al especializada y viceversa. El objeto principal de este capítulo es enfatizar la aportación que el MLF ha supuesto a la teoría
léxico-terminológia y la práctica léxico-terminográfica al tiempo que profundizamos más en el marco teórico del trabajo que conforma esta tesis.
El tercer capítulo, La Fraseología en Lexicografia y Terminografia: Los Frasemas Terminológicos, parte de la idea de que la fraseología no es una disciplina autónoma, sino un conjunto de unidades poliléxicas cuyo estudio debe ser parte
integrante del trabajo lexicográfico y terminográfico. Antes de precisar la naturaleza de la unidad objeto de análisis, los frasemas terminológicos, ofrecemos los principales enfoques utilizados en el estudio de la fraseología basados en la
naturaleza combinatoria o composicional de las unidades fraseológicas, nombre utilizado para hacer referencia al conjunto de unidades de naturaleza borrosa que fueron identificadas por los lexicólogos rusos a principios del S.XX. A partir del
análisis de algunas de las taxonomías propuestas y del tratamiento que han tenido las colocaciones y los compuestos en productos lexicográficos y terminográficos, se concluye que tanto el enfoque teórico como la práctica tienen muchas limitaciones
debidas fundamentalmente a que tales enfoques parten de posturas meramente distribucionalistas sin ninguna estructuración conceptual subyacente. Concluimos, por tanto, que es necesario buscar una nueva propuesta de estructuración de las unidades
fraseológicas, en particular de los frasemas terminológicos bajo los que englobamos a ls colocaciones y los términos compuestos.
A continuación, el capítulo cuarto, Representación Formal y Reutilización del Conocimiento en el Subdominio Oncológico: ONTOTERM® , muestra un repaso de los sistemas de almacenamiento de información tradicionales, las bases de datos, y los
problemas que éstos plantean a los usuarios a la hora de acceder a la información además de las limitaciones que suponen para el intercambio de la misma. Así, se propone que en el trabajo terminográfico la solución se encuentra en las bases
terminológicas basadas en el conocimiento (Meyer et al. 1990). Estos sistemas implican una estructuración del conocimiento previa y subyacente a la estructuración léxica y además, reúnen los requisitos establecidos por los organismos normalizadores
para garantizar la reutilización e intercambio del conocimiento. En esta línea se enmarca la aplicación utilizada por ONCOTERM, el gestor de base de datos terminológica basado en el conocimiento ONTOTERM®. A partir de la necesidad de precisar el
modo de estructuración conceptual de las unidades fraseológicas en esta aplicación, pasamos al quinto capítulo, Las Frasemas Terminológicos en el Subdominio de la Oncología: Adquisición, Estructuración Conceptual y Formalización Terminográfica, en
donde presentamos y validamos nuestra propuesta a partir de los datos obtenidos de nuestro corpus de trabajo. EVALUACIÓN DE LA CALIDAD DE LOS PUNTOS DE ACCESO EN BASES DE DATOS BIBLIOGRÁFICAS
. Autor: ZAPICO ALONSO FELIPE FRANCISCO. Año: 2001. Universidad: SALAMANCA. Centro de lectura: TRADUCCIÓN Y DOCUMENTACIÓN. Centro de realización: FACULTAD DE TRADUCCIÓN Y DOCUMENTACIÓN.
Resumen: En primer lugar se hace un estudio acerca del nombre propio desde varios puntos de vista, principalmente el lingüístico, el jurídico y el documental.
A continuación se estudian los puntos de acceso nominales y los errores más frecuentes en las bases de datos bibliográficas. Se establecen los indicadores de calidad y se estudian los catálogos de la Library of Congress, de la Bibliothèque
National de France y de la Biblioteca Nacional de España.
Se comparan los registros con los códigos catalográficos específicos de esos países, las AACR2R, AFNOR y las Reglas Españolas de Catalogación.
En todo momento este estudio se realiza desde el punto de vista del usuario en un entorno global de acceso a la información.
Se localizan los errores de los que se extraen unas concluisiones en las que se pone de manifiesto la inconsistencia de los códigos catalográficos en un entorno global.
A la vista de las conclusiones se realizan una serie de recomendaciones de cara a solucionar cada uno de los problemas encontrados. EXTRACCION AUTOMATICA DE CONOCIMIENTO EN BASES DE DATOS . Autor: RODRIGUEZ MORENO ANDRES. Año: 2000. Universidad: MALAGA
. Centro de lectura: INFORMATICA. Centro de realización: ESCUELA TECNICA SUPERIOR DE INGENIERIA INFORMATICA DE MALAGA.
Resumen: En la Tesis se han abordado problemas relacionados con la aplicación de técnicas de minería de datos para la extracción automática de conocimiento en casos dónde las estrategias actuales no eran aplicables. Las
principales aportaciones realizadas se organizan en tres puntos.
Se ha desarrollado un algoritmo eficiente para la extracción de reglas asociativas de bajo soporte. Esta aportación permite aplicar esta técnica de minería a ciertos conjuntos de datos complejos, los cuales eran intratables en términos prácticos
hasta ahora.
Por otro lado, se ha propuesto un método para evaluar la significación estadística de semejanzas en estructuras tridimensionales de proteínas tras la aplicación de algoritmos de búsqueda por comparación, que permitirá realizar búsquedas
intensivas y automáticas de patrones localizando o identificando los parecidos estructurales relevantes.
Se ha diseñado un modelo de descripción del contenido de vídeo científico que permite el acceso y análisis de esta información. Con esta aportación se ofrece la oportunidad de aplicar técnicas de minería a unos datos que han sido ignorados hasta
ahora debido a su carácter no estructurado.
Estos desarrollos se han aplicado a conjuntos de datos biológicos de diferente complejidad: secuencias, estructuras tridimensionales y videos, demostrando su validez y utilidad en un dominio de aplicación real.
Estas aportaciones permiten abordar problemas de extracción de conocimiento en dominios de aplicación científica muy interesantes y actuales como el análisis de información producida en proyectos del tipo "genoma humano" y nos abren el camino a
nuevas oportunidades de desarrollo en el tratamiento de video.
| 75 tesis en 4 páginas: 1 | 2 | 3 | 4 |
|
|
|