Cibernetia > Tesis doctorales
Google
Web www.cibernetia.com

Índice > LINGUISTICA > LINGUISTICA APLICADA >

TRADUCCION AUTOMATICA



20 tesis en 1 páginas: 1
  • IR-N UN SISTEMA DE RECUPERACIÓN DE INFORMACIÓN BASADO EN PASAJES .
    Autor: LLOPIS PASCUAL FERNANDO.
    Año: 2002.
    Universidad: ALICANTE.
    Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR.
    Centro de realización: UNIVERSIDAD DE ALICANTE.
    Resumen: En este trabajo se ha presentado un nuevo modelo de Recuperación de Información basado en pasajes. A este sistema se le ha denominado IR-.n. El principal objetivo de los sistemas de RI es localizar los documentos que son relevantes a una pregunta. Para determinar esta relevancia los sistemas de RI buscan los términos de la pregunta dentro del documento y posteriormente utilizan unas métricas adicionales para valorar dichar relevancia. Los sistemas de RI basados en pasajes (RP) realizan dicha búsqueda en unos fragmentos de texto contiguo denominados pasajes. El sistema IR-n define un nuevo modelo de pasajes y una serie de métricas que permiten mejorar la eficacia del proceso. La evaluación del sistema IR-n se realizó en las conferencias CLEF. El sistema IR-n, es un modelo de RP, que diferencia claramente del resto, principalmente, por la unidad que utiliza para definir los pasajes en los que se divide el documento: la frase. Se han analizado las ventajas que supone el uso de la frase como unidad de definición de los paisajes, dentro de la problemática de la RI. Las principales son: * Los límites que definen una frase dentro de un documento se pueden obtener fácilmente aunque no se disponga de marcas en el documento que las identifiquen. * Los pasajes generados en base a un número de frases, están dotados de entidad sintáctica. Esta característica ha sido de gran utilidad en el uso del sistema como paso previo a la aplicación de un sistema de Búsqueda de Respuestas (BR). * Permiten incorporar de forma sencilla el concepto de solapamiento en la definición de los pasajes. * Permite valorar, en el cálculo de relevancia, el hecho de que los términos que forman la pregunta aparezcan en una misma unidad como es la frase. Las principales aportaciones de este trabajo son las siguientes: * Estudio y clasificación de los sistemas de RI más importantes. * Propuesta de un nuevo modelo de RP. * Evaluación del sistema IR-n ent areas de RI y BR.
  • TÉCNICAS DE AGRUPAMIENTO BILINGÜE APLICADAS A LA INFERENCIA DE TRADUCTORES .
    Autor: BARRACHINA MIR SERGIO.
    Año: 2002.
    Universidad: JAUME I DE CASTELLON.
    Centro de lectura: TECNOLOGÍA Y CIENCIAS EXPERIMENTALES .
    Centro de realización: ESCUELA SUPERIOR DE TECNOLOGÍA Y CIENCIAS EXPERIMENTALES.
    Resumen: La tesis presenta un método de agrupamiento bilingüe que puede utilizarse para la mejora de sistemas de traducción automática basados en ejemplos. Este método de agrupamiento es una extensión del caso monolingüe y es mejorado mediante la detección automática de colocaciones -secuencias de palabras que se traducen como una unidad-. Asimismo, presentamos una técnica para la integración de este agrupamiento con un sistema de traducción basado en ejemplos, el modelo de transductores subsecuenciales, y los resultados de traducción obtenidos. Los asuntos que tratan son: * Agrupamiento monolingüe * Agrupamiento bilingüe * Integración del agrupamiento bilingüe en transductores subsecuenciales * Detección automática de colocaciones * Mejora del agrupamiento bilingüe mediante colocaciones * Experimentación con las tareas de traducción EuTrans I y EuTrans II
  • COMPILADORES DE DATOS LINGÜÍSTICOS PARA LA GENERACIÓN DE MÓDULOS DE ESTADOS FINITOS PARA LA TRADUCCIÓN AUTOMÁTICA .
    Autor: GARRIDO ALENDA ALICIA.
    Año: 2001.
    Universidad: ALICANTE.
    Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR.
    Centro de realización: ESCUELA POLITÉCNICA SUPERIOR.
    Resumen: En esta tesis se presentan técnicas para generar sistemas de traducción automática entre dos lenguas a partir de los datos lingüísticos correspondientes, especificados en su formato determinado, y los programas informáticos que los procesan. Los sistemas de traducción automática generados con estas técnicas están basados en transductores de letras, transductores de estados finitos que son una alternativa razonable a los transductores P-Subsecuenciales. En esta tesis se muestra cómo se transforman los diccionarios que contienen los datos lingüísticos en transductores de letras, cómo se minimizan y cómo se realiza el mantenimiento incremental de estos diccionarios a través de sus respectivos transductores de letras mínimos. También se describen los módulos que forman el sistema de traducción automática y su funcionamiento.
  • DESAMBIGUACIÓN LÉXICA MEDIANTE MARCAS DE ESPECIFICIDAD .
    Autor: MONTOYO GUIJARRO JUAN ANDRÉS.
    Año: 2001.
    Universidad: ALICANTE.
    Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR.
    Centro de realización: ESCUELA POLITÉCNICA SUPERIOR.
    Resumen: Esta Tesis presenta un método para resolver la ambigüedad léxica pura (semántica) en textos de dominios no restringidos en cualquier lengua que tenga un repositorio de sentidos organizado como una base de conocimiento léxica. A este método de resolución de la ambigüedad léxica pura propuesto se denomina Método de Marcas de Especificidad y se basa en el uso de conocimiento lingüístico (información léxica y morfológica) y de conocimiento a partir de las relaciones léxicas y semánticas de la taxonomía de nombres de la base de conocimiento léxica WordNet. Además, se presenta la aplicación del método de Marcas de Especificidad con el objetivo de enriquecer semánticamente WordNet con etiquetas de dominio o categorías de otros sistemas de clasificación. Las principales aportaciones de esta Tesis son: * La definición de la noción de Marca de Especificidad, la cual formaliza la relación entre sentidos que se basan en taxonomías. La Marca de Especificidad se aprovecha de la información suministrada por las relaciones de sinonimia, hiperonimia. Aunque en esta Tesis se ha utilizado para nombres, se puede adecuar para trabajar con verbos. Con la utilización de las Marcas de Especificidad se aporta una noción como base para la desambiguación del sentido de las palabras, los cuales están unidos a través de conceptos en las taxonomías. Además, la aplicación de esta noción no requiere desambiguación manual previa para aplicarse. * La definición de un método basado en las Marcas de Especificidad, el cual utiliza el paradigma de los métodos basados en conocimiento, y en concreto que suministra la base de conocimiento léxica WordNet. Debido a las características de las Marcas de Especificidad, se ha diseñado un método que desambigua nombres de un texto libre según estén organizados los sentidos de las palabras en la taxonomía. Por tal motivo, este método puede aplicarse a textos de diferentes idiomas sin realizar adaptaciones del mismo, siempre que tenga un WordNet. * La definición de un conjunto de heurísticas para mejorar la propuesta del método inicial, que denominamos método Marcas de Especificidad. Estas heurísticas utilizan el conocimiento suministrado por WordNet, como son el synset y la glosa en su idioma, por lo tanto también pueden aplicarse a textos de diferentes idiomas sin realizar adaptaciones. * El diseño y desarrollo de una interfaz para implementar el método Marcas de Especificidad. Esta interfaz puede ser ejecutada desde cualquier ordenador que tenga acceso a Internet y que acceda a la dirección http://gplsi.dlsi.ua.es/wsd. * El entrenamiento y ajuste del método Marcas de Especificidad implementado. Para ello el método se ha validado y ajustado con el objetivo de estudiar su efectividad mediante un trabajo experimental dividido en tres experimentos. El experimiento 1 del capítulo Experimentación consiste en comprobar el funcionamiento del método cuando se aplica solamente la noción de Marca de Especificidad. El experimento 2 consiste en comprobar que al complementar el método con un conjunto de heurísticas, estas aportan mejores porcentajes de desambiguación y por lo tanto mejoran el método. Y el experimento 3 consiste en analizar y definir la ventana óptima de contexto para obtener la mejor desambiguación. Con estos tres experimentos se consigue que el método desambigue los sentidos de las palabras sobre WordNet con una "precisión" del 67,1%, una "cobertura" del 66,2% y una "cobertura absoluta" del 98,5%. * La comparación del método de Marcas de Especificidad con otros métodos de WSD y su evaluación final. Se ha realizado una comparación directa e indirecta del método mediante dos experimentos. En el experimento 4 del capítulo Experimentación se realiza una comparación con métodos basados en el conocimiento, es decir métodos WSD que pertenecen a la misma clasificación que el propuesto en esta Tesis. Y en el experimento 5 se realiza una comparación entre el método propuesto y uno basado en corpus, concretamente en un modelo probabilístico que utiliza el principio de Máxima Entropía. A partir de esta comparación y comprobar los resultados obtendios, podemos probar que el método de Marcas de Especificidad es útil para desambiguar el sentido de las palabras, ya que se han obtenido mejores resultados que otros métodos basados en conocimiento, y en concreto el conocimiento que suministra la base de conocimiento léxica WordNet. Para la evaluación final del método Marcas de Especificidad se han realizado dos experimentos. El experimento 6 consiste en participar con el método en la competición de sistemas de WSD denominada Senseval-2 para los nombres seleccionados por el comité en la tarea de "lexical sample" tanto para inglés como para español. Y el experimento 7 consiste en evaluar al método cuando se aplica con las heurísticas actividades en cascada o secuencialmente y cuando se aplican independientemente unas de otras, y en ambos casos sobre todos los documentos del hábeas SemCor. * La definición de un método para enriquecer semánticamente el recurso léxico WordNet con categorías o clases de otros sistemas de clasificación, mediante la aplicación del método de Marcas de Especificidad. El sistema de clasificación utilizado para etiquetar automáticamente los synsets de WorldNet ha sido IPTC Subject Reference System. El recurso léxico WordNet, también muy utilizado en PLN, presenta una división de los sentidos de las palabras con demasiado detalle (en inglés conocido como fine-grained). Por eso, las categorías, como Agriculture, Health, etc., aportan una forma más adecuada para diferenciar los sentidos de las palabras. Por lo tanto para tratar y resolver este problema asociado a WordNorte, se define y describe un método automático para enriquecer semánticamente WordNet versión 1.6., con las categorías utilizadas en el sistema de clasificación IPTC. * El diseño y desarrollo de la interfaz construida para extender y mejorar la base de datos léxica WordNet con categorías del sistema de clasificación. Gracias al desarrollo de esta interfaz se han podido utilizar los experimentos para evaluar la efectividad del método propuesto para enriquecer WordNet. Como resultado se obtuvo una "cobertura absoluta" del 93,7%, una "precisión" del 95,7% y una "cobertura del 89,8%. Como conclusión final indicaremos que en esta Tesis hemos estudiado dos métodos, uno aplicado a la desambiguación del sentido de las palabras para textos no restringidos en cualquier idioma que tenga un WordNet particular y otro aplicado al enriquecimiento de WordNet con categorías de sistemas de clasificación. En ambos métodos los resultados obtenidos son satisfactorios y consideramos que el método de Marcas de Especificidad es útil para WSD y el de enriquecimiento de WordNet es útil para mejorar y extender la base de datos léxica WordNet con categorías de los sistemas de clasificación.
  • RESOLUCIÓN Y GENERACIÓN DE LA ANÁFORA PRONOMINAL EN ESPAÑOL E INGLÉS EN UN SISTEMA INTERLINGUA DE TRADUCCIÓN AUTOMÁTICA .
    Autor: PERAL CORTÉS JESÚS.
    Año: 2001.
    Universidad: ALICANTE.
    Centro de lectura: ESCUELA POLITÉCNICA SUPERIOR.
    Centro de realización: UNIVERSIDAD DE ALICANTE.
    Resumen: En este trabajo se ha presentado una aproximación de un sistema interlingua de Traducción Automática que lleva a cabo la resolución de la anáfora pronominal originada por los pronombres personales de tercera persona en español e inglés y su posterior generación en el idioma destino. El sistema, al que hemos denominado AGIR (Anaphora Generation with an Interlingua Representation), utiliza una serie de fuentes de información lingüística (léxicas, morfológicas, sintácticas y semánticas) en los módulos de análisis y generación del mismo. Concretamente, estas fuentes de información se utilizan en las etapas de análisis, la representación interlingua del texto origen. El módulo de generación recibe como entrada la representación interlingua (en la que se incluye la información lingüística) y, tras las etapas de generación sintáctica y morfológica, realiza la correcta generación de la anáfora pronominal en el idioma destino (español o inglés). Gracias al uso de información no dependiente del dominio, el sistema AGIR es capaz de resolver y generar las anáforas pronominales en textos no restringidos de cualquier dominio. Las principales aportaciones de este trabajo son las siguientes: 1,- La propuesta general de un sistema interlingua de Traducción Automática. 2,- La construcción de los correspondientes módulos de análisis para inglés y español en AGIR. 3,- La construcción de los correspondientes módulos de generación para inglés y español en AGIR. En estos módulos nos hemos centrado exclusivamente en la generación de la anáfora pronominal y cero pronombres en el idioma destino. Para llevar a cabo esta tarea se ha desarrollado un estudio profundo sobre las diferencias (discrepancias) entre español e inglés en cuanto al tratamiento de los pronombres. Este estudio nos permitirá realizar una correcta generación de las expresiones anafóricas en el idioma destino. 4,- La evaluación global del sistema AGIR. Para ello se realizó una evaluación independiente de las distintas tareas llevadas a cabo en el sistema global y que conducen a la tarea final: la generación de la anáfora pronominal en el idioma destino.
  • EXPLOTACION DE CORPUS PARALELOS ALINEADOS PARA EL DESARROLLO DE ENTORNOS DE COMPOSICION DE DOCUMENTOS ESTRUCTURADOS BILINGUES .
    Autor: CASILLAS RUBIO ARANTZA.
    Año: 2000.
    Universidad: DEUSTO.
    Centro de lectura: INFORMATICA.
    Centro de realización: DEUSTO.
    Resumen: La IA(Inteligencia Artificial) es un area que abarca conocimiento de muy diverso tipo y en la que, por su naturaleza interdisciplinar, se produce la convergencia de tecnicas muy diferentes. Entre las muchas aplicaciones de la IA existe una antigua y destacada, pero que se resiste a su resolucion, es el PLN (Procesamiento del Lenguaje Natural) y dentro de ese particularmente la traduccion entre textos en diferentes idiomas. Esta tesis se enfrenta de una manera realista a este problema abordandolo en su vertiente mas viable. Tiene como principal caracteristica la convergencia de diferentes tecnicas y la puesta es practica de una manera novedosa. Concretamente esta tesis aborada el tema de la composicion de documentacion especializada multilingue. Se propone una metodologia de composicion que combina diversas areas de gran actualidad dentro del PLN como son: el tratamiento de corpus, el procesamiento de documentos estructurados, los lenguajes de etiquetado, la traduccion automatica y la generacion multilingue. Con esta metodologia se crean, a partir de un corpus alineado, recursos linguisticos, memorias de traduccion y estructuras de tipo de documento, para posteriormente utilizarlos en la composicion de documentacion similar. Para llevar a la practica la metodologia propuesta es necesario desarrollar diferentes algoritmos, algunos de ellos innovadores, tanto para el tratamiento de documentos estructurados SGML,-Standard Generalize markup Languaje- como para la manipulacion y creacion de memorias de traduccion a partir de corpus alineados. A lo largo de esta memoria se justifica que SGML, es el lenguaje de etiquetado mas apropiado para anotar documentos estructurados pertenecientes a un dominio especifico que posteriormente se vayan a utilizar como base para la composicion de documentacion similar. Para demostrar la eficacia de la metodologia propuesta se ha desarrollado un prototipo de editor bilingüe que hemos llamado BiGentor. En este editor se incluyen todos los algoritmos desarrollados y se combinan adecuadamente para conseguir componer documentos bilingues pertenecientes al dominio juridico-administrativo. La evaluacion de la metodologia y los algoritos propuestos se ha llevado a cabo sobre un corpus paralelo bilingüe en castellano y euskera pertenciente al dominio juridico-administrativo. Una de las ventajas de nuestra propuesta es que la calidad de las partes del texto generadas es grande, tanto en el documento origen como en la meta, ya que se componen a partir de textos similares creados con anterioridad por expertos humanos. Se puede concluir diciendo que nuestra metodologia es valida para aquellos documentos que son estructurados y estan escritos parcialmente o en su totalidad con lenguaje de especialidad.
  • THE ANALYSIS OF VERBAL LEXICAL ITEMS AND TRANSLATION MISMATCHES IN ENGLISH AND SPANISH: A THEORETICAL FRAMEWORK .
    Autor: FERNANDEZ MONTRAVETA ANA M..
    Año: 1999.
    Universidad: AUTONOMA DE BARCELONA.
    Centro de lectura: FILOSOFIA Y LETRAS.
    Centro de realización: UNIVERSIDAD BARCELONA.
    Resumen: Nuestra intención al escribir esta tesis ha sido crear un modelo teorico del conocimiento linguistico susceptible de ser formalizado, y que de esta manera permita el tratamiento computacional del componente lexico. Una de las premisas subyocentes a nuestro modelo en la creencia de que los sintaxis y la semantica no pueden separarse y que mediante la descripcion de la relacion entre estos dos elementos se ha adquirido un alto grado de abstraccion que no hubiera sido posible de otra manera. Con el fin de establecer un vinculo entre estos dos elementos se ha propuesto una revision del termino alternancia de dietesis que se utiliza para relacionar semanticamente estructuras sintacticas. Asimismo se ha trabajado con diferentes lenguas, entre otros motivos porque creemos que el analisis interlinguistico es de utilidad para definir los parametros pertinentes en la descripcion del lenguaje en un modo mas general.
  • IMPLEMENTACIÓN DE UN ANALIZADOR ORIENTADO AL LEXICÓN PARA EL TRATAMIENTO DE LA AMBIGÜEDAD LÉXICA DENTRO DEL MARCO DE LA TRADUCIÓN AUTOMÁTICA .
    Autor: PERIÑÁN PASCUAL JOSÉ CARLOS .
    Año: 1999.
    Universidad: NACIONAL DE EDUCACION A DISTANCIA.
    Centro de lectura: FILOLOGÍA.
    Centro de realización: UNED.
    Resumen: La presente tesis doctoral describe la motivación, fundamentación e implementación de TRADUNED, un prototipo experimetal de analizador orientado al lexicón dentro del marco de la traducción automática,utilizando como aducto textos que contienen instrucciones de uso de determinados productos de peluquería y cosmética. TRANUDE debe extraerse el texto original en inglés toda la información lingüística necesaria que le permita identificar el sentido correcto de cada palabra lexemática ambigua, a partir de las relaciones sintagmáticas y paradigmáticas establecidas entre las unidades léxicas del texto de entada. El componente léxico de TRADUNED se formaliza en un conjunto de bases de datos relacionales construidas principalmente a partir de los textos definitorios de Collins Cobuild English Language Dictionay 1987, y utilizando la gramática de enfoque semántico de RMW Dixon 1991 como componente auxiliar. La mayor aportación de nuestro lexicón se podría definir como la construcción de un componente semántico fuerte implementado en una base de datos léxica enriquecida. Disponemos de un componente léxico más potente que una simple base de datos léxica, al permitir la utilización de generalizaciones y la interrelación de los sentidos del lexicón por medio de las listas de densidad semántica, pero nuestro diseño es menos complejo que el de una base de conocimiento, ya que no es necesario construir un modelo ontológico ni definir un grupo restringido de primitivos semánticos que funcionen como conceptos ontológicos. Otra de las aportaciones de TRADUNED se materializa en forma de fichas de desambigüización léxica, en las cuales no sólo se determina el sentido más apropiado de una palabra ambigua, sino que además se describe el proceso de azonamiento por el cual se ha tomado esa decisión.
  • REDES NEURONALES RECURRENTES PARA INFERENCIA GRAMATICAL Y TRADUCCION AUTOMATICA.
    Autor: CASTAÑO ALVAREZ ASUNCION.
    Año: 1997.
    Universidad: POLITECNICA DE VALENCIA.
    Centro de lectura: INFORMATICA.
    Centro de realización: DEPARTAMENTO: SISTEMAS INFORMATICOS Y COMPUTACION PROGRAMA DE DOCTORADO: RECONOCIMIENTO DE FORMAS E INTELIGENCIA ARTIFICIAL.
    Resumen: Actualmente, las Redes Neuronales Artificiales constituyen un área de gran interés desde la perspectiva de la ingeniería. Uno de los atractivos de las redes neuronales artificiales, o simplemente Redes Neuronales (RNs), radica en su habilidad para resolver problemas en los que aparecen dependencias temporales, llevándonos esto último a las llamadas Redes Neuronales Recurrentes (RNRs). El objetivo principal de la tesis consiste en demostrar empíricamente la capacidad de estas RNRs para resolver tareas específicas dentro del campo de la Inferencia Gramatical (IG), así como para abordar problemas de Traducción Automática (TA) entre lenguajes y de un caso particular de ésta como es la Comprensión del Lenguaje (CL), siguiendo planteamientos adecuados. Las arquitecturas conexionistas han demostrado ser capaces, tanto de abordar tareas de IG como de captar las regularidades estadísticas implícitas en los datos de entrada. Cabe pensar, por lo tanto, que las redes neuronales pudieran ser un medio adecuado para la inducción de Gramáticas Regulares Estocásticas (GRES), planteamiento que se demuestra empíricamente en este trabajo. Por otro lado, en la tesis se propone un traductor semántico conexionista sencillo que aborda tareas de CL en dominios restringidos a partir de ejemplos, que resuelve la componente temporal asociada tanto a la frase de entrada como al significado de salida de la misma y que aprende, además, las características sintácticas y semánticas implícitas en la tarea de comprensión. Finalmente, se plantea el diseño de un traductor conexionista similar para abordar directamente traducciones texto-a-texto entre dos lenguajes naturales sin necesidad de tener que pasar por un lenguaje semántico intermedio (interlingua), resolviendo además de manera transparente la posible no secuencialidad existente entre los lenguajes implicados en el proceso de traducción.
  • INFERENCIA INDUCTIVA DE TRANSDUCTORES SUBSECUENCIALES Y APLICACION A TAREAS DE COMPRENSION DEL LENGUAJE Y TRADUCCION AUTOMATICA.
    Autor: CASTELLANOS LOPEZ ANTONIO.
    Año: 1997.
    Universidad: POLITECNICA DE VALENCIA.
    Centro de lectura: INFORMATICA.
    Centro de realización: DEPARTAMENTO: SISTEMAS INFORMATICOS Y COMPUTACION PROGRAMA DE DOCTORADO: RECONOCIMIENTO DE FORMAS E INTELIGENCIA ARTIFICIAL.
    Resumen: En la presente Tesis Doctoral se ha caracterizado formalmente la familia de Transductores Subsecuenciales mínimos. También se han proporcionado algoritmos para el cálculo de máximos prefijos comunes de los estados y para el cálculo del adelantamiento de un prefijo en un estado. Por otra parte, se ha desarrollado un algoritmo de inferencia de Transductores Subsecuenciales que en ningún caso requiere unas muestras concretas para identificar la transducción subsecuencial correspondiente. A continuación, se ha estudiado la inferibilidad en promedio de Transductores Subsecuenciales que constituyan buenas aproximaciones a otros transductores dados, uniformemente distribuidos. Finalmente, se ha estudiado la aplicabilidad de la inferencia de Transductores Subsecuenciales a tareas de Comprensión del Lenguaje y de Traducción Automática en dominios limitados. Particularmente, ha interesado su aplicación a la comprensión y traducción de Texto con errores y del Habla Continua.
  • TRADUCCION AUTOMATICA EN DOMINIOS RESTRINGIDOS: ALGUNOS MODELOS SUSCEPTIBLES DE SER APRENDIDOS A PARTIR DE EJEMPLOS.
    Autor: PRAT VILAR FEDERICO.
    Año: 1997.
    Universidad: POLITECNICA DE VALENCIA.
    Centro de lectura: INFORMATICA.
    Centro de realización: DEPARTAMENTO: SISTEMAS INFORMATICOS Y COMPUTACION PROGRAMA DE DOCTORADO: RECONOCIMIENTO DE FORMAS E INTELIGENCIA ARTIFICIAL.
    Resumen: La asociación de gramáticas introducidas por Vidal, Pieraccini y Levin en 1993 es una técnica que permite atacar el problema de la traducción automática mediante una aproximación inductiva. El presente trabajo es un paso encaminado a subsanar lo que nos parece una explotación insuficiente de una técnica prometedora. La idea central de la técnica radica en llevar a cabo el proceso de traducción automática como la búsqueda de la derivación óptima en una gramática ponderada, los pesos de cuyas reglas dependen de qué reglas hayan sido utilizadas para analizar (mediante otra gramática) la frase de entrada. Por lo tanto, la técnica requiere dos clases de modelos: 1) Modelos de lenguaje, es decir, una gramática del lenguaje de entrada y otra del lenguaje de salida; 2) Un modelo de asociación (de esas gramáticas) que permita asignar un peso a cada regla de salida a partir de la derivación de la frase de entrada. En el estudio llevado a cabo en nuestro trabajo hemos intentado por una parte, inscribir la asociación de gramáticas dentro de un marco estocástico riguroso. Por otra, hemos explorado la utilización de modelos de asociación diferentes de los anteriormente empleados en otros trabajos, comparando sus resultados. Además, hemos probado la conveniencia de introducir ciertas variantes en el aprendizaje de los modelos de lenguaje y en el proceso de búsqueda de la derivación óptima en el modelo de lenguaje de salida. Nuestra labor experimental sobre un par de tareas sintéticas de traducción automática en dominios restringidos nos permite comparar nuestros resultados (favorablemente en muchos casos) con los obtenidos en condiciones similares por una amplia variedad de otras técnicas.
  • CONTROLLED SUBJECTS IN SPANISH AND OTHER "NON-STRICTLY LOCAL" BOUNDED DEPENDENCY CONSTRUCTIONS.
    Autor: VILLEGAS MONTSERRAT MARTA.
    Año: 1997.
    Universidad: POLITECNICA DE CATALUÑA.
    Centro de lectura: MATEMATICAS.
    Resumen: Esta tesis investiga las construcciones de dependencia con elementos referenciales dentro del marco de la '&>ñ (Head Driven Phrase Structure Grammar). Esencialmente la tesis investiga las implicaciones que se derivan del componente estructural de la teoría de la HPSG. HPSG nació con fuerza como la herencia directa y mezcolanzade las más recientes y significativas tendencias dentro de la linguística teórica y computacional. El extraordinario poder expresivo y las grandes posibilidades 'computacionesl' que su formalismo ofrece, hacen que, muy pronto, el peso del formalismo prevalezca sobre la propia teoría y sus principios fundamentales. Esta tesis pretende demostrar que lenguas románicas como el español plantean serios problemas a principios básicos de la teoría linguística como la teoría del lingamiento o el dominio de las relaciones de subcategorización. Tras un análisis detallado y comparativo, llegamos a la conclusión de que HPSG puede realmente ofrecer una explicación y análisis satisfactorios si escapamos de propuestas mecanicistas que derivan y condicionan los principios de la teoría al aparato formal. En esta tesis proponemos ligeros cambios en el formalismo que nos permiten dar un análisis descriptivo y explicativo de las relaciones de dependencia con elementos referenciales acordes con la propia teoría.
  • DISEÑO E IMPLEMENTACIÓN DE UN LEXICÓN COMPUTACIONAL PARA LA LEXICOGRAFÍA Y LA TRADUCCIÓN AUTOMÁTICA .
    Autor: MORENO ORTÍZ ANTONIO JESÚS.
    Año: 1997.
    Universidad: CORDOBA.
    Centro de lectura: FILOSOFÍA Y LETRAS .
    Resumen: El objeto fundamental de este trabajo es la creación de una base de datos léxica enfocada a su aplicación a la lexicografía computacional y a la traducción automática (TA). Dicho lexicón toma como base un cuerpo de información lexicográfica obtenido mediante la aplicación del modelo lexemático-funcional. Dos parámetros importantes que guían el diseño del modelo de lexicón computacional que proponemos son la multifuncionalidad (es decir, la aplicación del repositorio de información a diversas tareas) y la reutilización (garantizar la compatibilidad con otros sistemas de información. Para mostrar la adecuación del diseño a aplicaciones complejas de TA introducimos un interfaz a una base de conocimiento que utiliza un esquema de representación distinto al de la base de datos y mostramos como ambas fuentes de información pueden ser usadas de forma conjunta en una aplicación de Traducción Automática Basada en el Conocimiento, el enfoque a la TA que defendemos en el siguiente trabajo.
  • LAS ESTRUCTURAS CONCEPTUALES Y LAS FUNCIONES LEXICAS EN EL AMBITO DE LA TRADUCCION AUTOMATICA: ELEMENTOS RELACIONABLES DEL LEXICON .
    Autor: ZARCO TEJADA M. ANGELES.
    Año: 1994.
    Universidad: CADIZ.
    Centro de lectura: FILOSOFIA Y LETRAS.
    Centro de realización: DEPARTAMENTO: FILOLOGIA FRANCESA E INGLESA PROGRAMA DE DOCTORADO: FILOLOGIA FRANCESA E INGLESA 1991/1993.
    Resumen: ESTUDIAMOS UN TIPO DE ESTRUCTURA, LAS COLOCACIONES, EN EJEMPLOS DE ITALIANO, INGLES Y ESPAÑOL, QUE PRESENTAN DOS CARACTERISTICAS ESPECIFICAS: EN PRIMER LUGAR, SON FORMAS VERBALES COMPLEJAS QUE SE CORRESPONDEN SEMANTICAMENTE CON FORMAS VERBALES SIMPLES Y EN SEGUNDO LUGAR, PRESENTAN UNA FUERTE RESTRICCION LEXICA. PARA RESOLVER ESTE PROBLEMA ESTRUCTURAL Y DE DEPENDENCIA, PLANTEAMOS LA REPRESENTACION DE AMBOS NIVELES (SINTAGMATICO Y PARADIGMATICO) EN UN LEXICON DE UN SISTEMA DE TRADUCCION AUTOMATICA, A TRAVES DE LAS ESTRUCTURAS CONCEPTUALES Y LAS FUNCIONES LEXICAS, ASI COMO RELACIONAMOS AMBAS CONCEPTUALIZACIONES A TRAVES DE LA ESTRUCTURA ARGUMENTAL Y LAS RELACIONES TEMATICAS. DESCRIBIMOS ASI MISMO UN NUEVO TIPO DE FUNCION LEXICA, OPER 1-2, Y DEFINIMOS LOS SUBINDICES DE LAS FUNCIONES. DE ESTA MANERA DAMOS SOLUCION A PROBLEMAS DE TRADUCCION QUE SE PRODUCEN ENTRE FORMAS DE ITALIANO, INGLES Y ESPAÑOL.
  • LAS COLOCACIONES DE NOMBRE Y ADJETIVO. UN PASO HACIA UNA TEORIA SEMANTICA DE LA TRADUCCION.
    Autor: AGUILAR AMAT CASTILLO ANA DE.
    Año: 1993.
    Universidad: AUTONOMA DE BARCELONA.
    Centro de lectura: FILOSOFIA Y LETRAS.
    Centro de realización: DEPARTAMENTO: FILOLOGIA ESPAÑOLA PROGRAMA DE DOCTORADO: INFORMATICA Y LINGUISTICA.
    Resumen: LA TESIS TRATA SOBRE LA EXISTENCIA DE VINCULOS ENTRE LAS PALABRAS DE UNA LENGUA QUE SE MANIFIESTAN EN SUS ESTRUCTURAS SINTAGMATICAS CARACTERISTICAS. SE DEFINE A DICHOS VINCULOS CON EL NOMBRE DE "COOCURRENCIAS", Y A LAS ESTRUCTURAS EN QUE SE MANIFIESTAN CON EL NOMBRE DE "COLOCACION". LA RESEÑA LEXICOGRAFICA DE LAS COLOCACIONES PERMITE SOLUCIONAR PROBLEMAS DESCRIPTIVOS Y DE TRADUCCION, SIENDO DE GRAN IMPORTANCIA EN EL PROCESO DE SELECCION LEXICA EN TRADUCCION AUTOMATICA. ASIMISMO SE PROPONE UNA CLASIFICACION DEL NOMBRE Y DEL ADJETIVO EN VIRTUD DE SUS RELACIONES COLOCACIONALES, LA CUAL PERMITE GENERAR OTRAS COLOCACIONES POR TRANSFORMACION, Y TAMBIEN CONTROLAR LA ANTEPOSICION Y POSPOSICION DEL ADJETIVO.
  • ASPECTES DEL SINTAGMA NOMINAL EN CATALA DES DE LA PERSPECTIVA DE LA TRADUCCIO AUTOMATICA.
    Autor: BADIA CARDUS ANTONI.
    Año: 1991.
    Universidad: POLITECNICA DE CATALUÑA.
    Centro de lectura: INGENIEROS INDUSTRIALES .
    Centro de realización: INSTITUTO DE CIENCIAS DE LA EDUCACION DE LA UNIVERSIDAD POLITECNICA DE CATALUÑA. .
    Resumen: LA TESIS "ASPECTES DEL SINTAGMA NOMINAL EN CATALA DES DE LA PERSPECTIVA DE LA TRADUCCIO AUTOMATICA" PRESENTA DIVERSOS ASPECTOS DEL SINTAGMA NOMINAL CATALAN, CENTRANDOSE EN TRES TEMAS FUNDAMENTALES: EL NOMBRE NUCLEO DEL SINTAGMA, LOS COMPLEMENTOS DEL NOMBRE Y LOS DETERMINANTES. CADA UNO DE ESTOS TEMAS ESTA ENFOCADO TENIENDO EN CUENTA LOS TRABAJOS LLEVADOS A CABO EN EL CAMPO DE LA SEMANTICAFORMAL, DE MANERA QUE RESULTE DE ELLO UN TRATAMIENTO DEL SINTAGMA NOMINAL EN CATALAN UTIL PARA LA TRADUCCION AUTOMATICA. ESTE ENFOQUE ESTA MOTIVADO POR EL HECHO DE QUE LAS DISTINCIONES QUE SON RELEVANTES PARA TRADUCIR SINTAGMAS NOMINALES DEL CATALAN A OTRAS LENGUAS NO SON ASUMIBLES A PARTIR DE LA INFORMACION PURAMENTE ESTRUCTURAL DEL SINTAGMA; UNICAMENTE EN EL NIVEL SEMANTICO APARECEN LAS CLASIFICACIONES NECESARIAS. CUANDO TRATAMOS EL NOMBRE SE PRESENTAN LAS CARACTERISTICAS QUE EL NOMBRE IMPONE AL SINTAGMA NOMINAL EN CONJUNTO DE ACUERDO CON EL TIPO DE NOMBRE: PROPIO O COMUN, CONTABLE O DE MATERIA, CONCRETO O ABSTRACTO... EN EL CAPITULO SOBRE LOS COMPLEMENTOS SE TRATAN LOS DIVERSOS COMPLEMENTOS PREPOSICIONALES O ADJETIVALES QUE PUEDEN TENER LOS NOMBRES SEGUN EL TIPO DE NOMBRE QUE SE TRATE. UN TERCER CAPITULO TRATA DE LOS DETERMINANTES QUE PUEDEN TENER LOS NOMBRES Y PROPONE UNA ESTRUCTURA SU REPRESENTACION. DESPUES DE ESTA PARTE DESCRIPTIVA HAY DOS CAPITULOS QUE PRESENTAN UNA PROPUESTA DE IMPLEMENTACION DE LOS RESULTADOS DE LOS CAPITULOS ANTERIORES: EL PRIMERO PROPONE UNA ESTRUCTURA COMPLETA PARA LOS CONSTITUYENTES DEL SINTAGMA NOMINAL Y EL SEGUNDO LAS REGLAS DE CALCULO SEMANTICO PARA CONSEGUIR CARACTERIZAR CORRECTAMENTE LOS SINTAGMAS NOMINALES. EL TRABAJO FINALIZA CON UN BREVE CAPITULO QUE ENUMERA DIVERSAS CUESTIONES PENDIENTES.
  • APLICACION DEL METODO DE SELECCION DE PATRONES VERBALES AL ESPAÑOL (CASTELLANO) .
    Autor: ASTUDILLO PACHECO FRANCISCO.
    Año: 1990.
    Universidad: POLITECNICA DE MADRID.
    Centro de lectura: INFORMATICA.
    Centro de realización: DEPARTAMENTO: FACULTAD DE INFORMATICA.
    Resumen: EN ESTA TESIS, SE PRESENTA UN NUEVO METODO PARA EL PROCESAMIENTO DE LA LENGUA CASTELLANA, TANTO EL ANALISIS COMO LA GENERACION. LA BASE LINGUISTICA DEL SISTEMA ES LA TEORIA DISTRIBUCIONALISTA EXPUESTA POR HARRIS. EL SISTEMA UTILIZA LAS GRAMATICAS AUMENTADAS DE DEPENDENCIA PARA LA REPRESENTACION CONCEPTUAL CON ESTE FORMALISMO, SE PUEDE REPRESENTAR TAMBIEN EL CONOCIMIENTO GRAMATICAL. EL SISTEMA DE TRADUCCION ESTA BASADO EN LA ENCADENACION DE PRODUCCION QUE EJECUTAN CONJUNTOS DE REGLAS, EN LAS QUE SE CODIFICA INFORMACION LINGUISTICA GENERAL, MODIFICANDO LA ESTRUCTURA CONCEPTUAL.
  • UN FORMALISMO PARA LA REPRESENTACION Y UTILIZACION DE INFORMACION BILINGUE EN SISTEMAS DE TRADUCCION AUTOMATICA.
    Autor: RODRIGUEZ MARIN PILAR.
    Año: 1990.
    Universidad: COMPLUTENSE DE MADRID.
    Centro de lectura: FISICA.
    Centro de realización: DEPARTAMENTO: CENTRO DE INVESTIGACION UAM-IBM .
    Resumen: EN ESTE TRABAJO SE HA REALIZADO EL DISEÑO Y EL DESARROLLO DE UN FORMALISMO PARA LA REPRESENTACION ESTATICA Y LA GESTION DINAMICA DE INFORMACION BILINGUE, HABIENDOSE IMPLEMENTADO EN EL MARCO DE UN PROYECTO PARA LA CREACION DE UN PROTOTIPO DE SISTEMA DE TRADUCCION AUTOMATICA DE INGLES A ESPAÑOL. EL MODELO DE DICCIONARIO ELECTRONICO PROPUESTO ESTA BASADO EN LA DETERMINACION DE DOS CONJUNTOS DE PRIMITIVAS LINGUISTICAS (EN RELACION CON LAS LENGUAS FUENTE Y META) Y UNA GRAMATICA DE DEFINICION, QUE INCLUYE SIMBOLOS ESPECIFICOS DE CONTROL. LAS ENTRADAS DEFINIDAS DE ACUERDO CON ESTE FORMALISMO RESULTAN ALTAMENTE INDEPENDIENTES DE LA IMPLEMENTACION COMPLETA DEL PROGRAMA DE TRADUCCION Y, DADA LA GENERALIDAD DE LOS CONCEPTOS QUE REPRESENTAN, PUEDEN SER UTILIZADAS EN DIFERENTES SISTEMAS. EN NUESTRO CASO, LA UTILIZACION DE LA INFORMACION BILINGUE DEFINIDA SE HA INTEGRADO EN EL ENTORNO LISP DEL PROGRAMA DE TRADUCCION DESARROLLADO. ESTA INTEGRACION SE HA LLEVADO A CABO MENDIANTE LA DEFINICION DE PROCEDIMIENTOS EJECUTABLES ASOCIADOS A CADA UNA DE LAS PRIMITIVAS, Y QUE PERMITE LA INTERPRETACION DE LAS ENTRADAS DE FORMA AUTOMATICA CUANDO ESTAS SE CONSULTAN DESDE EL PROGRAMA. POR OTRA PARTE, SE CONSERVA EL CARACTER DECLARATIVO DE LAS MISMAS, DE MODO QUE SU CREACION Y ACTUALIZACION RESULTAN SER SENCILLAS. EN ESTE SENTIDO, EL MODELO DE DICCIONARIO ELECTRONICO PROPUESTO PRESENTA GRANDES VENTAJAS EN CUANTO A SU MANTENIMIENTO POSTERIOR. UN VALOR AÑADIDO AL DISEÑO PROPUESTO ES LA GENERALIDAD DE LAS PRIMITIVAS DEFINIDAS QUE HACE QUE LOS MARCOS DE LAS ENTRADAS PUEDAN SER UTILIZADOS PARA LA CRACION DE OTROS DICCIONARIOS ELECTRONICOS.
  • NAZIK AL-MALA'IKA POETISA IRAQUI COMTEMPORANEA .
    Autor: CANO LEDESMA AURORA.
    Año: 1986.
    Universidad: AUTONOMA DE MADRID.
    Centro de lectura: FILOSOFIA Y LETRAS.
    Centro de realización: DEPARTAMENTO DE ESTUDIOS DE ARABE E ISLAM Y ESTUDIOS ORIENTALES DE LA UNIVERSIDAD AUTONOMA DE MADRID.
    Resumen: EL TEMA DE INVESTIGACION DE LA PRESENTE TESIS DOCTORAL SE CENTRA EN EL ESTUDIO DE LA OBRA POETICA COMPLETA DE LA AUTORA IRAQUI CONTEMPORANEA NAZIK AL-MALA'IKA. ABARCA UN ESTUDIO PORMENORIZADO DEL CORPUS POETICO CON UNA INTRODUCCION PREVIA DE LA BIOGRAFIA DE LA POETISA EL MARCO HISTORICO POLITICO DE SU EPOCA Y EL PANORAMA LITERARIO DE LA POESIA ARABE CONTEMPORANEA DONDE ELLA SURGE COMO PIONERA DE UN MOVIMIENTO POETICO DENOMINADO AL-SI'R AL-HURR / VERSO LIBRE QUE HA ALCANZADO UN GRAN DESARROLLO EN LA POESIA ARABE CONTEMPORANEA EN GENERAL. EL ANALISIS LITERARIO COMPRENDE EL ESTUDIO DE SU LEXICO POETICO (CON TRATAMIENTO ESTADISTICO Y REPRESENTACION GRAFICA) LA IMAGEN Y EL DIALOGO INTERIOR . SE COMPLETA LA INVESTIGACION CON UN APENDICE BILINGUE DE LOS POEMAS MAS SIGNIFICATIVOS (SELECCIONADOS ESCRUPULOSAMENTE PARA QUE ESTE CAPITULO NO ADQUIRIESE UNAS DIMENSIONES EXCESIVAS) Y EL REPERTORIO BIBLIOGRAFICO ADECUADO AL TEMA (EN LENGUA ARABE OTRAS LENGUAS ARTICULOS EN GENERAL Y COMO COLOFON LOS ARTICULOS DE LA AUTORA)
  • LA TRADUCCION AUTOMATICA EN LA GERMANISTICA.
    Autor: REGALES SERNA ANTONIO.
    Año: 1976.
    Universidad: SANTIAGO DE COMPOSTELA.
    Centro de lectura: FILOSOFIA Y LETRAS.
    Centro de realización: UNIVERSIDAD DE SALAMANCA Y UNIVERSIDAD DE SANTIAGO DE COMPOSTELA.
    Resumen: ESTUDIO DE LA HISTORIA DE LA TRADUCCION AUTOMATICA CON ESPECIAL ATENCION AL ALEMAN A LOS MODELOS TRANSFORMATIVOS A LA TEORIA DE LA TRADUCCION Y A UN NUEVO PLANTEAMIENTO DE LA TRADUCCION AUTOMATICA DEL ALEMAN.
20 tesis en 1 páginas: 1
Google
Web www.cibernetia.com
Manuales | Directorio | Tesis: Ordenadores, Circuitos integrados...
english
Cibernetia