Cibernetia > Tesis doctorales
Google
Web www.cibernetia.com

Índice > LINGUISTICA > LINGUISTICA APLICADA >

LINGUISTICA COMPUTACIONAL



37 tesis en 2 páginas: 1 | 2
  • SELECCION DE CONTENIDOS A PARTIR DE UN CORPUS ENRIQUECIDO Y ESPECIALIZADO PARA LA GENERACION PERSONALIZADA DE DOCUMENTOS .
    Autor: BARRUTIETA ANDUIZA GUILLERMO.
    Año: 2003.
    Universidad: DEUSTO.
    Centro de lectura: FACULTAD DE INGENIERIA.
    Centro de realización: FACULTAD DE INGENIERIA.
    Resumen: En esta tesis se aborda el uso de la tecnología XML combinada con el marco de análisis de la estructura retórica del discurso RST para la generación de documentos personalizados. Se ha formalizado la construcción del documento maestro. Para esa formalización se utiliza XML-DTD, con la que se representa digitalmente el texto y las referencias a los elementos multimedia que componen el documento maestro. Adicionalmente las etiquetas XML explicitan la estructura del discurso de acuerdo a una variante de la teoría RST que analiza el documento en función de unos segmentos de texto que agrupan una o más de una frase con un mismo objetivo comunicativo. El usuario está modelizado en función de unos aspectos independientes del propio documento en sí. El enfoque utilizado para la implementación del algoritmo de selección de contenido está basado en la utilización de una serie de filtros XSL en cascada que implementan computacionalmente, junto con su mecanismo de activación, dicho algoritmo. Estos filtros tienen como misión la discriminación de las partes del documento maestro que mejor satisfacen las necesidades de información del usuario para incluirlas en el documento a generar. La experimentación y la evaluación-validación se ha llevado a cabo con la construcción de un sistema denominado CourseViewGenerator. Los buenos resultados obtenidos permiten afirmar que tanto la formación del documento maestro como el enfoque utilizado para la implementación del algoritmo de selección de contenido constituyen una aportación al campo de la generación de documentos.
  • El Diccionario valenciano-castellano (1851) de Josep Escrig en la tradició lexicogràfica valenciana .
    Autor: GUARDIOLA SAVALL M. ISABEL.
    Año: 2003.
    Universidad: ALICANTE.
    Centro de lectura: FACULTAD DE FILOSOFÍA Y LETRAS.
    Centro de realización: FACULTAD FILOSOFÍA I LETRAS.
    Resumen: En nuestra tesis nos proponemos realizar un estudio completo del Diccionario valenciano-castellano (1851) de Josep Escrig que abarque tanto la estructura y la composición de la obra -objetivos, sistema ortográfico propuesto, macroestructura y microestructura- como también las fuentes en que basa los materiales y la técnica desarrollada. Esta comparación con la lexicografía valenciana precedente nos permite establecer las verdaderas aportaciones de la obra. Resumimos en los puntos siguientes los principales objectivos que se llevan a cabo en la tesis: 1. revisar y matizar las opiniones y las valoraciones sobre el diccionario de Escrig a partir de una análisis de la técnica lexicográfica y las aportaciones a la lexicografía valenciana desde el punto de vista técnico y léxico;2. establecer las fuentes del diccionario de Escrig;3. reevaluar y redimensionar la obra en el contexto de producción lexicográfica del XIX.
  • LES ADVERBES COMPOSÉS APPROCHES CONTRASTIVES EN LINGUISTIQUE APPLIQUÉE .
    Autor: CÁTALA GUITART DOLORS.
    Año: 2003.
    Universidad: AUTONOMA DE BARCELONA.
    Centro de lectura: FILOSOFÍA Y LETRAS.
    Centro de realización: ESCUELA DE DOCTORADO Y DE FORMACIÓN CONTINUADA.
  • HACIA UNA ESPECIFICACIÓN COMPUTACIONAL DE LA TRANSITIVIDAD EN EL ESPAÑOL: ESTUDIO CONTRASTIVO CON EL INGLÉS .
    Autor: ARÚS HITA JORGE.
    Año: 2002.
    Universidad: COMPLUTENSE DE MADRID.
    Centro de lectura: FILOLOGÍA .
    Centro de realización: FACULTAD DE FILOLOGÍA.
    Resumen: El objetivo principal de esta tesis es proporcionar una descripción del sistema de TRANSITIVIDAD del español desde un punto de vista sistémico-funcional y de forma contrastiva con el inglés, con vistas a su posterior implementación para la generación automática de textos. Comienza el estudio con un acercamiento al márco teórico sistémico-funcional, procediendo de lo general a lo particular: en primer lugar, se ofrece una somera revisión del lugar que ocupa la GSF (Gramática Sistémico-Funcional) dentro de la evolución de las corrientes lingüísticas del siglo XX. Tras ello, se entra en las líneas generales de la teoría sistémico-funcional, con sus variantes. Se desciende a continuación al área de la teoría que trata de la transitividad, donde se ven las posibilidades que se nos ofrecen. Entre estas posibilidades, vemos que existe la de hacer un tratamiento distinto del que se hace en la corriente estándar de la GSF por lo que respecta al tema transitividad /ergatividad, lo cual recibe una atención específica al estado de la cuestión en cuanto a la noción de ergatividad. Una vez sentados los parámetros teóricos más generales, se adentra la tesis en el segundo capítulo en una primera aplicación de la teoría a la práctica. Se empieza con un repaso de los procesos materiales en la Introduction to Functional Grammar de M.A.K. Halliday (1985/94), segudio de una aplicación de la teoría al mismo tipo de procesos en español. El mismo discurrir sigue por lo que respecta a los procesos mentales, verbales y relacionales, y a las Circunstancias, respectivamente. El capítulo 3 comienza por una introducción a cuestiones de lingüística computacional y especificación de convenciones, para a continuación ofrecer un repaso de la gramática del inglés, llamada Nigel, tal como la presenta su autor, Christian Matthiessen en su Lexicogrammatical Cartography (1995). Tras ello se pasa a una especificacion computacional del área o región funcional de la TRANSITIVIDAD en español que pueda ser utilizable en la genración automática de textos. Aquí el estudio se centra en los aspectos descriptivos de dicha especificación más que en los puramente computacionales de implementación. Finalmente, en el capítulo 4 se discuten las conclusiones extraídas de los resultados del trabajo, tanto por lo que respecta al estudio contrastivo del inglés y el español, como a lo que el enfoque aquí practicado aporta a la descripción de la lengua española.
  • RECONOCIMIENTO Y CONTROL DE EXPRESIONES LINGÜÍSTICAS POR MEDIO DE TRANSDUCTORES DE ESTADO-FINITO .
    Autor: GALVEZ MARTINEZ CARMEN.
    Año: 2002.
    Universidad: GRANADA.
    Centro de lectura: BIBLIOTECONOMÍA Y DOCUMENTACIÓN.
    Centro de realización: FAC. DE BIBLIOTECONOMÍA Y DOCUMENTACIÓN.
    Resumen: El objetivo principal de este trabajo es crear bases de información lingüísticas: Diccionarios y Gramáticas electrónicas, que se puedan utilizar por mecanismos automáticos de análisis para la identificación y agrupación de variantes léxicas y sintácticas en idioma español. El objetivo potencial de estas herramientas sería mejorar las entradas a los índices de los sistemas de RI, con técnicas procedentes del PLN. La metodología de investigación lingüística que hemos empleado Expresiones y Relaciones Regulares, como mecanismo automático de control hemos utilizado una aplicación informática basada en Transductores de Estado-Finito Gráficos. Con este procedimiento se han obtenido los siguientes resultados: A,- Equiparar Formas flexionadas a Formas controladas, por medio de las bases de información léxicas, consistentes en Diccionarios electrónicos. B,- Equiparar variantes estructurales de Sintagmas Nominales con estructuras controladas, por medio de las bases de información sintácticas. C,- Comprobar las hipótesis explicativas, mediante la aplicación de los analizadores, desarrollados con estas bases de información, sobre un corpus de verificación. D,- Evaluar los resultados de esta aplicación, que se sintetizan como sigue: los analizadores léxicos son muy precisos y consiguen reducir las variantes en un 26,4%, mientras que los analizadores sintácticos son también muy precisos, pero tienen un índice de exhaustividad medio-bajo. Las conclusiones generales que hemos extraído son las siguientes: 1,- Los analizadores léxicos constituyen una técnica de conflación adecuada, aunque tienen un problema de infraanálisis. 2,- Los analizadores sintácticos constituyen una técnica de conflación adecuada, aunque tiene un problema de sobreanálisis, que se puede solucionar con la aplicación de modelos probabilísticos.
  • LA LENGUA DEL DERECHO PENAL EN ESPAÑOL. UN DICCIONARIO PARA EL TRATAMIENTO AUTOMÁTICO DE LAS LENGUAS DE ESPECIALIDAD .
    Autor: GARCÍA PÉREZ RAFAEL.
    Año: 2002.
    Universidad: SALAMANCA.
    Centro de lectura: FILOLOGÍA .
    Centro de realización: UNIVERSIDAD DE SALAMANCA Y PARIS XIII.
    Resumen: Con esta tesis se ha pretendido confeccionar un diccionario para el tratamiento automático de la lengua del Derecho penal. La primera parte se centra en el marco teórico. El método elegido ha sido las "Clases de Objetos", que tiene en cuenta la radical diferencia entre las máquinas y los seres humanos y pone de manifiesto la estrecha relación que une a la sintaxis y a la semántica en los procesos de generación de oraciones. Frente a la concepción del léxico de la teoría tradicional, el método de las Clases de Objetos plantea la existencia de "empleos" monosémicos que se definen en su contexto sintáctico, principalmente la oración simple, a partir de la cual se derivan el resto de las oraciones de una lengua. Los "empleos" se dividen en dos grupos básicos de acuerdo con su significado y su comportamiento sintáctico: predicados y argumentos. Los primeros seleccionan sintáctico-semánticamente a los segundos, y sus restricciones vienen determinadas por criterios inherentes a las propias unidades en cuanto elementos discursivos. Los predicados y argumentos se clasifican en grupos más pequeños de comportamiento homogéneo: clases de predicados los primeros; rasgos y clases de objetos los segundos. En la segunda parte se aplica el método de las clases de objetos a una lengua de especialidad: la lengua del Derecho penal. El primer paso ha sido la confección de un corpus, única herramienta que permite seleccionar las entradas de un diccionario. Éstas están formadas por sustantivos, adjetivos y verbos. Se ha dedicado un capítulo entero a los argumentos, los rasgos sintáctico-semánticos y las clases de objetos; otro, a los predicadores nominales, adjetivos y verbales, clasificados, a su vez, en tres grandes grupos (acción, estado-cualidad y acontecimiento) y subdivididos en clases de predicados; y un tercero, a un grupo particular de sustantivos: los humanos predicativos. La tercera parte culmina el análisis léxico-gramatical. Ofrece un diccionario completo de Derecho penal que contiene no sólo las unidades de este ámbito especializado, sino también su descripción sintáctico-semántica para que los ordenadores, en un futuro inmediato, sean capaces de comprender y generar oraciones de un modo más natural y efectivo.
  • CORPUSAK USTIATZEKO TRESNA LINGUISTIKOAK .
    Autor: EZEIZA RAMOS NEREA.
    Año: 2002.
    Universidad: PAIS VASCO .
    Centro de lectura: INFORMÁTICA.
    Centro de realización: INFORMATIKA FAKULTATEA.
  • ON DISTRIBUTING THE ANALYSIS PROCESS OF A BROAD-COVERAGE UNIFICATION-BASED GRAMMAR OF SPANISH .
    Autor: MARIMON FELIPE MONTESERRAT.
    Año: 2002.
    Universidad: POLITECNICA DE CATALUÑA.
  • ANGLICISMOS EN LA PRENSA ECONÓMICA ESPAÑOLA .
    Autor: VÉLEZ BARRERIO MARCO.
    Año: 2002.
    Universidad: A CORUÑA .
    Centro de lectura: FILOLOGÍA.
    Centro de realización: FACULTADE DE FILOLOXÍA UNIVERSIDADE DA CORUÑA.
    Resumen: En los últimos 50 años, el inglés se ha convertido en la lengua de comunicación internacional. Mundo español de los negocios y la economía sufre esta influencia y la refleja en su lengua, que de esta forma se inunda de términos y expresiones de origen anglosajón. El análisis de la prensa diaria especializada española constituye probablemente la mejro forma de investigar la introducción de estos términos, ya que refleja la lengua viva de los negocios día a día. El objetivo de esta investigación ha sido la identificación de tantos términos ingleses como fuese posible para su posterior estudio, que estuvo centrado en los orígenes semánticos de los términos encontrados fundamentalmente a través del uso de diccionarios, tanto generales como especializados. Las publicaciones escogidas son Expansión y El País durante el año 2001. Se recogieron 8.408 artículos periodísticos con 3,476.96 palabras. Esto supone un 21,57% del número total de palabras del universo del corpus lingüístico, cuya construcción supuso la introducción de correcciones con objeto de garantizar la adecuada representación de todas las variables. Se hizo un estudio cuantitativo de cada término para determinar su impacto en la lengua, así como para dividir el material en dos categorías diferentes: anglicismos (términos con 5 o más usos en el corpus) y voces inglesas (términos con 4 o menos usos en corpus). Finalmente se tuvieron en consideración 167 anglicismos y 298 voces inglesas, que fueron clasificados de acuerdo con los criterios propuestos por Chris Pratt en "El anglicismo en el español peninsular contemporáneo". Debido a la naturaleza de esta investigación, cada uno de los análisis semánticos que se hicieron constituye una unidad independiente, con una argumentación y una conclusión propias.
  • ANÁLISIS DEL ESPAÑOL CONVERSACIONAL EN CHILE .
    Autor: HERNÁNDEZ MEDINA ALEJANDRA CRISTINA.
    Año: 2002.
    Universidad: VALLADOLID.
    Centro de lectura: FACULTAD DE FILOSOFÍA Y LETRAS.
    Centro de realización: FACULTAD DE FILOSOFÍA Y LETRAS.
    Resumen: Esta tesis doctoral se ha enfocado al estudio del español conversacional en Chile, en particular de su modalidad coloquial. Nuestro principal objetivo fue, desde una perspectiva sociolingüística, determinar y describir cuáles eran los elementos estratégicos que caracterizaban este tipo de discurso y de qué manera se manifestaban según el sexo, edad, nivel sociocultural y zona a que pertenecían los hablantes. En cuanto a su estructura, la investigación consta de dos partes: Marco Teórico y análisis de corpus. En la primera de ellas se expusieron los fundamentos que han servido de base a la investigación. En la segunda, se estudiaron las estrategias discursivo conversacionales observadas en la muestra, además de una serie de otros rasgos característicos del discurso conversacional. Respecto a la metodología utilizada, diremos que trabajamos con una serie de variables lingüístico discursivas y cuatro variables de tipo social (sexo, edad, nivel sociocultural y zona a que pertenecían los hablantes. La muestra se obtuvo mediante la elaboración de 58 entrevistas efectuadas a informantes de las regiones tercera y cuarta del país. De un total de 30 minutos de grabación se seleccionaron 15 minutos para la transcripción fonográfica y posterior análisis. Finalmente, algunas de las conclusiones más relevantes fueron: En relación con las variables lingüístico-discursivas analizadas hemos concluido que son las estrategias sintáctico-discursivas las que predominan en el discurso conversacional coloquial (40,3%); a continuación les siguen las contextuales-discursivas (19,8%); posteriormente destacan las fónicas (18,7%); las intensificaciones (7,8%); las atenuaciones (5,6%); las morfológicas y morfosintácticas (3,3%); y finalmente las lexicosemánticas (4,5%). En relación con las variables sociales, podemos afirmar que los hombres (59,9%) recurren mayoritariamente al empleo de estrategias conversacionales de tipo coloquial; mientras que las mujeres lo hacen sólo en un 41% de los casos. El grupo generacional que tiende principalmente al uso de estas estrategias es el segundo (61,8%); seguido del primero (23,5%). La clase sociocultural que manifiesta un mayor empleo de estos recursos es la baja (56,3%), seguida de la clase media (35,2%). La zona geográfica en que más se observa el empleo de estas estrategias es la de Rancagua (69%). En relación con los inicios de turno, destacamos que en ellos predominan las estructuras constituidas por sintagmas verbales y adverbios de afirmación y de negación. Finalmente, indicar que los acuerdos conversacionales suelen establecerse fundamentalmente mediante respuestas eco y modalizadores epistémicos y que las interrupciones se llevan a cabo esencialmente para adelantarse y responder con rapidez, reforzar o completar una intervención anterior; completar una idea que el interlocutor ha dejado inconclusa; rebatir un punto de vista o corregir una afirmación del interlocutor.
  • APLICACIONES DEL HIPERTEXTO AL ESTUDIO DE LA LITERATURA: "A PORTRAIT OF THE ARTIST AS A YOUNG MAN", DE JAMES JOYCE .
    Autor: PAJARES TOSCA SUSANA.
    Año: 2001.
    Universidad: COMPLUTENSE DE MADRID.
    Centro de lectura: CIENCIAS DE LA INFORMACIÓN.
    Resumen: Este trabajo examina la teoría, ideología y política del hipertexto, proponiendo una tipología original para el análisis de las obras existentes, así como una interpretación pragmática del funcionamiento de los enlaces electrónicos. James Joyce es el autor que hemos escogido para aplicar nuestra teoría hipertextual al campo de la literatura, debido a su reputación como precursor del hipertexto por lo revolucionario de su estilo, ya que es un autor de obligado estudio en los programas de literatura inglesa de cualquier universidad. Hemos construido una serie de hipertextos educativos para la enseñanza de "A Portrait of the Artist as a Young Man", que van más allá de las redes contextuales habituales y se basan en las posibilidades únicas de la nueva forma. Finalmente, presentamos los resultados del uso de dichos hipertextos y una conclusión que sitúa nuestro trabajo en el contexto general del uso de las nuevas tecnologías en la educación, especialmente en la enseñanza de las humanidades.
  • EXPLOTACIONES DE LOS CORPUS TEXTUALES INFORMA TIZADOS PARA LA CREACION DE BASES DE DATOS TERMINOLOGICAS .
    Autor: PEREZ HERNANDEZ M. CHANTAL.
    Año: 2000.
    Universidad: MALAGA.
    Centro de lectura: FILOSOFIA Y LETRAS .
    Centro de realización: DPTO DE FILOLOGIA INGLESA DE LA UNIVERSIDAD DE GRANADA.
    Resumen: Esta tesis doctoral se enmarca dentro del ámbito de la terminografia, rama aplicada de la terminología. En este trabajo se propone la integración de los presupuestos teóricos y metodológicos de la lingüística y la lexicografía de corpus en la práctica terminográfica, para crear una metodología de trabajo que permita a los terminógrafos crear mejores y más completos repositorios terminológicos. En estas líneas, se delimitan cuáles son las necesidades específicas de los terminógraficos en lo que concierne al uso de corpus, su tipología, los criterios que deben guiar la selección de textos y las herramientas informaticas. Otro aspecto novedoso de este trabajo de investigación es el uso de una base de datos terminológica basada en el conocimiento, que integra una ontología de conceptos para la representación explícita y formalizada de la información conceptual sobre el dominio e especialidad estudiado por la doctoranda: la oncología.
  • UNA CONTRIBUCIÓN AL PROCESAMIENTO AUTOMÁTICO DE LA SINONIMIA UTILIZANDO PROLOG .
    Autor: FERNÁNDEZ LANZA SANTIAGO.
    Año: 2000.
    Universidad: SANTIAGO DE COMPOSTELA.
    Centro de lectura: FILOSOFÍA.
    Centro de realización: FACULTAD DE FILOSOFÍA.
    Resumen: La tesis comienza con una descripción de la herramienta que va a ser utilizada en el resto del trabajo: el Prolog. A continuación se analizan algunas propuestas de estudio de la sinonimia y se propone la que resulta más adecuada a los propósitos de la investigación realizada. Posteriormente se estudian algunos problemas importanes dentro del marco del procesamiento del lenguaje natural como la traducción automática, la sinonimia entre palabras, la sinonimia entre oraciones, la desambiguación, etc., mediante la utilización de las herramientas de la programación lógica. En la última parte, se realiza una descripción de un diccionario de sinónimos impreso que servirá de base de datos para el diccionario electrónico de sinónimos cuyo diseño que propone también en este capítulo. Finalmente, se analiza la utilidad de dicho diccionario electrónico en el procesamiento del lenguaje natural, en lexicografía y en recuperación de información, así como se comparan sus prestaciones con respecto a WordNet. Partiendo de una concepción gradual de la sinonimia y de la utilización de un diccionario de sinónimos (impreso) como base de datos empírica entendida como una muestra razonablemente fiel de comportamiento de la sinonimia en la práctica, en esta tesis, se propone la elaboración de un diccionario electrónico de sinónimios que calcula el grado de sinonimia de dos de sus entradas. El cálculo del grado permite mejorar las prestaciones del diccionario electrónico frente al diccionario impreso. Las mejores obtenidas son las siguientes: 1,- El diccionario electrónico detecta, de forma automática, las acepciones y homógrafas de los sinónimos que proprociona como respuesta. 2,- Ordena los sinónimos según su grado de sinonimia. 3,- Obtiene más sinónimos que los que aparecen en el diccionario impreso bajo el criterio de que dos palaras son sinónimias si su grado de sinonimia es distinto de 0. 4,- Permite el establecimiento de umbrales más debajo de los cuales dos palabras no serán consideradas sinónimas. Todo ello se ha realizado utilizando herramientas y técnicas de distintos ámbitos. Por una parte, se han analizado distintas propuestas teóricas de estudio de la sinonimia y se ha elegido aquella que la concibe como una relación aproximada o de grado por responder de un modo más adecuado a nuestras intuiciones de cómo debería comportarse la sinonimia en la práctica. Se ha utilizado el lenguaje de programación Prolog. Para implementar toda la propuesta y se han usado medidas de semilaridad para calcular el grado de sinonimia de dos entradas del diccionario. La tesis constituye una contribución, por una parte, al procesamiento del lenguaje natural, ya que consiste en la automatización de un aspecto importante del lenguaje, y por otra, a la lexicografía, ya sea ésta computacional o no, puesto que el resultado es un diccionario electrónico de sinónimos que podría ser utilizado por cualquier usuario de la lengua y que además puede servir de herramienta para conseguir mejores diccionarios de sinónimos impresos. Además puede ser útil como campo de pruebas para comprobar la validez y potencia explicativa de muchas de las propuestas proporcionadas por los estudios teóricos sobre sinonimia.
  • LAS PUBLICACIONES OFICIALES: CONCEPTUALIZACION Y TIPOLOGIA DOCUMENTAL. FUENTES PARA SU ANALISIS Y RECUPERACION .
    Autor: MARTINEZ NAVARRO VICTORIA.
    Año: 2000.
    Universidad: MURCIA.
    Centro de lectura: CIENCIAS DE LA DOCUMENTACION.
    Centro de realización: FACULTAD DE CIENCIAS DE LA DOCUMENTACION.
    Resumen: Se estudian, analizan y cuantifican las publicaciones oficiales, desde la perspectiva de la Informacion Cientifica y Tecnica, en el area de las Fuentes de Informacion, y más concretamente de la literatura gris. Estableciendo su conceptualizacion y sistematizacion, a partir de los antecedentes encontrados en la Biblioteconomia y Documentacion, doctrina cientifica en la que situamos nuestra Tesis doctoral. Constando la inexistencia de un estudio global y exhaustivo sobre el sector, situacion que alienta y justifica la investigación realizada. El analisis exhaustivo de la tipologia, caracterización y necesidades informativas que pretenden cubrir las publicacones oficiales, nos permite delimitar su marco legal y juridico establecido por nuestro Ordenamiento regulador de la actividad informativa surgida tras la denominada revolución de la informacion y del conocimiento. Por este motivo, el tema se relaciona con otras disciplinas afines-el Ordenamiento juridico español y el Derecho Internacional-desde las que se acomete el estudio de la situacion española y de la Comunidad Internacional, en la que se presentan dos ejemplos: publicaciones oficiales de la Union Europea y de las Naciones Unidas. A tenor de estos presupuestos, estudiamos la organización de la actividad editorial publica en España, su necesaria normalización y control bibliográfico, el acceso a esta produccion documental, sus fuentes de informacion documentales e institucionales, las necesidades de desarrollo que comporta este sector de la documentacion a partir de la necesaria evolucion normativa de la legislacion aplicable, y finalmente los sistemas de informacion de los Organismos e Instituciones Internacionales. Se concluye indicando el interes que revierte el trabajo, como investigacion global e interrelacionada que se ocupa del estado actual de las publicacines oficiales denro de la disciplina de las Fuentes de Informacion. Como punto de partida e intercambio del debate necesario para establecer las futuras politicas de las publicaciones oficiales.
  • ALINEACIÓN AUTOMÁTICA DE CORPUS PARALELOS: UNA PROPUESTA METODOLÓGICA Y SU APLICACIÓN A UN DOMINIO DE ESPECIALIDAD.
    Autor: MARTINEZ UNANUE RAQUEL.
    Año: 1999.
    Universidad: DEUSTO.
    Centro de lectura: INFORMÁTICA .
    Centro de realización: FACULTAD DE INGENIERIA.
    Resumen: En esta tesis se aborda el problema de la alineación de un corpus paralelo y se aportan soluciones novedosas en algunos de los niveles de resolución más complejos. Estos niveles son las oraciones y algunos elementos intraoracionales como los términos multipalabra y los nombres propios. Se ha formalizado la alineación de un corpus paralelo como un problema de asignación con restricciones en un grafo bipartito. Para llevar a cabo dicha formalización, se ha propuesto una serie de definiciones de conceptos asociados a la alineación que no habían sido descritos con anterioridad en la bibliografía sobre el tema. El problema de asignación en un grafo bipartito se ha formalizado como un problema de satisfacción de restricciones (PSR). Para resolver este PSR, se propone un algoritmo de vuelta atrás mejorado adaptado al problema de la alineación. En dicha adaptación cabe destacar la implementación que se ha realizado del espacio de alineación así como de las alineaciones candidatas. El enfoque utilizado para resovler la alineación se basa en la segmentación del corpus paralelo en los siguientes niveles descriptivos: estructural, independiente del domino y en unidades de traducción. La información resultante de dichos niveles de segmentación se convierte en una fuente de conocimiento para la resolución de la alineación. Las estrategias que se proponen para alinear combinan la utilización de medidas cuantitativas con conocimiento lingüistico. Se trata, por lo tanto, de una propuesta híbrida que dará más o menos peso a cada tipo de criterio dependiendo del nivel de resolución al que se aplique. La evaluación de la metodología y de las soluciones algorítmicas propuestas se ha llevado a cabo con un corpus paralelo bilingüe en euskara y castellano perteneciente al dominio jurídico-administrataivo. Este corpus recibe el nombre de BOB. Los buenos resultados obtendios permiten afirmar que tanto la metodología como las herramientas que permiten llevarla a cabo constituyen una aportación al campo de la alineación de corpue paralelos. El hecho de haber utilizado para las pruebas experimentales un corpues con lenguas de diferenciada tipología garantiza que los métodos y técnicas propuestos se puedan extender a otros pares de lenguas con similares resultados.
  • DICCIONARI DE FORMANTS LEXICS INFORMATITZAT.
    Autor: FARRIOLS SALAMERO ANTONI JAUME.
    Año: 1996.
    Universidad: BARCELONA.
    Centro de lectura: FILOLOGIA.
    Centro de realización: DEPARTAMENTO: FILOLOGIA CATALANA PROGRAMA DE DOCTORADO: LA NORMATIVA: TEORIA I PRACTICA.
    Resumen: EL OBJETIVO DE ESTA TESIS ES CONSEGUIR UN DICCIONARIO DE FORMANTES. TAMBIEN PRESENTO LAS EXPLICACIONES SOBRE EL PROCESO DE CONFECCION DEL DICCIONARIO Y LOS CRITERIOS TEORICOS Y PRACTICOS ADOPTADOS. EL TRABAJO ES FUNDAMENTALMENTE UN DICCIONARIO MORFOLOGICO. SE TRATA DE UN DICCIONARIO EXPERIMENTAL. EL METODO DE ANALISIS Y SEGMENTACION TAMBIEN ES UN PRODUCTO EN SI MISMO. LAS APORTACIONES MAS IMPORTANTES SON, PRIMERO, LA CREACION DE UN MARCO TEORICO PARA EL SISTEMA DE SEGMENTACION, MARCO SOBRE EL CUAL SE HAN FABRICADO LOS FITXEROS DE DATOS LINGUISTICOS CON QUE TRABAJA EL PROGRAMA LLAMADO "PARTIDOR" (LISTAS DE AFIJOS, SOBRETODO), ASI COMO LOS CRITERIOS QUE PREVALECEN DESDE UN PUNTO DE VISTA LINGUISTICO EN SU FUNCIONAMIENTO, ES DECIR, EL ALGORISMO. EN SEGUNDO LUGAR, LA SEGMENTACION INDIVIDUAL DE LOS LEXEMAS, ES DECIR LA REVISION, VERIFICACION ETIMOLOGICA Y CORRECCION CUANDO ES NECESARIO, DE UNA PROPUESTA DE SEGMENTACION SUGERIDA POR EL PROGRAMA INFORMATICO. EL AMBITO DE TRABAJO ES EL DE LA LINGUISTICA APLICADA, HUYENDO DE UN TRATO EXHAUSTIVO DE LA TEORIA. FORMALMENTE, EL DICCIONARIO ES UNA LISTA ORDENADA DE ELEMENTOS LEXICOS QUE LLAMO "FORMANTES". ESTOS SON, BASICAMENTE, LOS MORFEMAS DE LAS PALABRAS SEGMENTADAS. EL LIBRO SE ORGANIZA EN CUATRO APARTADOS QUE CONTIENEN, RESPECTIVAMENTE, RADICALES, INFIJOS Y PREFIJOS. CADA FORMANTE CONLLEVA LA LISTA ALFABETICA DE LEXEMAS QUE LO CONTIENEN. PROPIAMENTE, EL DICCIONARIO CORRESPONDE A LOS FORMANTES QUE SE OBTIENEN DE LAS MAS DE 33.000 PALABRAS SEGMENTADAS MANUALMENTE; LA INCLUSION DE LAS MAS DE 35.000 RESTANTES, TRATADAS SOLO POR EL SISTEMA AUTOMATICO SE DEBE AL ASPECTO ACEPTABLEMENTE CORRECTO DE LAS SEGMENTACIONES Y PORQUE SON TAMBIEN FRUTO DEL METODO Y CRITERIOS CREADOS.
  • EUSKAL MORFOLOGIAREN TRATAMENDU INFORMATIKORANTZ.
    Autor: URKIA GONZALEZ MIRIAM.
    Año: 1996.
    Universidad: PAIS VASCO .
    Centro de lectura: FILOLOGIA GEOGRAFIA E HISTORIA.
    Centro de realización: DEPARTAMENTO: FILOLOGIA VASCA PROGRAMA DE DOCTORADO: EUSKAL LIMGUISTIKA ETA FILOLOGIA.
    Resumen: EN ESTA TESIS SE PROPONE UN ANALIZADOR / GENERADOR MORFOSINTACTICO AUTOMATICO PARA EL EUSKARA, LLAMADO MORFEUS. PARA ELLO SE HA PARTIDO DE LAS TEORIAS MORFOLOGICAS DESARROLLADAS DURANTE ESTE ULTIMO SIGLO POR UN LADO, Y DEL ESTUDIO DE LOS PROCESADORES CREADOS PARA EL TRATAMIENTO AUTOMATICO DE LA MORFOLOGIA POR OTRO. PERO HA SIDO NECESARIA LA SISTEMATIZACION DE LA MORFOLOGIA FLEXIVA VASCA, PARA LO QUE SE PROPONE UN SISTEMA DE CATEGORIAS, MORFOTACTICA Y REGLAS MORFOFONOGICAS, ADEMAS DE UN TRATAMIENTO MAS TEORICO Y SOLUCIONES PARA LA ELIPSIS INTERNA DE LA PALABRA, LOS MORFEMAS VACIOS O LA ALOMORFIA. TODA LA INFORMACION OBTENIDA SE HA ALMACENADO EN UNA BASE DE DATOS LEXICA. PARTIENDO DE AHI HA NACIDO MORFEUS, BASADO EN LA MORFOLOGIA DE DOS NIVELES (KOSKENNIEMI 1983). PERO SE HA SUPERADO ESTE MODELO, PUES SE DEFIENDE LA MORFOSINTAXIS, LO CUAL QUEDA REFLEJADO EN EL PASO DADO DEL SEGMENTADOR MORFOLOGICO AL ANALIZADOR MORFOSINTACTICO QUE OFRECE LA SALIDA ELABORADA DE LA FORMA ANALIZADA, PARA LO CUAL SE HA RECURRIDO A LOS MECANISMOS DE UNIFICACION. SE VUELVE A DEMOSTRAR QUE LAS LENGUAS AGLUTINANTES PUEDEN SER TRATADAS AUTOMATICAMENTE, ASI COMO DEFIENDE EL ACERCAMIENTO ENTRE LAS TEORIAS LINGUISTICAS Y LOS PROCESADORES, TRADICIONALMENTE INDEPENDIENTES. ESTE ACERCAMIENTO QUEDA REFLEJADO, POR EJEMPLO, EN LA UTILIZACION DE RASGOS MORFOLOGICOS EN EL SISTEMA DE REGLAS.
  • EDICION CRITICA Y ESTUDIO DEL PRONTUARIO MARITIMO DE JUAN ABELLO DE VALDES.
    Autor: BLANCO RODRIGUEZ M. JOSE.
    Año: 1995.
    Universidad: ALICANTE.
    Centro de lectura: FILOSOFIA Y LETRAS.
    Centro de realización: DEPARTAMENTO: FILOLOGIA ESPAÑOLA.
    Resumen: SE TRATA DE LA EDICION CRITICA DE UNA DE LAS COPIAS EXISTENTES DE LA OBRA DE JUAN ABELLO DE VALDES: PRONTUARIO MARITIMO, VALORADA DESDE EL PUNTO DE VISTA DE SUS ANTECEDENTES Y SUS CONSECUENCIAS.
  • FUNDAMENTOS Y LIMITES DE LOS SISTEMAS DE VERIFICACION AUTOMATICA DE LA SINTAXIS Y EL ESTILO.
    Autor: GOMEZ GUINOVART JAVIER.
    Año: 1995.
    Universidad: SANTIAGO DE COMPOSTELA.
    Centro de lectura: FILOLOGIA.
    Resumen: EN ESTA TESIS SE PRESENTAN LOS FUNDAMENTOS Y LIMITES LINGUISTICOS E INFORMATICOS DE LA VERIFICACION AUTOMATICA DE LA SINTAXIS Y EL ESTILO, PRESTANDO UNA ATENCION ESPECIAL A LOS PROBLEMAS DE CORRECCION LINGUISTICA DE LOS TEXTOS REDACTADOS EN LENGUA CASTELLANA. EL OBJETIVO DE LA TESIS CONSISTE EN ESTABLECER LAS BASES TEORICAS, EL AMBITO DE APLICACION Y LAS DIVERSAS ESTRATEGIAS DE IMPLEMENTACION INFORMATICA DE LOS SISTEMAS DE VERIFICACION LINGUISTICA DESARROLLADOS EN EL AREA DEL PROCESAMIENTO DEL LENGUAJE NATURAL.
  • GENERE ANALYSIS IN ENGLISH FOR COMPUTER SCIENCE.
    Autor: POSTEGUILLO GOMEZ SANTIAGO.
    Año: 1995.
    Universidad: VALENCIA .
    Centro de lectura: FILOLOGIA.
    Centro de realización: DEPARTAMENTO: DEPARTAMENTO DE FILOLOGIA INGLESA Y ALEMANA PROGRAMA DE DOCTORADO: RETORICA Y LINGUISTICA INGLESA.
    Resumen: EN EL PRESENTE ESTUDIO EL AUTOR ANALIZA EL DISCURSO ESCRITO DEL INGLES PARA INFORMATICA EN CUATRO GENEROS DISTINTOS: ABSTRACTS, ARTICULOS DE INVESTIGACION, ARTICULOS DE PUBLICACIONES DEL TIPO "BYTE", Y ARTICULOS DE DIVULGACION CIENTIFICA. TODOS LOS TEXTOS SE ENCUENTRAN DENTRO DEL AMBITO DE LA INFORMATICA. CADA GENERO ES ESTUDIADO ATENDIENDO A CINCO VARIABLES: ESTRUCTURA, TEMAS MARCADOS (MARKED THEMES), SUJETOS, FORMAS VERBALES Y ACRONIMOS. LOS RESULTADOS INDICAN QUE EL DISCURSO ESCRITO DEL INGLES EN INFORMATICA SE DIFERENCIA DEL INGLES EMPLEADO EN OTRAS DISCIPLINAS. AL MISMO TIEMPO SE DEFINEN UNA AMPLIA SERIE DE DIFERENCIAS ENTRE UN GENERO Y OTRO EN RELACION A LAS VARIABLES ANALIZADAS. FINALMENTE, SE DESCRIBEN LAS POSIBLES IMPLICACIONES PEDAGOGICAS DE LA INVESTIGACION.
37 tesis en 2 páginas: 1 | 2
Google
Web www.cibernetia.com
Manuales | Directorio | Tesis: Ordenadores, Circuitos integrados...
english
Cibernetia