Software del Proyecto de Investigacion LADEX

Introducción

Con la finalidad de proporcionar herramientas para permitir a los investigación del proyecto LADEX ,y así llevar a cabo el análisis de los textos que forman parte de los corpus lingüísticos que se utilizan dentro del proyecto, se ha llevado a cabo el diseño e implementación de una serie de herramientas para el procesamiento de textos lingüísticos. Estas herramientas son las siguientes:

LADEX Annotator Tool

Esta herramienta sirve para compilar el corpus lingüístico en un formato que pueda ser anotado con meta información asociada a cualquier elemento lexicográfico del corpus. El corpus lingüístico está diseñado para ser almacenado en el formato standard TEI XML permitiendo así su posterior procesamiento con otras herramientas.

LADEX Corpus Management Tool (L ADEX CMT)

Esta herramienta permite a múltiples usuarios llevar a cabo la anotación “concurrente” de los corpus lingüísticos de forma que todos puedan trabajar de forma segura en paralelo, creando así una “comunidad de anotación”.

LADEX Tagging Service Tool (LADEX TST)

Esta herramienta permite realizar el etiquetado morfológico automático de textos TEI XML en diferentes idiomas.

LADEX Search Tool

Esta herramienta permite a los investigadores realizar multitud de búsquedas sobre la información previamente anotada en los corpus lingüísticos para llevar a cabo el análisis de los textos del proyecto.

Figure 1. Diagrama de Flujo del Proyecto
El diagrama de flujo (Figura 1) indica las herramientas a utilizar a lo largo de todo el ciclo de vida de las investigaciones realizadas en el proyecto. Nótese que los investigadores del proyecto solo utilizan Internet Explorer para compilar los textos y las dos herramientas creadas para LADEX: LADEX Annotator Tool y LADEX Search Tool, las otras herramientas anteriormente indicadas son en realidad servicios utilizados por estas dos herramientas para poder cumplir el propósito del proyecto pero que no tienen una interfaz gráfica para el usuaria final sino que son servicios usados internamente dentro de estas herramientas. Se puede observar un diagrama completo de la interrelación entre herramientas en la figura 2.

Figure 2. Interrelación entre las diferentes herramientas de proyecto.

En el resto del documento se describirán las funcionalidades implementadas en el marco de este proyecto de cada una de estas herramientas así como una guía para su funcionamiento
Instalación LADEX Annotator 4.0

Esta pagina web contiene los enlaces para la instalacion e utilización del software de LADEX. Para instalar la herramienta de Annotación, se ha de tener instalado en el ordenador la aplicacion gratuita “Java Runtime Enviroment 7.0 o superior”. Se puede descargar directamente desde el siguiente enlace. Una vez pinchado el enlace, seleccionar en “JRE -> Download” y después darle al botón para “aceptar la licencia” y descargar el fichero que se llama “Windows x64” “jre-7u25-windows-x64.exe” e instalarlo (siguiente -> siguiente —- -> siguiente).
Si por casualidad diera un error durante la instalación entonces descargar el fichero “Windows x86 Offline” jre-7u25-windows-i586.exe e instalar.
El motivo de este error es que es posible que el ordenador que estes usando sea un poco antiguo o por lo menos su sistema operativo. Una vez instalado la “JRE”, ahora accedemos a la pagina principal del software de LADEX:
JRE 7.0 download
Posteriormente, el software se instalara automaticamente simplemente presionando en el siguiente enlace. Es importante que se utilice el navegador “Internet Explorer” y no otro para asegurar que todo se hace bien.
LADEX Annotator 4.0 download Si pregunta alguna pregunta responder siempre aceptando los posibles riesgos de seguridad. Si todo ha ido bien, ahora debe de haber en el “Menu Inicio -> LADEX ” Un icono llamado “LADEX Annotator 4.0” (o similar). Haciendo doble click en el icono se abré el anotador.
Configuracion LADEX Annotator 4.0

La primera vez (y solo la primera vez) que se abre LADEX Annotador 4.0 hay que configurarlo para que utilize todos los servicios información creados para el proyecto. Por tanto, para hacer esta configuracion hay hacer click en el Menu “Config” y en el submenu “Config”. En la pantalla que ha salido hay que indicar los siguientes parametros para el proyecto LADEX: Importante! Cuidado cuando copies las direcciones URL, los usuarios y las contraseñas, son SENSIBLES A MAYUSCULAS y MINUSCULAS
El area de “VRP Config” se puede ignorar puesto que el modulo VRP no es usado en LADEX.

El área de “CMT Config” tiene que ser rellenada con los siguientes parámetros:
– URL: http://sacodeyl.inf.um.es/ladex-cmt/CMTWebService?wsdl
– User: (el que te he mandado por correo electrónico)
– Pass: (el que te he mandado por correo electrónico)

El área de “Tagging Server Config” tiene que ser rellenada con los siguientes parámetros:
– URL: http://sacodeyl.inf.um.es/taggingservice/TaggingService?wsdl
– Ademas ha de asegurarse de que esta activada la opción “Enable Automatic Tagging” (que viene por defecto desactivada)

Posteriormente, pincha en el boton “Save Changes” y cerrar el anotador por completo (salir de la aplicacion) para que se guarden los cambios correctamente.

Uso de LADEX Annotator 4.0

Una vez que esta el software configurado para su uso, se puede ver la documentación que explica como se utiliza, dentro de la ayuda que viene integrada dentro de la propia aplicacion. Para acceder a la ayuda es suficiente con hacer click en el Menu -> Ayuda -> Ayuda.
A modo de resumen, un investigador, abria su corpus linguistico colaborativo y podra abrir cualquier documento disponible dentro de ese corpus (para ello usara los botons del menu/barra de herramientas para abrir corpus y abrir documento).
Una vez abierto el documento para trabajar con el, Se puede realizar la anotación manual de cualquier etiqueta que esta en el arbol de taxonomias, simplemente arrastrando la etiqueta encima del texto. Esta accion asocia esa etiqueta al texto abierto y una vez que esta etiqueta esta asociada se puede anota un “trozo de texto” con dicha etiqueta. “Trozo de Texto” puede ser desde una simple letra o signo, hasta una palabra, media palabra, o mas de una palabra (media frase), frase, etc.
Para hacer esta accion, el investigador simplemente secciona el “trozo de texto” y una vez seleccionado, le da al boton derecho y aparecera la lista de etiqueta que se puede “annotar” sobre el texto selccionado. Simplemente, se selecciona la etiqueta deseado y al hacer esta accion, la etiqueta quedara anotada sobre el texto.
Es importante recordar que una vez que una persona ha terminado de trabajar con un texto, tiene que cerrarlo para que los cambios queden almacenados en el servidor.
Tambien merece la pena destacar que la herramienta no ha sido diseñada para que este abierta sin que el investigador no haga nada por que esta pensada para “trabajar en equipo” y por tanto cuando hay varias personas trabajando con textos “abiertos” es por que estan trabajando a la vez en el mismo texto. Asi que, hay un mecanismo de seguridad que cancela la edición del texto pasados 60 minutos de inactividad con el fin de dejar trabajar al otro compañero.

Uso de LADEX Search Tool

Cuando una persona hace cambios en un corpus linguistico, quiere ver los cambios reflejado en la interfaz de busqueda que va a utilizar para consular el corpus linguistico. Por tanto, para hacer una actualización de la información que utiliza la herramienta de busqueda con la finaliad de asegurar que se esta trabajando con la ultima version del corpus, se puede abrir el siguiente enlace:
Actualizar Corpus
Una vez actualizada la herramienta de busqueda, la herramienta de busqueda se puede utilizar mediante el siguiente enlace: Herramienta de Busqueda de LADEX
Para tener mas información acerca de como realizar busquedas se puede ver la documentacion que tiene la propia herramienta

Leave a Reply

Your email address will not be published. Required fields are marked *