Parametrizador morfológico de textos español - ParamText TIP

Accede a ParamText TIP 

Se ha desarrollado una herramienta de ayuda al escritor y a los estudiosos de libros, novelas, narrativa, poesía y de todo tipo de textos, denominada Parametrizador Morfológico de Textos (Pruebe el ParamText TIP). El Paramtext TIP analiza un documento y extrae información estadística de interés. Los datos analizados se muestran en gráficas y en tablas, exportables a Microsoft excel, para su estudio y análisis posterior por el usuario.

El ParamText TIP analiza el contenido léxico de un texto, extrayendo el número de párrafos, oraciones, palabras y caracteres. Asímismo, se extrae para cada uno de estos grupos el número de oraciones, de palabras y de caracteres de cada párrafo, el número de palabras y de caracteres de cada oración y el número de caracteres de cada palabra. Ofrece información métrica como la frecuencia de aparición de las palabras en el texto, el centro de gravedad de los vocablos, la distribución de las palabras según su primera aparición y su frecuencia de uso en el español. Asimismo, se muestra en una tabla el vocabulario completo utlizado en el texto.

El ParamText TIP analiza morfológicamente el texto y extrae información relacionada con las categorías gramaticales de las palabras y su flexión morfológica. ParamText TIP no realiza un análisis sintáctico de las frases y, por tanto, no desambigüa las múltiples opciones morfológicas que en ocasiones puede tener una palabra, sino que ofrece el reconocimiento morfológico de cada palabra independientemente de su función en la oración. El grupo Text & Information Processing está trabajando para extraer además la función gramatical que le corresponde a cada palabra en la oración.

Por otro lado, el ParamText TIP permite distinguir todos los análisis y resultados entre palabras con significado o sentido semántico y palabras vacías. Inicialmente, el ParamText TIP aporta un conjunto de palabras vacías por defecto que el usuario puede modificar en cualquier momento según sus intereses.

ParamText Tip es el Proyecto Fin de Carrera de Juan Carlos Santana Herrera en la titulación de Ingeniería Informática. Este proyecto fue dirigido por Francisco Javier Carreras Riudavets y contó con la participación en el desarrollo de las librerías de lematización y silabeo de las palabras con Zenón Hernández Figueroa y Gustavo Rodríguez Rodríguez.

 


En caso de citar este artículo, por favor use la siguiente referencia:

Carreras-Riudavets, F.; Santana-Herrera, J.C.; Hernández-Figueroa, Z.; Rodríguez-Rodríguez, G. (2011). Parametrizador morfológico de textos - ParamText TIP. Disponible en http://cltip.iatext.ulpgc.es

Español