Procesamiento de lenguaje natural: ¿qué es?

El procesamiento de lenguaje natural es una rama de la inteligencia artificial que, explicado de la forma más simple, se dedica a tratar de hacer comprender a la computadora el lenguaje que nosotros, los humanos, usamos, sea español, inglés, japonés, klingon, etc.

Una vez que la computadora entienda el lenguaje natural, podemos realizar muchas tareas de forma más simple. Por ejemplo: imaginen que tienen que leer una serie de artículos en el periódico, todos ellos muy largos. Como en todo escrito, hay partes que son más importantes que otras; con procesamiento de lenguaje natural podríamos hacer que la computadora “leyera” esos artículos por nosotros y nos mostrara un resumen de cada uno, haciendo la lectura mucho más simple, menos tediosa y, sobre todo, conteniendo los puntos más importantes de cada escrito.

Lo anterior es solo por poner un ejemplo; sabemos de antemano que empresas como Google, Yahoo y Microsoft usan procesamiento de lenguaje natural para poder encontrar rápidamente documentos relevantes a una consulta generada en sus motores de búsqueda, siendo Google el que lleva la delantera. Así también, nos encontramos con programas de traducción automática, los cuales reciben un texto en un idioma X, lo analizan, y producen una respuesta el mismo escrito en otro idioma Y sin ayuda de traductores humanos.

Usos hay muchos, técnicas para hacer cada tarea, también, pero como en toda área de la IA actual, quedan todavía muchos problemas por analizar, por atacar, por mejorar la respuesta que ofrecen, por mejorar la velocidad y el performance de sus algoritmos… en fin, hay mucho trabajo que realizar.

Pueden leer un poco más en este documento que creé para las pláticas que di en México en abril de este año: Un vistazo al procesamiento de lenguaje natural

Cuando llegué a Japón, en mi vida había pensado, o siquiera conocido, sobre procesamiento de lenguaje natural; de hecho, yo llegué aquí con la idea de trabajar principalmente en procesamiento de imágenes, pero ya ven las vueltas que da el destino 爆笑 Toda mi investigación (lo poco que hice por acá) es respecto a características del idioma japonés y de cómo se pueden analizar al momento de traducir a español, tratando de enfocarme en el modo subjuntivo de este último. Por ahí trabajé también un poco con analizas de citas de texto (modo directo o indirecto), pero de todo esto ya hablaré con más calma en futuros posts. Solamente no quería comenzar a divagar escribiendo sobre temas más técnicos sin antes presentar, aunque sea de forma breve, la base de todos ellos.