紅葉 (Kouyou) 2010

Cada año, por estas fechas, siempre me desespero porque siento que se me va a pasar el tiempo para ver los bonitos paisajes otoñales que Japón ofrece.

Esta vez fui a templo ubicado en la ciudad de Maebaru, prefectura de Fukuoka. Se llama 雷山千如寺大悲王院 (Raizan Sennyoji Daihi Oujin). En las páginas que muestran los lugares en donde ya se pueden ver las hojas rojas decían que este templo era de los mejores lugares en ese momento (13 de noviembre). Así que agarré el carro y me lancé a la aventura.

Continue reading “紅葉 (Kouyou) 2010”

TF-IDF: pesando las palabras

En el área de recuperación de información, la idea es obtener una serie de documentos considerados relevantes con respecto a ciertas palabras o expresiones. En términos generales, la idea es encontrar los documentos que más se acerquen a una búsqueda realizada con palabras clave o con expresiones más complicadas (como lenguaje natual propiamente). Ejemplo: una búsqueda en Google. Ponemos lo que estamos buscando y Google muestra una serie de resultados que calcula como importantes para esa búsqueda.

Es evidente que no existe una sola forma de encontrar los documentos, y más que encontrarlos, de asignarles un orden. Es muy fácil tener una colección de documentos y hacer una especie de consulta SQL donde regresemos solamente los documentos que contienen al menos una de las palabras buscadas, pero esto solo nos va a regresar los documentos en el orden que la base de datos los encuentra (o en el que le asignemos en el SELECT). Esta forma de búsqueda es la más simple de todas: búsqueda binaria. Pero, ¿se imaginan que ésta fuera la técnica que Google usara? ¿Cuántos documentos no tendríamos que revisar hasta encontrar (si es que lo hacemos) uno que en verdad contiene la información que se desea encontrar?

ejresgoogle

Google reporta 850,000 resultados para la búsqueda “Vacaciones en Cancún”, pero en la realidad solo muestra hasta el número 1,000. No obstante, son pocas y contadas las veces en las que revisamos más de 100 documentos. El orden importa, y es justamente lo que la recuperación de información trata de resolver.

Una búsqueda binaria no analiza más allá de si un documento contiene o no una o varias palabras; por tanto, así como regresa documentos en los que la palabra X aparece 1 vez, también regresa otros donde aparece 100 veces, por poner un ejemplo. ¿Cuál documento es entonces más importante?

La asignación de orden  se puede realizar de distintas maneras: fecha, autor, número total de palabras en el documento, etc. Entre las muchas formas de llevar a cabo esta tarea, existe la de asignarle peso a las palabras, es decir, de tratar de calcular qué palabras son más relevantes en un texto, y con base en eso decidir cuál documento es más probable que contenga la información buscada.

Continue reading “TF-IDF: pesando las palabras”

本音 (honne) y 建前 (tatemae)

Muchos dicen que lo más difícil del idioma japonés son los kanji. Ciertamente el número que hay que aprenderse para poder vivir sin muchos problemas (unos 2000) es muy alto, y se requiere de mucha disciplina para poder recordarlos y usarlos debidamente. No obstante, a lo largo de los años que he estudiado el idioma, me he dado cuenta de que lo más difícil del japonés es entender lo que no se dice; “leer entre líneas” dirían unos.

Un profesor de inglés (estadounidense) mencionó lo siguiente en una conversación que tuvimos:

“En los Estados Unidos, si tú eres el emisor y tu mensaje no se entiende, tú tienes la culpa por no saber expresarte, y tienes que pensar cómo transmitirlo con otras palabras. En cambio, en Japón, la culpa no es del emisor, sino del receptor, por no entender el contexto en el que está el mensaje ni haber captado lo que no se dice.”

Es bien sabido que en Japón no se dicen las cosas de forma directa. Para los que no están enterados, un ejemplo: En Japón nunca se dice “no”, sino que se busca una forma de decirlo sin decirlo. Algo así como mencionaba Polo Polo en su chiste “Día de campo”: “Las mujeres tienen esa don de decirte pendejo sin decírtelo”. La idea es similar. El caso no es no querer decirlo, sino hacer que el interlocutor lo infiera. Algunos dicen que es “cortesía”. Como ejemplo:

32 y contando

Séptimo cumpleaños que paso de este lado del mundo. Todavía me parece increíble que haya pasado tanto tiempo desde aquel primer año que pasé solo por acá, en el que juraba y perjuraba que regresaría a México lo más rápido que pudiera.

32 años todavía no son nada. Hay mucho que hacer, falta mucho camino por recorrer. Esos 32 llegan en un momento no tan lúcido, es cierto, y me hubiera gustado que no fuera así, pero todo está tomando más tiempo del que esperaba. No obstante, es un año más de experiencia, un año que trajo muchos retos (algunos todavía están pendientes) y una que otra satisfacción.

¿Presión por la edad? ¡Para nada! La única presión que tengo en este momento es la que yo mismo me he puesto, y no es ningún tipo de “prueba de resistencia” ni mucho menos, sino una especie de proyecto dirigido hacia lo que quiero hacer en el futuro.

Ahí la llevamos.

6 años de “bloguear”

Llegué a Japón en 2003, pero este blog lo comencé en 2004, más por recomendación que por iniciativa propia. Así fue el principio. En aquel entonces, ahora ya lejano septiembre de 2004, sinceramente nunca me pasó por la mente que 6 años después seguiría escribiéndolo.

Mucho ha pasado en mi vida por este lado del mundo; familiares se fueron y no estuve ahí para despedirlos. Otros nuevos llegaron, y cada que voy a México todavía me cuesta trabajo recordar algunas caras; otros más, crecieron; obviamente no serían niños toda la vida, pero una vez que te alejas y regresas después de un tiempo, el cambio te sorprende mucho.

Me volví un dizque maestro y luego un dizque doctor, en medio de un montón de problemas y contratiempos. La falta de apoyo fue casi fatal, pero salí, bien o mal, pero al final salí. Y justamente la premura del anuncio de mi graduación es lo que me puso en donde estoy ahora. No es un secreto que no estoy a gusto en este momento, por eso necesito moverme para no ser atrapado por la rutina y lo monótona que puede llegar a ser la vida acá.

Continue reading “6 años de “bloguear””

Una boda a la japonesa

El pasado fin de semana me tocó asistir, por cuarta vez desde que llegué a Japón, a una boda; pero esta vez sí tuve permiso para tomar fotos y usarlas dentro del blog, así que ni tardo ni perezoso.

El novio se llama Ryo (良) y la novia Mayumi (真由美). Se casaron oficialmente el 10 de octubre (10/10/10, así nunca habrá problemas de “¡se me olvidó nuestro aniversario! 😛 ), pero la ceremonia tuvo lugar el pasado día 16. Ambos son servidores públicos, y Ryo trabaja actualmente en el ayuntamiento de la prefectura de Yamaguchi. Por cierto, la boda tuvo lugar en esa prefectura.

Ésta es una entrada larga, y después del salto, está dividida en 4 páginas. Así que agarren palomitas y refresco 🙂

Las bodas en Japón son totalmente diferentes a como las conocemos en México (y para el caso, en la mayor parte de latinoamérica):

Continue reading “Una boda a la japonesa”

Entrevista en Radio Universidad – Horarios

La semana pasada tuve el privilegio de ser entrevistado por la cadena Radio Universidad de la Universidad de Guadalajara, y me informaron que el programa se transmitirá en 5 de las 8 estaciones de la cadena con el siguiente horario:

Fecha: martes 19 de octubre

Hora: 18:00

Estaciones:

Por el momento no me han dicho nada de cuándo se transmitirá en Guadalajara, pero paso el aviso por si hay gente de estos lugares siguiendo este su humilde blog y están interesados en escuchar la entrevista. En cuanto sepa los horarios de tranmisión en mi rancho, con mucho gusto los publico aquí.

Agradecimiento enorme a la licenciada Candice Carrazco por sus atenciones y por la invitación para la entrevista.

Procesamiento de lenguaje natural: ¿qué es?

El procesamiento de lenguaje natural es una rama de la inteligencia artificial que, explicado de la forma más simple, se dedica a tratar de hacer comprender a la computadora el lenguaje que nosotros, los humanos, usamos, sea español, inglés, japonés, klingon, etc.

Una vez que la computadora entienda el lenguaje natural, podemos realizar muchas tareas de forma más simple. Por ejemplo: imaginen que tienen que leer una serie de artículos en el periódico, todos ellos muy largos. Como en todo escrito, hay partes que son más importantes que otras; con procesamiento de lenguaje natural podríamos hacer que la computadora “leyera” esos artículos por nosotros y nos mostrara un resumen de cada uno, haciendo la lectura mucho más simple, menos tediosa y, sobre todo, conteniendo los puntos más importantes de cada escrito.

Lo anterior es solo por poner un ejemplo; sabemos de antemano que empresas como Google, Yahoo y Microsoft usan procesamiento de lenguaje natural para poder encontrar rápidamente documentos relevantes a una consulta generada en sus motores de búsqueda, siendo Google el que lleva la delantera. Así también, nos encontramos con programas de traducción automática, los cuales reciben un texto en un idioma X, lo analizan, y producen una respuesta el mismo escrito en otro idioma Y sin ayuda de traductores humanos.

Usos hay muchos, técnicas para hacer cada tarea, también, pero como en toda área de la IA actual, quedan todavía muchos problemas por analizar, por atacar, por mejorar la respuesta que ofrecen, por mejorar la velocidad y el performance de sus algoritmos… en fin, hay mucho trabajo que realizar.

Pueden leer un poco más en este documento que creé para las pláticas que di en México en abril de este año: Un vistazo al procesamiento de lenguaje natural

Cuando llegué a Japón, en mi vida había pensado, o siquiera conocido, sobre procesamiento de lenguaje natural; de hecho, yo llegué aquí con la idea de trabajar principalmente en procesamiento de imágenes, pero ya ven las vueltas que da el destino 爆笑 Toda mi investigación (lo poco que hice por acá) es respecto a características del idioma japonés y de cómo se pueden analizar al momento de traducir a español, tratando de enfocarme en el modo subjuntivo de este último. Por ahí trabajé también un poco con analizas de citas de texto (modo directo o indirecto), pero de todo esto ya hablaré con más calma en futuros posts. Solamente no quería comenzar a divagar escribiendo sobre temas más técnicos sin antes presentar, aunque sea de forma breve, la base de todos ellos.