紅葉 (Kouyou) 2010

Cada año, por estas fechas, siempre me desespero porque siento que se me va a pasar el tiempo para ver los bonitos paisajes otoñales que Japón ofrece.

Esta vez fui a templo ubicado en la ciudad de Maebaru, prefectura de Fukuoka. Se llama 雷山千如寺大悲王院 (Raizan Sennyoji Daihi Oujin). En las páginas que muestran los lugares en donde ya se pueden ver las hojas rojas decían que este templo era de los mejores lugares en ese momento (13 de noviembre). Así que agarré el carro y me lancé a la aventura.

Continue reading “紅葉 (Kouyou) 2010”

TF-IDF: pesando las palabras

En el área de recuperación de información, la idea es obtener una serie de documentos considerados relevantes con respecto a ciertas palabras o expresiones. En términos generales, la idea es encontrar los documentos que más se acerquen a una búsqueda realizada con palabras clave o con expresiones más complicadas (como lenguaje natual propiamente). Ejemplo: una búsqueda en Google. Ponemos lo que estamos buscando y Google muestra una serie de resultados que calcula como importantes para esa búsqueda.

Es evidente que no existe una sola forma de encontrar los documentos, y más que encontrarlos, de asignarles un orden. Es muy fácil tener una colección de documentos y hacer una especie de consulta SQL donde regresemos solamente los documentos que contienen al menos una de las palabras buscadas, pero esto solo nos va a regresar los documentos en el orden que la base de datos los encuentra (o en el que le asignemos en el SELECT). Esta forma de búsqueda es la más simple de todas: búsqueda binaria. Pero, ¿se imaginan que ésta fuera la técnica que Google usara? ¿Cuántos documentos no tendríamos que revisar hasta encontrar (si es que lo hacemos) uno que en verdad contiene la información que se desea encontrar?

ejresgoogle

Google reporta 850,000 resultados para la búsqueda “Vacaciones en Cancún”, pero en la realidad solo muestra hasta el número 1,000. No obstante, son pocas y contadas las veces en las que revisamos más de 100 documentos. El orden importa, y es justamente lo que la recuperación de información trata de resolver.

Una búsqueda binaria no analiza más allá de si un documento contiene o no una o varias palabras; por tanto, así como regresa documentos en los que la palabra X aparece 1 vez, también regresa otros donde aparece 100 veces, por poner un ejemplo. ¿Cuál documento es entonces más importante?

La asignación de orden  se puede realizar de distintas maneras: fecha, autor, número total de palabras en el documento, etc. Entre las muchas formas de llevar a cabo esta tarea, existe la de asignarle peso a las palabras, es decir, de tratar de calcular qué palabras son más relevantes en un texto, y con base en eso decidir cuál documento es más probable que contenga la información buscada.

Continue reading “TF-IDF: pesando las palabras”

本音 (honne) y 建前 (tatemae)

Muchos dicen que lo más difícil del idioma japonés son los kanji. Ciertamente el número que hay que aprenderse para poder vivir sin muchos problemas (unos 2000) es muy alto, y se requiere de mucha disciplina para poder recordarlos y usarlos debidamente. No obstante, a lo largo de los años que he estudiado el idioma, me he dado cuenta de que lo más difícil del japonés es entender lo que no se dice; “leer entre líneas” dirían unos.

Un profesor de inglés (estadounidense) mencionó lo siguiente en una conversación que tuvimos:

“En los Estados Unidos, si tú eres el emisor y tu mensaje no se entiende, tú tienes la culpa por no saber expresarte, y tienes que pensar cómo transmitirlo con otras palabras. En cambio, en Japón, la culpa no es del emisor, sino del receptor, por no entender el contexto en el que está el mensaje ni haber captado lo que no se dice.”

Es bien sabido que en Japón no se dicen las cosas de forma directa. Para los que no están enterados, un ejemplo: En Japón nunca se dice “no”, sino que se busca una forma de decirlo sin decirlo. Algo así como mencionaba Polo Polo en su chiste “Día de campo”: “Las mujeres tienen esa don de decirte pendejo sin decírtelo”. La idea es similar. El caso no es no querer decirlo, sino hacer que el interlocutor lo infiera. Algunos dicen que es “cortesía”. Como ejemplo:

32 y contando

Séptimo cumpleaños que paso de este lado del mundo. Todavía me parece increíble que haya pasado tanto tiempo desde aquel primer año que pasé solo por acá, en el que juraba y perjuraba que regresaría a México lo más rápido que pudiera.

32 años todavía no son nada. Hay mucho que hacer, falta mucho camino por recorrer. Esos 32 llegan en un momento no tan lúcido, es cierto, y me hubiera gustado que no fuera así, pero todo está tomando más tiempo del que esperaba. No obstante, es un año más de experiencia, un año que trajo muchos retos (algunos todavía están pendientes) y una que otra satisfacción.

¿Presión por la edad? ¡Para nada! La única presión que tengo en este momento es la que yo mismo me he puesto, y no es ningún tipo de “prueba de resistencia” ni mucho menos, sino una especie de proyecto dirigido hacia lo que quiero hacer en el futuro.

Ahí la llevamos.