La muerte anunciada de Yahoo

¿Puede la arquitectura de Yahoo sobrevivir el crecimiento exponencial del Web? Escrito por Louis Rosenfeld en 1995, cuándo Yahoo era la pincipal herramienta de búsqueda de información en la Web.
Louis Rosenfeld
Septiembre 1, 1995
Traducido por Fernando Siles
Marzo 20, 2004

o, Cómo el golpe doble de la arquitectura web y la recuperación de la información acabarán con Yahoo.

El sistema se descompone; el eje cede;
Se desata la pura anarquía en el mundo

-- W.B. Yeats, « El segundo advenimiento » (The second coming)

Una de las historias más importantes de los últimos tiempos en Internet es el gran éxito del directorio de recursos de información (Yahoo http://www.yahoo.com/search.html). Con sólo un año de vida, Yahoo recibe millones de clics diarios, ha sido convertido en una empresa, y es responsable (al menos temporalmente) del descarrilamiento de las carreras de dos prometedores estudiantes de doctorado.

Como reciente refugiado de un programa de doctorado, puedo comprender lo que Jerry Yang y David Filo deben estar sintiendo; es difícil hacer grandes progresos en las obligaciones del doctorado cuando La Red proporciona tantas oportunidades "reales" para poner a prueba tus ideas. Yo también dirijo un directorio en Internet http://www.clearinghouse.net/index.html, y como no he sido contactado todavía por ningún inversor, pueden ustedes tenerme en cuenta el título de este artículo y acusarme de estar algo verde. Y con toda la razón.

Dejando a un lado mi petulancia y envidia, Yahoo es exitoso porque realmente ayuda a millones de usuarios del Web a buscar información en una amplia variedad de temas. Yahoo es verdaderamente uno de los mejores (“Best of the Net”); ha venido a llenar un enorme vacío en las áreas de búsqueda y navegación de información en Internet. Por lo cual espero que me crea cuando digo que me entristezco cuando pronostico la muerte de Yahoo. Parece inevitable, pues su organización, la arquitectura de su información, se colapsará bajo el peso del gran volumen de registros. Y, desafortunadamente, la búsqueda no solucionará el problema.

La estructura de Yahoo: El dique está a punto de romperse

Paradójicamente gran parte el éxito actual de Yahoo puede ser directamente atribuido a su estructura. La arquitectura de Yahoo proporciona un interfaz bastante consistente y fácil de navegar por una jerarquía de aproximadamente 70,000 registros. Se trata de una cifra considerable. Sin embargo, los usuarios no tienen que vérselas todavía con listas de resultados irritantemente largas. Los usuarios pueden moverse por las categorías y las subcategorías de Yahoo sin enredarse en los niveles. Dicho de otra forma, Yahoo resuelve adecuadamente la cuestión del contrapeso entre el ancho y la profundidad de su jerarquía. Los usuarios de Yahoo no afrontan menús demasiado largos ni tienen que elegir (o hacer “clic”) a través de demasiados niveles de categorías y subcategorías del directorio para encontrar su camino.

Sabemos que en Internet hay más de 70,000 fuentes de información diferentes, y que ese número se va a incrementar, puede que exponencialmente, durante un tiempo. ¿Cómo se las arreglará el árbol de categorías de Yahoo cuando incluya 100,000 registros, o 1,000,000?

Supongamos que los directores de Yahoo estudian el campo de la interacción hombre – máquina (HCI) y deciden que ningún menú debe de sobrepasar los 10 registros. Para acomodar 100.000 registros con esta limitación, el directorio de Yahoo necesitaría cinco niveles de profundidad (10 elevado a la quinta potencia). Esto podría no parecer tan profundo, pero no queda tanto hasta el 1.000.000 registros (10 elevado a la sexta potencia); ¿querrán los usuarios navegar por seis niveles para encontrar lo que necesitan? Está claro que muchos no tendrán la paciencia para seguir mirando más allá de tres niveles.

Se puede jugar con estas cifras. Una jerarquía más ancha y menos profunda con 15 registros por menú acogería hasta 750.000 registros en cinco niveles, y 11.000.000 en seis. Aquí encaramos un riesgo diferente: que los usuarios pierdan la paciencia al no poder escanear fácilmente listas de hasta con 15 líneas.

Dolores de cabeza en la recuperación de la información: ¿Cuanto puede la búsqueda ayudar a mejorar?

Estoy convencido de que Yahoo finalmente perderá la batalla del ancho contra la profundidad. Muchos dirán que esto es discutible debido al servicio de búsqueda que ofrece Yahoo; siempre que el usuario pueda introducir algunas palabras claves para buscar, ¿por qué se va a molestar navegando por el directorio de categorías? ¿No genera el buscador una lista correcta de resultados al instante?

En desacuerdo con décadas de estudios en el campo de la recuperación de la información, muchos de los cuales nos enseñan que los usuarios que recuperaron el 25% de los artículos relevantes, tuvieron suerte. No trataré de resumir aquí las publicaciones de una disciplina entera, sólo apuntaré uno de sus principios, algo que tendemos a dar por asumido: la lengua es ambigua. Por ejemplo, considere los múltiples significados y contextos de la palabra pitch*. Pitch significa algo diferente para un obrero de lo que significa para un vendedor, un boxeador, etc. Pitch puede ser un verbo o un nombre, y es la raíz de muchas otras palabras. Debido a su ambigüedad, la búsqueda de información es muy difícil, ya se trate del índice de Yahoo o del catálogo manual de tu biblioteca popular.

La calidad de una búsqueda es igual que la de los elementos que se buscan. Los registros de Yahoo están etiquetados por aquellos que los dan de alta; en otras palabras, los registros no están siendo documentados por una sola persona (o un grupo coordinado) que siga un sistema de rotulado consistente. Esta variabilidad la encontramos también en el cuadro de clasificación, que soporta actualmente numerosos duplicados y solapamientos entre categorías y subcategorías. Lo demostraré con un ejemplo básico: usted y yo estamos compitiendo en el negocio de productos para enjuagar la boca de los perros; la web de su compañía ha sido catalogada bajo Productos de Higiene Canina y la mía bajo Productos de Cuidado Personal para Perros. ¿Donde tendrían que mirar los usuarios? ¿Se les ocurrirá mirar en ambos lugares? ¿Se les ocurrirá siquiera que existen dos categorías similares? Este tipo de anomalías tenderán a incrementarse según el volumen de registros de Yahoo aumente.

En honor a la verdad, catalogadores profesionales están siendo contratados para trabajar en este tipo de problemáticas en Yahoo. Lógicamente vamos a ver mejoras en la organización y etiquetado que Yahoo utiliza. Pero tal enfoque puede llevar al equipo de Yahoo al borde de duplicar algunos de los desafortunados esfuerzos de los últimos años para clasificar Internet. Parece probable que las técnicas de la biblioteconomía, que han tenido un éxito limitado en las bibliotecas y otros ámbitos de información tradicionales, significarán y serán incluso menos escalables en el distribuido, descentralizado y heterogéneo espacio de información que nos encontramos en el Web.

¿Tan negro está el panorama?

Es fácil ser crítico, especialmente para alguien que no ofrece soluciones concretas. Pero mi crítica de Yahoo está basada en problemas suficientemente conocidos de la recuperación de la información y de la interacción hombre computadora, problemas para los cuales nadie ha encontrado soluciones satisfactorias. Yahoo es como cualquier otro gran sistema de información: dista de ser perfecto y nunca lo será.

Esto no quiere decir que Yahoo no siga teniendo valor en un futuro. Aparte de lo inmanejable que se haga, Yahoo puede continuar siendo lo más parecido a unas Páginas Amarillas en Internet. Esto no es nada malo, y si es el caso, estoy seguro de que los financieros de Yahoo estarán de lo más contentos con las ganancias de sus inversiones. Pero, de la misma manera en que confiamos en las Páginas Amarillas, también nos valemos de otras muchas fuentes de información para trabajar y vivir. Posiblemente la solución es no presentar a Yahoo como la panacea a cualquier necesidad de información de los usuarios de Internet, sino como una parte de un panorama mucho mayor.

* Nota del traductor: en inglés, la palabra pitch significa al mismo tiempo “vendedor”, “bateador” y “brea”, entre otras definiciones.

jarango — Marzo 21, 2004 04:54 PM