[Ayuda] acerca de Goolge
Gustavo Guillermo Pérez
gustavo en compunauta.com
Dom Ago 27 16:31:37 CDT 2006
Enlace interesante....:
http://www.razonypalabra.org.mx/anteriores/n42/agomez.html
----------------------------------------------------------------
Unir, Compartir, Distribuir: la Búsqueda de Información en la Red. El caso
Google
Por Antonio Gómez
Número 42
Resumen
La revolución tecnológica de las comunicaciones se basa en la posibilidad de
unir, compartir y distribuir la información de todos los usuarios de la Red a
nivel mundial y en tiempo real. Por este motivo, si en Internet está todo, lo
importante ya no es saber, sino saber encontrar lo más relevante, la posesión
de la información no es ya la cuestión central, sino el acceso, saber
encontrar la información que necesitamos a la mayor brevedad posible y con la
mayor concreción posible. En este sentido el uso y el mercado de los
buscadores se presentan como uno de los mercados más prometedores y uno de
los temas más polémicos para un futuro próximo.
La búsqueda de información con el uso de motores de búsqueda implica tres
cuestiones fundamentales y muy debatidas en los actuales estudios sobre
Internet: la cuestión de la libertad de expresión, la cuestión de la
formación del conocimiento y la cuestión de la amenaza de la privacidad.
Buscadores
El mercado de las búsquedas en Internet se perfila como uno de los más
disputados en un futuro próximo. Yahoo!, MSN1 y Google parecen ser los tres
gigantes que compiten en este mercado. Sus ataques circulan entorno a sus
buscadores y sus servicios de correo2. La próxima pelea parece que será el
mercado de la información local3.
Tras varios años de competencias entre los distintos tipos de buscadores, la
búsqueda a través de algoritmos del tipo de Google está imponiéndose a la
indexación tradicional de páginas como Yahoo!, al ser mucho más eficaz. Por
otro lado la publicidad encuentra en las búsquedas un campo de cultivo muy
interesante ya que al hacer una búsqueda un internauta expone muy claramente
sus intenciones lo que significa que se le puede ofrecer información
comercial completamente ajustada a lo que está buscando, por este motivo la
publicidad en este servicio es la que más está creciendo en la Red.
Cuando los matemáticos creadores de Google, Segey Brin y Lawrence Page,
estaban preparando su proyecto de investigación hace seis años, y crearon su
herramienta de búsqueda estudiando las relaciones combinatorias entre sitios
web probablemente no pensaron que Google sería actualmente el buscador más
utilizado de la Red, que va camino de convertirse en herramienta de consulta
universal. Su primer servicio, el buscador, nació hace seis años. Hoy utiliza
miles de ordenadores PC (se dice que hoy tienen más de 100.000), con lo cual
consiguen varias ventajas: una red descentralizada, que les da más agilidad a
las búsquedas, en casos de fallos nunca afecta a todo el sistema y además es
más barato. Con ellos sirven diariamente más de 150 millones de consultas en
menos de 0,2 segundos. Tras la salida a bolsa el pasado mes de agosto de
Google, sus creadores se han convertido en dos de los jóvenes más ricos el
mundo.
El objetivo inicial del buscador perfecto ha traído consigo muchos usos
interesantes, y no todos estaban pensados en un principio. Para mantener su
posición de motor de búsqueda más popular, Google va incorporando nuevas
habilidades, como el listado de imágenes4, tiendas, noticias o citas, fruto
de la creatividad de sus laboratorios5. Allí nació Google News6, que le
confiere a computadoras la misión de presentarnos las noticias más
importantes del momento. Google News es un desarrollo del mismo software del
buscador, que analiza el número de links a un documento o noticia y la
credibilidad del sitio web del que procede. Esta ‘primera plana’, que tiene a
toda la industria informativa desencajada, selecciona información extraída de
más de 4.000 sitios de fuentes informativas, las agrupa por secciones –
Negocios, Ciencia y Tecnología, Deportes – y las ofrece a los internautas
actualizadas cada quince minutos; y además sorprende por su pertinencia. Todo
esto lo hace de forma automática, sólo con un software, y sin un solo
periodista. Es decir, Google aprovecha el trabajo combinado de cientos de
miles de periodistas y de miles de directores de periódico.
Frente a este nuevo servicio muchos se preguntan si el periodismo de la era de
Internet será una acumulación sin alma de conexiones electrónicas entre
negocios mediáticos globales o si continuará requiriendo un agudo criterio
editorial, reporteros que estén al día, columnistas provocativos y una dosis
de personalidad.
Otro producto es Froogle7, que ofrece información y fotografías de todo lo que
se vende. Lanzando a toda prisa, justo antes de las Navidades de 2002, tiende
aún a dar demasiadas respuestas, lo que confunde a los compradores. En otra
línea el Viewer8, apodado Google TV, permite que el consumidor vea desfilar,
sin cliquear, las páginas que corresponden a las respuestas que busca. Pero
aun no está a pleno rendimiento porque hay problemas con los diferentes
estándares de los vídeos y con la velocidad de descarga; aunque estos
problemas técnicos se podrían resolver, la cuestión parece estar sobre todo
en los problemas de derechos de autor. La oferta del motor de búsqueda se
completa con las Citas de Google9; que permite conocer lo que se dice sobre
de un sitio. Es una extensión de la tecnología de base que no sólo se ocupa
de los vínculos que llevan a una página sino de lo que dicen sobre ella.
Frente a esta avalancha algunos editores de enciclopedias defienden la
información contrastada, comprobada y seleccionada de las enciclopedias
frente a los problemas de fiabilidad de la información de la Red. Otros no
ven posibilidades de competencia con una base de datos tan grande como la que
ofrece Internet y que Google rastrea. Pero frente a la red, como medio
abierto, y las enciclopedias, como medios cerrados, consideran que el abierto
puede ayudar al cerrado pero al revés no. en contra alguno piensan que la
batalla del papel contra el soporte informático está perdida y que el futuro
probablemente pase por enciclopedias en red permanentemente actualizadas y
contrastadas, donde compraremos en lugar de cuarenta tomos una clave de
acceso.
El secreto del sistema de algoritmos para la búsqueda de datos que rigen a
Google está guardado con enorme celo, pero se sabe que PageRank, nombre de la
tecnología, establece el valor de un sitio en base al número de enlaces que
apuntan a su dirección. Es decir que mide la popularidad de cada web en
comparación con otras del mismo contenido y enlazan con ella situando las
mejores en los primeros lugares. De este modo, un enlace que permite ir de la
página A a la página B es interpretado como un voto de A a favor de B, además
PageRank pondera los resultados al dar una importancia mayor a los votos de
sitios que reciben más tráfico, y no indexa todas las páginas de un sitio.
Con este sistema se favorece a las páginas más visitadas haciéndolas más
visitadas aún, con lo que la posición monopolística de Google contribuye a
que toda la estructura de la web sea más rígida. Para romper esta rigidez y
mejorar su posición, algunas empresas utilizan, entre otros recursos, link
farms, páginas llenas de enlaces que apuntan a su sitio. Cuando detecta la
maniobra, Google baja la posición de dicho sitio10. La revolución tecnológica
consiste en sus posibilidades no troncales de acceso a la información, en
forma de red, de todos con todos, al margen de una vía principal, y las
fórmulas de indexación de los motores de búsqueda pueden estar favoreciendo
la formación de vías principales de flujo de información (Mattelart, 1998).
Otro recurso es pagar por un espacio publicitario en la parte alta de Google.
Libertad de expresión y visibilidad (publicidad)
La industria de los buscadores en Internet es un negocio creciente y a medida
que suben las cifras de los ingresos se agudizan los movimientos
empresariales para tomar posiciones en este mercado.
El negocio más próspero es el de la inclusión de enlaces pagados en los
resultados que se ofrecen durante una búsqueda. En algunos casos, estos
enlaces de pago se diferencian claramente del resto, pero algunos buscadores
cobran por situarlos en la cabecera de la lista de respuestas suministradas
sin advertir al internauta de que se ha cobrado por su aparición en lugar
preeminente.
Numerosas compañías pagan a los motores de búsqueda para que sus sitios
aparezcan bien ubicados cuando un internauta hace una consulta relacionada,
de lejos o de cerca, con su área de actividad11. Constituye una buena
práctica comercial para ambas partes. Sin embargo, es grave que el público no
esté debidamente informado. Este tipo de acuerdos limita las opciones del
consumidor y puede llegar a alterar nuestra relación con el conocimiento.
Los motores de búsqueda tienen dos maneras de favorecer a quienes pagan. La
primera es el posicionamiento pagado, que consiste simplemente en colocar al
inicio de la lista de los resultados de búsqueda a todos aquellos que se
hayan suscrito al servicio. De esta manera cuando realizamos una búsqueda
aparecen tanto sitios relacionados con el tema, como sitios de empresas que
han pagado por estar ahí.
La segunda manera de favorecer a los pagadores, más compleja, consiste en
indexar con mayor frecuencia ciertos sitios y, por consiguiente, en tener a
los usuarios mejor informados de sus desarrollos más recientes; esto se llama
inclusión pagada.
La mayoría de los usuarios no tienen conocimiento de que los motores de
búsqueda más populares cobran tarifas especiales a cambio de colocar algunos
sitios de manera más visible que otros12. La falta de claridad de los motores
de búsqueda es grave para el consumidor quien puede considerar comprar en un
sitio convencido de que la marca ha convencido a la mayoría de los usuarios,
cuando realmente le ha pagado al buscador más que sus competidores por
figurar en buena posición.
Google parece respetar – hasta ahora- de manera escrupulosa las fronteras
entre información y publicidad. Utiliza para su publicidad el sistema
Adwords, que aparte de cobrar al anunciante sólo cuando alguien pincha el
anuncio, también relega a los anuncios, e incluso los retira, si no interesan
al internauta. La colocación de un anuncio depende por tanto de que lo enlace
mucha gente, pero también de que lo paguen. De esta forma la clasificación
del anuncio corre al 50% a cargo de los anunciantes y de los usuarios, de
manera que si un sitio está muy arriba en la lista no es sólo porque han
pagado mucho, sino porque, teóricamente, a la gente le interesa. En Mayo de
2003 Google compró Applied Semantics, una empresa dedicada a analizar el
contenido de las webs para incrustar la publicidad más idónea. Sus programas
disciernen entre si el usuario, cuando busca sobre un término ambiguo, por
ejemplo Ibiza, está interesado en coches o en un viaje a la isla para colocar
publicidad automovilística o de ocio.
El éxito de Google, cuyo negocio no es sólo la publicidad adosada a los
listados de búsqueda (aunque algunas fuentes aseguran que representa el 95%
de sus ingresos13) sino la venta de su tecnología a terceros, ha animado
nuevas aventuras en este mercado. El mismo software que busca documentos en
la Red puede rastrear información en la intranet de una empresa. Y a Google
no le faltan clientes dispuestos a pagar entre 28.000 y 250.000 euros por
estas herramientas de hecho Google es rentable desde 2001.
La información no siempre es poder (conocimiento)
Siguiendo una interpretación conducta humana, cuando navegamos por Internet en
muchas ocasiones seleccionamos lo que nos parece más relevante entre la
ingente masa de información que recibimos, lo que nos lleva a cometer
errores. A esto se añade que Internet no es una fuente de información, es un
canal por donde fluye una enorme cantidad de información cuya fiabilidad
depende de las fuentes de las que procede. No siempre lo que está disponible
en Internet es bueno, es decir, significativo. Una de las claves del éxito
del cambio tecnológico en la enseñanza es la producción, gestión y acceso a
los contenidos de calidad.
El acceso a toda la información no sustituye la competencia previa para
saber qué información pedir y qué uso hacer de ella. El acceso directo a no
suprime la jerarquía del saber y de los conocimientos. Hay algo de
fanfarronada en creer que uno se puede instruir sólo con tener acceso a las
redes (Wolton, 2000:97).
Pero muchos estudiantes piensan que si no encuentran la información que buscan
en Internet de manera inmediata, es que no existe. Se olvidan así de otras
fuentes impresas como los libros, las revistas, bibliotecas y de los propios
profesores que conforman la fuente de referencia de información y
conocimiento más importante. Incluso los propios estudiantes no valoran lo
que la Red les puede realmente proporcionar, fácilmente olvidan la
información y documentación que esconde la misma Internet y que nos muestra
en ‘primer lugar’ el buscador de turno. El volumen de información que puede
ser accesible en la llamada ‘Internet visible’ es ínfimo respecto a la
zona ‘invisible’.
Que Internet ofrece una gran libertad de expresión es teóricamente cierto, una
vez publicada la información está disponible para los millones de usuarios,
entre otros muchos miles de millones de documentos, lo que en la práctica
equivale a que la posibilidad, de que esa información se vea está muy próxima
a cero. La parte visible de la WWW está concentrada en unos cuantos nodos
hacia los que apuntan multitud de enlaces, lo que queda fuera de ellos es
prácticamente invisible, ya que los buscadores utilizados para localizar
información en Internet están sesgados hacia los grandes nodos, cuestión que
deberían considerar los nuevos empresarios que fabrican memoria, no bienes
(Rifkin, 2000: 196).
Si dos personas buscan el mismo dato en una enciclopedia es imposible que
lleguen a soluciones distintas. El peligro de Google, lo que falla, es la
fiabilidad de las fuentes. A esto se añade que desde que somos conscientes de
que todo el mundo busca en Google, existe la tentación de meter información
falsa. Aun así, Google es una herramienta fundamental, cuya misión utópica
original es organizar la información mundial y hacerla universalmente
accesible y útil. Google es la diversidad y la diferencia; pone a disposición
de los usuarios la mayor diversidad de información de la historia de la
humanidad.
Pero ninguno de estos artilugios resuelve el problema que mortifica a todos
los internautas: la lista interminable de respuestas, entre las cuales es
difícil escoger. Los internautas son impacientes y van directamente a al
primer resultado. La casi omnipotencia de Google preocupa a pequeños
empresarios cuyas entradas dependen de la posición obtenida en la
clasificación de este sitio de referencia. Ser excluido de las primeras
respuestas equivale a una condena, por la sencilla razón de que la mayoría de
los usuarios no pasan de los primeros veinte resultados. La mayoría nunca va
más allá de la primera página, y si no encuentran lo que buscan cambian la
pregunta. Conscientes del problema, algunos de los nuevos motores de búsqueda
clasifican los resultados en categorías14 u ofrecen una representación
gráfica para facilitar la selección15. Aún así, hoy por hoy, parece que las
tecnologías de categorización y visualización no están listas para satisfacer
las necesidades de los usuarios. Pero a medida que los usuarios se vuelvan
más sofisticados y que la información accesible (e indexada por Google) vaya
aumentando, este enfoque podrá resultar insuficiente.
Amenaza de privacidad personal
Otro problema que plantean los motores de búsqueda es el de las denuncias de
monitorización a través de las búsquedas, que invaden nuestra privacidad.
Parece que nos encaminamos hacia una época en la que la libertad y privacidad
estarán restringidas, donde la privacidad quedará como un invento de la
revolución industrial. Hoy, la generación puntocom sólo quiere estar
conectada. Inconscientemente definen la libertad como inclusión, mientras las
generaciones anteriores definirían la libertad como exclusividad (privacidad
y autonomía). La privacidad se está perdiendo, porque no pedemos estar
conectados constantemente y al mismo tiempo mantener nuestra privacidad.
Parece que la privacidad puede convertirse en una reliquia en el mundo en red
y que lo que necesitemos sean nuevos regímenes reguladores.
Google tiene respuesta para todo, y se acuerda de cada pregunta que hacemos,
lo cual empieza a preocupar a los defensores de la privacidad16. La barra de
herramientas de Google transmite datos sobre todos los sitios que visitamos.
La cookie conserva los datos casi sin límite de tiempo, y aguanta hasta el
2038. Además del cookie insertado en nuestra computadora para reconocernos en
cada visita, Google identifica nuestra dirección IP, la cual prácticamente
revela el lugar desde el cual nos conectamos y puede ser utilizado para
desplegar publicidad a medida.
Los miles de servidores de Google le permiten guardar rastro de nuestras
preguntas, de la hora y día en la cual fueron formuladas y de los sitios
visitados consecuentemente. Ésta, que podríamos denominar tecnología de
minería de datos, junto a la extracción de información de bases de datos,
amenazan con su uso generalizado a la privacidad personal. Sabiendo por
ejemplo lo que preguntamos a Google alguien podría dar una descripción
bastante precisa de lo que estábamos pensando17, lo que puede permitir
elaborar un perfil preciso de nuestros usos y costumbres. Según los creadores
el objetivo es memorizar los gustos de los usuarios para que obtengan lo que
ellos quieren, pero que los consumidores son cientos de millones y las
páginas miles de millones lo cual hoy por hoy supone demasiadas variables.
Pero la amenaza de Google a la intimidad no cesa en su buscador; parece ser
que su nuevo servicio de correo que todavía no ha visto la luz ya tiene
problemas. La estrategia de Google para rentabilizar su correo es la misma
que la utilizada con su buscador; analizar palabras y venderlas al mejor
postor. Esta estrategia no les ha causado problemas en el buscador, pero
analizar los contenidos de los correos electrónicos de sus usuarios e
insertar publicidad relacionada con ellos ya ha provocado quejas de las
asociaciones defensoras de los derechos de la intimidad. La empresa se escuda
en que el análisis será automático y no realizado por personas, y que sólo se
insertará publicidad en los mensajes recibidos y no en los enviados, y no
descartan que sea un servicio opcional que los usuarios puedan deshabilitar.
Conclusiones
La tecnología no es ni buena, ni mala, ni neutra; refleja la condición humana.
La tecnología es poder y el poder nunca es neutral. Cuando uno lo ejerce
siempre hay ganadores y perdedores. La neutralidad de la ciencia y de la
tecnología es un gran mito que se ha creado, probablemente, por la comunidad
de ingenieros.
Internet aún se encuentra en una etapa de desarrollo bastante inicial y
todavía no se adapta fácilmente a los usos sociales. Sigue un proceso lento y
gradual en su adaptación a las necesidades de los usuarios, y es cada vez más
grande y potente en su camino hacia la madurez. Revelará muchos nuevos
conceptos sociales no incorporados en su tecnología que, por su condición de
transformadora, no la debemos entender limitada a unos fines determinados.
Pero la naturaleza de estos impactos dependerá mucho más de las elecciones
sociales y políticas que de la evolución tecnológica.
En la definición de cualquier tecnología, a partir de un determinado grado de
desarrollo, que podemos establecer en el momento en el que tenemos
tecnologías para problemas que no existen, cesa la innovación y cuentan más
los factores sociales y culturales que los aspectos puramente tecnológicos.
Interenet no sólo depende del espíritu emprendedor para difundirse en el
conjunto de la sociedad, sino que también está ligada a sus orígenes en la
comunidad científica y académica, donde se originaron los criterios de
búsqueda de la excelencia, de apertura a la crítica de los colegas y de
comunicación abierta del trabajo de investigación (Castells, 2001: 52-53).
A medida que nuestro uso de las tecnologías de la información evoluciona,
estas prácticas utilizadas por los motores de búsqueda, son un riesgo que
podría alterar nuestra relación con el conocimiento. De hecho, estamos
pasando de una era en la cual el acceso a la información, siendo limitado, lo
importante era el saber –el tener en mente la mayor información -, a una
época en la que la información accesible siendo casi ilimitada, lo que cuenta
es saber encontrar la más relevante. Sobre Google sobrevuelan sospechas de la
posible entrega de datos a una agencia del gobierno de Estados Unidos o sobre
la eliminación del sitio de un grupo fundamentalista cristiano anti-aborto o
de material pro nazi en google.fr y Google.de, sobrevuelan al buscador.
Aunque los creadores alegan tener por norma respetar la legislación de cada
país y no mostrar pornografía, e insisten en que ellos no censuran, existen
algunas dudas sobre una empresa cuyo poderío le confiere una responsabilidad
que va más allá de sus imperativos comerciales. En la era del conocimiento,
las técnicas de indexación y de visión están adquiriendo cada vez más un
papel de utilidad pública, y ninguna alteración en su funcionamiento puede
ser considerada inocente.
Notas:
1 El buscador de MSN podría ir incluido en la próxima versión de Windows, lo
que le está creando problemas a Microsoft con las autoridades antimonopolio
de EEUU y la UE.
2 El correo de Google y el buscador de MSN de próxima aparición.
3 Google ya ha lanzado Google Local en EEUU que no sólo ofrece información
sobre objetos o sitios, sino que también incluye mapas para acceder a los
sitios.
4 Ver <http://images.google.com>
5 Ver <http://labs.google.com>
6 Ver <http://news.google.com>
7 Ver <http://froogle.google.com>
8 Ver <http://labs.google.com/gviewer.html>
9 Ver <http://labs.google.com/cgi-bin/webquotes>
10 Para ver el listado de empresas implicadas que han tomado acciones
judiciales <http://www.chillingefects.org/search.cgi?search=google>
11 Actualmente ha habido ya querellas interpuestas en esta sentido. Ver la
querella de la organización Comercial Alert, en
<http://www.commercialalert.org/index.php> y la carta de apoyo de la Federal
Trade Commission, en <http://www.commercialalert.org/PDFs/ftcresponse.pdf>
12 Ver encuesta de la organización en defensa del consumidor Consumer Report,
en <http://www.consumerwebwatch.org/news/1_TOC.htm>
13Ver EL PAÍS, sábado 21 de agosto de 2004, p.56.
14 Ver <http://vivisimo.com>
15 Ver <http://kartoo.com>
16 Ver <http://www.privacyinternational.org>
17 Ver al respecto el seguimiento de <http://www.google-watch.org>
Referencias:
HABERMAS, J. (1992): Ciencia y técnica como “ideología”, Madrid, Tecnos, 1984.
MATTELART, A. (1998): La mundialización de la comunicación, Barcelona Paidós.
MANSELL, R. (ed.) (2003): La revolución de la comunicación. Modelos de
interacción social y técnica, Madrid, Alianza Editorial.
RIFKIN, J. (2000): La era del acceso: la revolución de la Nueva Economía.
Barcelona, Paidós.
ROJO, P.A. (2001): Las nuevas tecnologías de la información
--
Gustavo Guillermo Pérez
Compunauta uLinux
www.compunauta.com
_______________________________________________
Ayuda mailing list
Ayuda en linux.org.mx
Para salir de la lista: http://mail.linux.org.mx/cgi-bin/mailman/listinfo/ayuda/
Más información sobre la lista de distribución Ayuda