viernes, 2 de octubre de 2009

Todo y mas sobre google

TODO SOBRE GOOGLE

Indice:

1) Historia [Rsumido]
2) El buscador [Bien ilustrado para entenderlo]
3) Servicios [Titulos resaltados]
4) Google desde adentro [Video]
5) Actualidad (noticias)
6) Imagenes



Historia

Resumen:
- Larry pensaba que Sergey era un arrogante. Sergey pensaba que Larry era odioso".
- Sergey Brin ya estudiaba en Stanford, y se había ofrecido como voluntario para mostrar las instalaciones a los candidatos, entre los que se encontraba Larry Page. Cuando éste finalmente decidió comenzar a asistir en septiembre, rápidamente se aficionó a estudiar la estructura de la WWW, formada por nodos (servidores y páginas web) y enlaces entre ellos.
- Page decidió comenzar un proyecto denominado 'BackRub' que intentaría determinar el número de enlaces hacia las páginas web (backlinks).
- Sin embargo, el proyecto comenzaba a ser cada vez más complejo y esto fue lo que atrajo la atención de Sergey Brin, el cual no se había decantado por ningún proyecto para su tesis doctoral.
- Pronto Page y Brin se dieron cuenta que, además de determinar la importancia de una página web, BackRub servía también para realizar búsquedas en la WWW, y con unos resultados además mucho mejores que los que ofrecían los en aquellos momentos populares Altavista o Excite.
- Entre algunos los alumnos de la Universidad de Stanford, Google se convirtió en todo un éxito en aquel verano de 1996, lo que animó a Page y a Brin a seguir dedicando esfuerzos al proyecto. Así, poco a poco consiguieron que el buscador indexase mayor número de páginas, y que además buscase información dentro del texto de éstas (no solo en el título).

Completo

Larry pensaba que Sergey era un arrogante. Sergey pensaba que Larry era odioso". Estas son las impresiones que los fundadores de Google tuvieron uno del otro allá en verano de 1995, cuando coincidieron por primera vez durante un acto que la Universidad de Stanford organizaba para aquellos estudiantes que tenían pensado matricularse en ella.

Sergey Brin ya estudiaba en Stanford, y se había ofrecido como voluntario para mostrar las instalaciones a los candidatos, entre los que se encontraba Larry Page. Cuando éste finalmente decidió comenzar a asistir en septiembre, rápidamente se aficionó a estudiar la estructura de la WWW, formada por nodos (servidores y páginas web) y enlaces entre ellos.

A Page le obsesionaba la idea de que, en aquellos momentos, fuera imposible saber qué páginas web enlazaban a otras, ya que eso impedía el análisis de la WWW y poder determinar cuál era la importancia un documento web. Page reconoce que asoció "importancia" con "número de veces que citan/enlazan" un documento debido a que en el entorno universitario de los 'papers' y documentos de investigación nada hay tan importante como que citen tus trabajos.

Con esta idea en mente, Page decidió comenzar un proyecto denominado 'BackRub' que intentaría determinar el número de enlaces hacia las páginas web (backlinks). Esta herramienta estuvo incluso online, y aún se guarda una copia en 'archive.org'.

Para determinar los enlaces entre páginas, Page construyó un robot que rastreaba los diferentes sitios web, y almacenaba los links en una Base de Datos. Para ello, utilizaba Java y Python, e incluso posteaba en los 'newsgroups' para intentar solucionar dudas sobre su diseño.

En marzo de 1996, Page decidió poner en marcha el rastreo de la WWW a través de BackRub. Para ello, tomó como punto de partida la página web principal de la Universidad de Stanford, y a partir de ella se saltaría de página en página a través de los enlaces a lo largo y ancho de la World Wide Web.

Sin embargo, el proyecto comenzaba a ser cada vez más complejo y esto fue lo que atrajo la atención de Sergey Brin, el cual no se había decantado por ningún proyecto para su tesis doctoral. BackRub había conseguido determinar cuántos enlaces había entre las páginas, pero el reto estaba en conseguir crear un método para clasificar la importancia de cada una de esas páginas, siguiendo con la obsesión de Page de establecerlo en función del número de citas/enlaces. Pero cada uno de estos links también tenía su propia importancia, determinada a partir del número de enlaces hacia la página que enlazaba, lo que significaba un elevado número de cálculos recursivos.

Era en este ámbito, el de las abstracciones y operaciones matemáticas, en el que Sergey Brin se desenvolvía con más soltura. Nacido en Rusia e hijo de un profesor universitario de Matemáticas, Brin era considerado en su etapa escolar como un prodigio en esta materia. Así pues, juntos trabajan para desarrollar el algoritmo de PageRank (meses más tarde se publicaría el documento 'PageRank: Bringing Order to the Web'). El nombre de 'PageRank' se puso en honor a Larry Page.

Pronto Page y Brin se dieron cuenta que, además de determinar la importancia de una página web, BackRub servía también para realizar búsquedas en la WWW, y con unos resultados además mucho mejores que los que ofrecían los en aquellos momentos populares Altavista o Excite. Las primeras pruebas consistieron en buscar palabras solamente dentro de los títulos de las páginas web. PageRank ofrecía unos resultados sorprendentes, y fue entonces cuando se empezaron a creer que se encontraban ante algo grande.

Además, también descubrieron que su herramienta era totalmente escalable. Puesto que PageRank analizaba los links entre páginas web, cuanto mayor fuera la WWW, mejores serían los resultados. Este hecho inspiró a que Page y Brin bautizasen definitivamente su buscador con el nombre de Google, en alusión a la palabra 'googol' (el número representado por un '1' seguido de 100 ceros). Además, en agosto de 1996 lanzaron públicamente la primera versión de Google bajo el dominio 'google.stanford.edu'. Ahora se encuentra inaccesible (fue sustuido por 'google.com'), pero se pueden ver varias versiones almacenadas en 'archive.org', como la de mayo de 1998 o noviembre de 1998.

Entre algunos los alumnos de la Universidad de Stanford, Google se convirtió en todo un éxito en aquel verano de 1996, lo que animó a Page y a Brin a seguir dedicando esfuerzos al proyecto. Así, poco a poco consiguieron que el buscador indexase mayor número de páginas, y que además buscase información dentro del texto de éstas (no solo en el título). También comenzaron a descubrir que un buscador consume un montón de recursos, lo que les obligó a ir cogiendo prestados numerosos dispositivos de los laboratorios de la Universidad de Stanford (discos duros, CPUs, ...), y a unirlos con técnicas tan poco convencionales como con piezas de Lego.

El cuarto de Larry Page era utilizado como la sala de los servidores, y cuando ésta estuvo completamente llena de cacharros, tuvieron que utilizar la de Sergey Brin como oficina y centro de programación. Google crecia rápidamente, consumía casi la mitad del ancho de banda de la Universidad (una de las mejor conectadas del planeta), y a finales de 1996 consiguió echar abajo la conexión a Internet del campus.

Estos recuerdos y muchos más están recogidos en el libro 'The Search' que saldrá a la luz el día 8 de septiembre. Ha sido escrito por John Battelle, fundador de Wired y uno de los mayores expertos en buscadores. La propia revista Wired publica en su número de agosto un extracto del libro.



El buscador

Funciones del buscador:

La innovadora tecnología de búsqueda Google y su diseño de interfaz de usuario diferencian a Google de las máquinas de búsqueda de primera generación. Se basa en los hipertextos, analizando todo el contenido de cada web y la posición de todos los términos en cada página.

Se da prioridad a los resultados de acuerdo con la proximidad de los términos de la búsqueda, favoreciendo los resultados en los que los términos de búsqueda están próximos entre sí, sin perder tiempo analizando resultados irrelevantes.



¿Como funciona?


Descripcion general

El motor de indexación de Google esta implementado en C/C++ por razones de eficiencia y puede correr tanto sobre Solaris como sobre Linux. En Google, el proceso de exploración (descargar las páginas a indexar) es realizado por varios exploradores distribuidos. Existe un proceso URLserver que envía listas de URLs a ser descargados a los exploradores. Las páginas que son descargadas son enviadas luego al storeserver. El storeserver comprime y guarda las páginas en un repositorio. Toda página tiene asociado un ID denominado docID que es asignado cada vez que un nuevo URL es interpretado desde una página. La función de indexación es llevada a cabo por un proceso indexador y un clasificador. El indexador lleva a cabo varias funciones: Lee el repositorio, descomprime los documentos y los interpreta, cada documento es convertido en un conjunto de ocurrencias de palabras llamadas hits o aciertos. Cada acierto registra la palabra, posición en el documento y una aproximación del tamaño de la fuente y si está o no en mayúsculas. El indexador distribuye estos aciertos en una serie de ?barriles? (barrels) creando un índice. Además, el indexador interpreta todos los enlaces en cada página y guarda información importante sobre los mismos en un archivo llamado anchors, este archivo contiene información suficiente sobre origen y el destino del enlace, y cual es el texto del mismo.

El URLresolver lee registros del archivo de enlaces y convierte URLs relativos en URLs absolutos (por ejemplo si el enlace es desde http://foo.bar/index.htm hacia images/bar.gif el URL absoluto es http://foo.bar/images/bar.gif). Luego convierte los URLs absolutos en docIDs. Pasa el texto del enlace al índice y los asocia con el docID apuntado por el enlace. También genera una base de enlaces que son simplemente pares de docIDs de la forma ?desde-hasta?. La base de enlaces es luego usada por el algoritmo de PageRanking para determinar la importancia de cada documento.

El proceso clasificador toma los barrels que están ordenados por docId y los reordena por wordID para generar un índice invertido. Esto es realizado en el mismo lugar para ahorrar espacio auxiliar. El clasificador produce también una lista de wordIDs y desplazamientos al índice invertido. Un programa denominado DumpLexicon toma la lista junto con el léxico producido por el indexador y genera un nuevo léxico para ser usado por el buscador. El buscador es invocado por el servidor web y usa el léxico construido por DumpLexicon junto con el índice invertido y los PageRanks para resolver las búsquedas.



Servicios de google:

Buscadores

Buscador web
Es el servicio más popular de Google. Es una herramienta que rastrea e indexa miles de millones de páginas web y documentos asociados, y realiza una clasificación de su relevancia para cualquier término que el usuario busque.

Buscador de imágenes
Rastrea e indexa cientos de millones de las imágenes que están asociadas a las páginas web, para luego ofrecer a los usuarios un buscador. Acceso a Google imágenes
Buscador de blogs
Rastrea e indexa la información contenida en decenas de miles de blogs que hay en WWW, y ofrece a los usuarios la posibilidad de buscar dentro de esos datos. El sistema rastrea los blogs, basándose en su ‘feed’ (RSS o Atom), por lo que es necesario que los blogs dispongan de esta tecnología. Acceso a Blogsearch España
Google News
Rastrea e indexa la información contenida en centenares de medios de comunicación de todo el mundo, y ofrece a los usuarios la posibilidad de buscar datos dentro de ellos. Acceso a versiones de Argentina Chile España Mexico
Google Vídeo
Permite a cualquier usuario encontrar información contenida dentro de los vídeos. Éstos son obtenidos a partir de las imágenes emitidas por varios canales de TV de EEUU (ABC, CNN, Fox News, Discovery Channel, …) y también de lo que es enviado por los propios usuarios. Acceso a Google Vídeo (Inglés)
Buscador de libros
Indexa la información contenida dentro de cientos de miles de libros impresos, para poder ofrecer a los usuarios la posibilidad de que encuentren cualquier dato dentro de ellos. Acceso a Google Books en español.
Google Local
Buscador de contenidos (sobre todo, negocios) cercanos al lugar donde se encuentra el usuario, o en la población que se indique. Acceso a Google Local Estados Unidos.
Google Groups
Almacena todos los contenidos publicados en los ‘newsgroups’ de Usenet desde 1981. Acceso a Google Groups en español.
Google Scholar
Indexa documentación técnica, y ofrece resultados de búsqueda dirigidos a la comunidad científica y a los investigadores académicos. Acceso a Google Scholar (Inglés).
Google Answers
Es un servicio que une en un mismo lugar a usuarios que desean encontrar información sobre cualquier cuestión, y a personas que están dispuestas a contestestarles a cambio de una determinada cantidad de dinero (establecida por el usuario que plantea la pregunta). Acceso a Google Answers (Inglés)
Buscador de catálogos
Indexa los contenidos de los catálogos impresos de venta por correo de cientos de compañías estadounidenses, que previamente han sido digitalizados por Google. Acceso a Google Catálogos (La búsqueda avanzada está en español).
Google Maps
Servicio que ofrece mapas de ciudades de diversos países (EEUU, Canadá, Reino Unido, Japón), en principio como complemento y ayuda al usuario que realiza búsquedas en Google Local. Acceso a Google Maps (Inglés)
Froogle
Buscador de productos comerciales online, gracias al cual el usuario puede además comparar precios de artículos. Acceso a Froogle (Inglés).
Google Base
Servicio que permite a cualquier persona con una cuenta de usuario de Google (es gratis) insertar directamente cualquier tipo de información en los servidores de Google. Acceso a Google Base (Inglés).
Directorio Google
Es una copia exacta de DMOZ, un directorio de sitios web que mediante una licencia especial permie copiar a cualquiera sus contenidos con algunas restricciones. Acceso al Directorio Google en español.
Google para móviles
El proyecto ‘Google Mobile’ pretende adaptar todos los servicios de Google que se ofrecen para PCs a los dispositivos móviles (Palms, PDAs, teléfonos celulares, …). Versión móvil en español de los buscadores web, imágenes y de páginas exclusivamente desarrolladas para dispositivos móviles.

Aplicaciones, programas para instalar

Picasa
Gestiona y encuentra fácilmente en segundos todas las imágenes que tenemos en nuestro Disco Duro. Crea álbumes y etiquetas. Retoca y edita las fotografías (hay varios efectos y filtros). Permite compartir las imágenes con nuestros amigos. Hace copias a CD, … Es grátis. Descarga.
Google Toolbar
La barra ‘Google Toolbar’ es una herramienta que se añade al navegador de Internet, para agilizar y facilitar las búsquedas a través de Google. Descarga.
Google Desktop
Indexa toda la información contenida en nuestro Disco Duro. De esta manera, y con una tecnología parecida a la del buscador web de Google, podremos localizar en menos de un segundo cualquier documento que querramos encontrar. Descarga.
Google Earth
Permite al usuario navegar por imágenes de satélite de toda la Tierra y observar millones de datos geográficos y relacionados con servicios de ciudades (hospitales, colegios, restaurantes, ..). También dispone de información en 3 dimensiones de algunas localidades de EEUU. Descarga.
Google Talk
Permite que nos comuniquemos en tiempo real con otros usuarios mediante chat (Mensajería Instantánea, IM) y llamadas de voz (VoIP). Es indispensable tener una cuenta de correo Gmail. Descarga Descarga de versión traducida a español.

Utilidades para la web

Gmail
Servicio gratuito de correo electrónico vía web, ofrecido por Google, con 2,5 Gb de capacidad. Por ahora, Gmail solamente está disponible en modo prueba y solamente se puede acceder mediante invitación de otro usuario que ya tenga una cuenta. También hay páginas que ofertan invitaciones a sus suscriptores. Gmail.com
Traductor
Permite traducir un determinado texto o una página web completa de un idioma a otro. Acceso al traductor.
Google Reader
Gestiona y visualiza todos los feeds de sitios web en los que estemos interesados. Así, en lugar de visitar permanentemente los 100 sitios web que solemos leer frecuentemente, simplemente deberemos añadir los 100 feeds correspondientes a ‘Google Reader’, el cual se encargará de avisarnos puntualmente de las novedades que se produzcan en cada uno de estos sitios web. Acceso a Google Reader (Inglés).
Google Alerts
Es una herramienta que nos avisa, a través de un mensaje de correo electrónico, de que se ha producido una determinada noticia en Google News, en el buscador web o en Google Group. Google Alerts en español.
Orkut
Se trata de una comunidad online, donde sus integrantes están conectados entre sí mediante enlaces de amistad. En todo momento podemos conocer quiénes son los amigos o conocidos de cualquier usuario. Orkut en español.
Dodgeball
Es una Red Social a la que se accede mediante dispositivos móviles y que tiene en cuenta la posición geográfica de los usuarios. De esta manera, y mediante mensajes de texto, se pueden localizar a posibles amigos que se encuentren cerca de nosotros. Por ahora solamente se puede disfrutar de Dodgeball en 22 ciudades de EEUU. Acceso a Dodgeball.
Web Accelerator
Es un programa (solo MS Windows) que hace que las conexiones de nuestro navegador web se realicen a través de los servidores de Google, los cuales realizan copias de los sitios web más visitados de toda la WWW. De esta manera, y como los servidores de Google poseen mayor velocidad y recursos, se asegura que conseguiremos mayor velocidad cuando accedamos a las páginas web. Descarga.
Página de inicio personalizada
Se trata de la posibilidad de personalizar y modificar a nuestro gusto la página inicial de Google, pudiendo añadir contenidos adicionales al formulario de búsqueda clásico. Versión en español.
Búsquedas personalizadas
Es la apuesta de Google por ofrecer a los usuarios resultados de búsquedas individualizados y adaptados a sus gustos e intereses. Una persona aficionada al fútbol no puede obtener los mismos enlaces cuando busca barcelona que alguien que realiza numerosas búsquedas sobre viajes y hoteles. Es necesario tener una cuenta de usuario en Google, que es gratis. Acceso a las búsquedas personalizadas.

Publicidad

AdWords
Google no admite banners ni pop-ups en su web, pero sí inserta publicidad, en forma de AdwordsTM, también conocidos como enlaces patrocinados o sponsored links. Acceso a AdWords.
AdSense
Es un servicio de Google por el cual el webmaster de un sitio web inserta anuncios basados en texto, llamados AdWords, y recibe una cantidad de dinero por cada click que el visitante haga sobre el anuncio. Acceso a AdSense.
Webmasters
Analytics
Es el sistema de estadísticas web que ofrece Google, y con el que podrás obtener detallados informes sobre el número de visitas que han tenido tus páginas web, desde qué ciudades te han visitado, con qué palabras han llegado a través de los buscadores, cuál ha sido la ruta que han seguido por tus páginas web, … Acceso a Analytics en español.
SiteMaps
Es un sistema que Google recomienda para que informemos a su robot de búsqueda sobre las páginas que tenemos en nuestro sitio web. De esta manera, Google podrá rastrear más fácilmente nuestros contenidos y podremos aparecer así en los resultados del buscador. Además, también proporciona estadísticas del acceso del robot, y resúmenes de posibles errores de rastreo. Acceso a SiteMaps también en español.

Otros

Google Search Appliance
Es un dispositivo físico que vende Google y que, instalado dentro de la intranet de una empresa, rastrea los miles de documentos y los indexa, para luego ofrecer un potente buscador. Con una tecnología de clasificación muy parecida a la que se utiliza en ‘www.google.com’, se consigue localizar la información en menos de un segundo. Acceso a Google empresas.
Tienda Google
Es una tienda online en donde Google vende a cualquier usuario todo de tipo de material relacionado con la compañía: camisetas, bolígrafos, paraguas, alfombrillas de ratón, … Acceso a la tienda.
Google Code
Es el espacio donde Google comparte con todos los usuarios parte del código de programación que se utiliza dentro de la compañía. Este código se ofrece con licencia libre, para que cualquier desarrollador pueda utilizarlo en sus proyectos, o incluso modificarlo. Acceso a Google Code (Inglés).
Laboratorio de Google
Es el espacio donde Google muestra los pequeños proyectos que lanza en periodo de pruebas para que los usuarios experimentemos con ellos. Muchas de las herramientas que se ofrecen han surgido de las ideas de los ingenieros de Google, que disponen de un 20% de su jornada laboral para desarrollar proyectos propios.



Google desde adentro

Si no pueden ver el video lo pueden ver desde el link de avajo.



link: http://www.videos-star.com/watch.php?video=



Actualidad de google

Google Maps hace foco en la Argentina

El gigante de internet amplió los servicios que ofrece a sus mapas, dotándolos de un dominio argentino y permitiendo a los comerciantes agregar sus locales. Google invitó a todos a "saltar sobre la Ciudad"

Fuente: http://www.infobae.com/contenidos/475480-100918-0-Google-Maps-hace-foco-la-Argentina

Tras 11 años en la red, Google suma reproches

A pesar del imparable auge que tiene en la red, su halo virtuoso se pierde por quejas sobre propiedad intelectual, violación a la privacidad y censura. La compañía emprende una campaña para frenar críticas

Fuente: http://www.infobae.com/contenidos/474699-100925-0-Tras-11-años-la-red-Google-suma-reproches

El plan de Google para el eventual cobro de noticias en internet

Fue elaborado en respuesta a un pedido de una asociación de editores de los EEUU con la intención de paliar los problemas financieros de los medios tradicionales

Fuente: http://www.infobae.com/contenidos/474201-100925-0-El-plan-Google-el-eventual-cobro-noticias-internet



Imagenes





No hay comentarios:

Publicar un comentario