La web profunda reúne todos los contenidos creados, alojados e intercambiados en la red, pero que no son indexados por los motores de búsqueda.
La deep web, en resumen, es una red oculta. Pero para entender todo esto, primero hay que recordar otras dos definiciones: la de Internet y la de web.
Todo sobre la Deep Web
¿Qué es la Web Visible (Surface Web)?
Internet es la red de redes, un espacio que enlaza redes privadas, públicas y sin ánimo de lucro, y está totalmente descentralizado. Una serie de protocolos normalizados permiten intercambiar información desde prácticamente cualquier lugar.
Si lo imaginamos como un iceberg, una pequeña parte de este vasto complejo está por encima del nivel del mar: es la red, también llamada red visible o de superficie. La World Wide Web es un sistema de páginas públicas interconectadas (mediante hipervínculos) e indexadas en los principales motores de búsqueda: es una de las aplicaciones que existen en la infraestructura que es Internet.
Según Kaspersky, este conjunto de páginas, fácilmente accesibles a través de servicios como Google, Bing o DuckDuckGo, representa menos del 5% del volumen total de contenidos alojados e intercambiados a través de Internet.
Qué es la Deep Web
Bajo la línea de flotación del iceberg, hay un montón de páginas a las que no se puede acceder desde un motor de búsqueda, porque estos recursos no están indexados por diversas razones: puede tratarse de una instrucción dada por un sitio de no hacer referencia a tal o cual página. También pueden ser páginas que sólo son visibles iniciando sesión.
¿Un ejemplo? La página de la bandeja de entrada de tu correo electrónico no está en Google. Lo mismo ocurre con tu cuenta bancaria. Sin embargo, se trata de páginas web que se consultan a través de un navegador, pero no se pueden encontrar en un motor de búsqueda. Como mucho, puedes encontrar una página de inicio de sesión, y eso es todo.
Algunas de estas páginas ocultas son vistas a diario por los internautas. Por eso, en la representación del iceberg, suelen situarse justo por debajo de la línea de flotación. Podrían ser como la web visible, o la web de superficie, del mismo modo que un sitio normal. Más abajo en esta estructura de iceberg están todas las páginas menos accesibles, la información, los datos.
Composición de la Deep Web: (según The Journal of Electronic Publishing)
- 54% Bases de datos de acceso público
- 33% Sitios Tor/onion de diversas categorías
- 13% Sitios de intranet
¿Por qué Existe la Deep Web o Web Profunda?
La web superficial (Surface Web) y la web profunda. (Deep Web) son términos utilizados para explicar el papel de los motores de búsqueda y la naturaleza de las páginas, ya que esto afecta a la visibilidad de los contenidos en línea. Esta red profunda es el punto de convergencia de varios fenómenos que no tienen necesariamente nada en común entre sí.
Una página web elaborada en un lenguaje informático incomprensible para un motor de búsqueda probablemente no será interpretada y, por tanto, no será referenciada. Por lo tanto, entra en la categoría de la web profunda. Lo mismo ocurre con las partes privadas de los sitios web, como el servicio de correo electrónico o la cuenta bancaria.
Una página web que contenga instrucciones para no ser listada por un motor de búsqueda también entra dentro de la web profunda. Lo mismo ocurre con una página que está en línea, pero no tiene ningún enlace entrante hacia ella. No es probable que los robots de indexación de Google y otros se topen con ella y la ofrezcan a los internautas, si éstos teclean las palabras clave adecuadas.
Está claro que la web profunda nació porque los motores de búsqueda no lo ven todo en la web. La web profunda es, por tanto, una categoría heterogénea. Algunas de estas páginas podrían indexarse si se modificaran ciertos parámetros. Otros simplemente están fuera de nuestro alcance, pase lo que pase. También están las limitaciones de los rastreadores, que no lo captan todo.
¿Qué Tamaño Tiene la Deep Web?
La web profunda es inmensa, tanto más que la web de superficie, de hecho, que es casi imposible calcular su tamaño con precisión.
En 2001, hace más de veinte años, un estudio de BrightPlanet descubrió que la web profunda era entre 400 y 550 veces mayor que la web de superficie, que de por sí ya era enorme.
Es difícil encontrar estimaciones recientes, quizá porque la idea misma de calcular el tamaño de toda la red (profunda y superficial) se ha abandonado ante la cantidad cada vez mayor de información que producimos y ponemos en red.
Pero si retomamos la cifra de Kaspersky, podemos hablar en términos de proporción: al menos el 95% de las páginas existentes en la red pertenecerían a la deep web.
Cómo Acceder a la Deep Web
La forma más común de acceder a la web profunda es utilizando la red Tor, y hacerlo no es tan complicado como podrías pensar. Primero, necesitas un navegador web que sea capaz de utilizar el protocolo Tor.
Para esta guía, usaremos el Navegador Tor como ejemplo, pero cualquier otro navegador web (como Brave) que soporte el protocolo Tor funcionará igual de bien. Otros ejemplos de navegadores compatibles incluyen el navegador Onion, Firefox y Chrome, pero los dos últimos requieren que instales una extensión separada.
- Descargar un navegador que soporte Tor: El primer paso para acceder a la web profunda con Tor es simplemente descargar el navegador desde el sitio web Tor Project, y luego instalarlo en tus sistema operativo.
- Conéctate a la red Tor: Una vez que abras el navegador, se te presentará una ventana que te permite configurar tu conexión Tor, pero la mayoría de los usuarios pueden saltarse esto por completo y simplemente hacer clic en “Conectar.”
- Introduce la dirección de la web profunda que quieres visitar: Esto abrirá lo que parece un navegador web muy tradicional. A partir de aquí, tienes que conseguir la dirección del sitio web profundo que quieres visitar, que se llama “
dirección cebolla
“. Una vez que la tengas, simplemente pégala en la barra de búsqueda y pulsa Intro, y el sitio web se cargará como lo haría en la web de superficie normal.
Al fin y al cabo, para acceder a la web profunda, en la mayoría de los casos necesitas -y sólo necesitas- la URL específica del recurso al que quieres acceder. Como alternativa, se pueden aprovechar herramientas como Hidden Wiki, un auténtico directorio web que contiene, subdivididos por categorías, enlaces y datos de contacto a un buen número de archivos, documentos, contenidos y otros recursos de la deep web, y que constituye, bien mirado, un auténtico mapa de la deep web.
Entre otras formas de encontrar direcciones de sitios en la red profunda también se encuentran los motores de búsqueda específicos como Ahmia o Torch.
Esto no quiere decir que toda la deep web esté formada por estos sitios difíciles de encontrar. Muchos sitios web normales ofrecen ahora direcciones cebolla (.onion
) (básicamente el .com o .net de la deep web) que se pueden utilizar para acceder a dichos sitios a través de la web profunda, con ejemplos que van desde DuckDuckGo a sitios de redes sociales como Facebook.
¿Qué se Puede Encontrar en la Deep Web?
Entre nuestros usos más habituales, muchos de los lugares digitales que visitamos subyacen a la existencia de otras mil páginas a las que nunca accederemos. Piensa, por ejemplo, en tu banco, donde puedes acceder a tu cuenta, pero no a las miles de páginas sobre las cuentas de otros clientes. O tu cuenta en un servicio de streaming de audio o vídeo, donde existen otros miles de usuarios, cada uno con su propio perfil, su propia vista, su propia configuración, sus propios datos de uso…
En resumen, la web profunda comprende cuatro tipos principales de contenidos: páginas que nunca fueron indexadas por los motores de búsqueda, sitios de pago por servicio, bases de datos privadas y la web oscura (dark web). Veamos en detalle cada uno de ellos.
Páginas no indexadas
Los robots de Google, también llamados rastreadores, encuentran nuevos sitios siguiendo los enlaces de las páginas ya indexadas. Esa es la razón por la que Google se esfuerza por indexar sitios que no presentan ningún enlace y no consigue incluir numerosos sitios que permanecen en la deep web. Muchos sitios web nunca “salen a la superficie” y permanecen en la deep web porque no tienen enlaces.
La mayoría de los webmasters intentan conseguir el mayor número posible de enlaces para que sus sitios tengan una posición más alta en Google, y éste es uno de los principios fundamentales de la optimización de motores de búsqueda. Otros, sin embargo, trabajan duro para no tener ningún enlace y seguir volando bajo el radar.
Sitios de pago por servicio
El segundo tipo de contenidos almacenados en la deep web pertenece a los sitios de pago por servicio. Su contenido está bloqueado y sólo está disponible para los clientes de pago. Piensa en Netflix, por ejemplo: aunque puedes acceder a la plataforma de streaming sin “piratear el sistema” y aprender a acceder a la deep web, el contenido que podrás ver es limitado hasta que te registres y pagues por los servicios de Netflix. Estas grandes empresas dependen en gran medida de la profundidad de la deep web para que este modelo de negocio les merezca la pena.
Bases de datos privadas
Otra cosa oculta al ojo público en la deep web son las bases de datos privadas. Y aunque podamos argumentar que las películas disponibles en Netflix deberían estar al alcance de todos, estamos seguros de que no nos gustaría que nuestra información bancaria, nuestra bandeja de entrada de correo electrónico o las fotos privadas de Dropbox fueran accesibles para cualquiera.
Es una de las respuestas más nobles a la pregunta “¿Cuál es el propósito de la deep web?” y un beneficio significativo de la existencia de la deep web. Oculta el contenido privado de tus redes sociales, correos electrónicos personales, cuentas bancarias, historiales médicos y otros tipos de información que no querrías que estuvieran a disposición del público.
La web oscura (dark web)
Y, por último, está la dark web, también conocida como red oscura o Internet oscura. Aunque deep web y dark web son términos que a menudo se utilizan indistintamente, hay una clara diferencia entre ellos (puedes revisar nuestra comparación Deep Web vs Dark Web). El nivel de seguridad no es el mismo, y las formas de acceder a estas dos webs también difieren.
Los sitios web de la dark web representan sólo una pequeña parte de la deep web. La dark web también gira en torno a la privacidad. Sin embargo, mientras que algunos la utilizan para compartir información que debería estar ahí fuera, otros abusan del privilegio del completo anonimato que proporciona para hacer exactamente lo contrario: vender información robada.
Por eso, contar con una protección fiable contra el robo de identidad es indispensable hoy en día, a menos que quieras que tus credenciales de inicio de sesión, números bancarios y de la Seguridad Social e incluso cuentas pirateadas de Netflix se vendan al mejor postor en la red oscura.
La Deep Web: ¿Injustamente Malinterpretada?
La deep web se asocia erróneamente con la actividad ilegal de la dark web todo el tiempo, y también se le llama la web invisible u oculta, lo que desconcierta aún más sus usos sorprendentemente normales.
La deep web no es sólo un mercado de drogas y otros artículos ilegales: esa descripción no es ni remotamente exacta. La web profunda es en su mayor parte inofensiva y extremadamente importante para proteger nuestra información personal y nuestra privacidad.
Y eso no significa que no debas protegerte. Siempre debes mantenerte atento a los foros y sitios web que visitas, nadie quiere que la policía federal o el FBI llamen a tu puerta al día siguiente.