Il deep Web, AkA “L’internet che non conosci”

maggio 14, 2013 in Interna(u)ti

Il deep web. Navigando in rete prima o poi un buon nerd© si imbatte in queste due parole, magari si interessa, fa qualche ricerca e scopre una verità sconcertante, riassumibile in toto nell’immagine sottostante

Il deep web in un'immagine.

Il deep web in un’immagine. Vi consiglio di aprire per vedere meglio.

Se siete culopesi o non avete aperto l’immagine, cogliendo comunque il significato, ecco un piccolo sunto: solo il 4% (circa) di tutti i documenti del WWW si trova in chiaro, accessibile a tutti gli utenti. Non che il restante 96% sia oscurato, semplicemente è più difficile da raggiungere.

Ma cosa si intende con “documenti”? No, non parliamo di banali file di testo, Wikipedia ci offre una buona classificazione:

  • contenuti dinamici: pagine web dinamiche, ovvero pagine Web il cui contenuto viene generato sul momento dal server, che possono essere richiamati solo compilando un form o a risposta di una particolare richiesta;
  • pagine non collegate: pagine Web che non sono collegate a nessun’altra pagina Web. Se l’accesso non è impedito da adeguate impostazioni di sicurezza, il motore indicizza la parent directory del sito, che contiene non solo le pagine visibili, ma tutto ciò che è caricato nel server ospitante;
  • pagine ad accesso ristretto: siti che richiedono una registrazione o comunque limitano l’accesso alle loro pagine impedendo che i motori di ricerca possano accedervi;
  • script: pagine che possono essere raggiunte solo attraverso link realizzati in javascript o in Flash e che quindi richiedono procedure particolari;
  • contenuti non di testo: file multimediali, archivi Usenet, documenti scritti in linguaggio non HTML, in particolare non collegati a tag testuali (tuttavia alcuni motori di ricerca come Google sono in grado di ricercare anche documenti di questo tipo).

Ma come mai proprio Deep Web? Innanzitutto perché si trova al di sotto della normale rete che visitiamo ogni giorno. I contenuti del DW (abbreviato) non sono indicizzati dai normali motori di ricerca, ne possiedono normali url di accesso come potrebbe essere www.google.it; risultando quindi impossibili da raggiungere direttamente. In secondo luogo il DW è considerata la parte più “underground” del cyberspazio, una sorta di zona franca e oscura in cui si può veramente trovare di tutto e di più.

Per citare qualche statistica (purtroppo non aggiornata, ma in continua crescita) mostriamo qualche dato numerico sul DW, raffrontato al web in chiaro:

  • Il DW contiene 7500 terabyte di informazione, a fronte dei soli 19 terabyte di contenuti web in chiaro. 
  • il DW contiene circa 550 volte l’informazione pubblica disponibile nel web in chiaro.
  • Al momento esistono più di 220.000 siti nel DW
  • Assieme, i 60 più grandi siti del DW, contengono 750 terabyte di informazione, equivalenti a circa 40 volte le dimensioni del web in chiaro.
  • La qualità totale del DW e almeno 1500 volte superiore a quella del web in chiaro.
  • Navigando normalmente abbiamo accesso a circa 1,5/2 miliardi di documenti, nel DW a circa 550 miliardi.
  • il 95% del DW è liberamente accessibile, il che significa niente iscrizioni, gratuite o a pagamento.

Comprendere queste cifre a dir poco bibliche non è semplice, ecco quindi una semplice immagine atta a farci capire di cosa stiamo parlando

 

Scarna infografica per paragonare le dimensioni del DW

Scarna infografica per paragonare le dimensioni del DW

 Ma cosa troviamo quindi di preciso nel Deep Web? E come lo trovo soprattutto? Così tanta informazione deve pur essere categorizzata in qualche modo, no?

 Si all’ultima domanda, anche se non sono categorie vere e proprie, diciamo distinzioni fatte dagli utenti e dalle tipologie di contenuti. Ricollegandoci al primo punto, nel DW si può trovare di tutto, nel vero senso della parola.

Le persone spaziano fra scienziati, forze dell’ordine, ricercatori, persone normali, rivoluzionari, criminali, riciclatori di denaro e truffatori, rapitori, assassini, minatori di dati, sociologi, agenti di governo, terroristi, pervertiti, spacciatori, hackers eccetera, eccetera. Come si può vedere la lista procederebbe per molto, comprendendo una variegata serie di personalità, ognuna con il proprio scopo. Se credevate che wikileaks fosse una fonte d’informazioni a metà fra il legale e l’illegale, ora sapete da dove arrivano buona parte dei suoi contenuti. Quello che il DW può offrire è un mondo sconfinato di informazioni e buoni dati, misti però a una gran quantità di feccia o gente che sfrutta l’anonimato di questa rete per i propri affari.

Già, perché se da un lato ci sono molte, moltissime persone che desiderano semplicemente diffondere conoscenza e verità in modo anonimo, libero e sicuro, dall’altro si trova un mare di persone che ha fatto del DW il proprio business. L’anonimato garantito dalla rete TOR, che analizzeremo dopo, ha favorito la crescita di veri e propri servizi online per la fornitura di ogni genere di illegalità: armi, droga e si, anche assassini su commissione.

Accedere al DW non è propriamente semplice, il modo attualmente più semplice e sicuro per farlo è usare il browser firefox modificato per funzionare attraverso la reta TOR, in automatico e senza installare nulla: TOR Browser. Ma in cosa consiste la rete TOR? TOR è un piccolo programma atto a creare una rete di utenti che smista e cripta le connessioni fra chi invia e riceve (praticamente noi e il sito che vogliamo visitare) in modo da rendere estremamente difficile risalire a noi e alla nostra identità. Lungi dall’essere un sistema perfetto, garantisce però il livello medio adeguato alla navigazione sicura.

Come trovare però un punto di partenza da cui aprirsi la strada nel DW? L’inizio migliore è la Hidden Wiki, situata al link  http://kpvz7ki2v5agwt35.onion/wiki/index.php/Main_Page  di cui abbiamo un’ultima diapositiva

Credevate non esistesse?

Credevate non esistesse?

 E con questa immagine credo che oramai si possa dichiarare concluso l’articolo, poiché l’unico passo rimasto per chi legge è provare ai propri occhi l’esistenza del Deep Web e di quello che può offrire (sperando che non vi interessino droga e assassini). Questa porzione del Web è vasta, libera e grezza, una miniera che va scavata per trovare veri e propri diamanti, informazioni che non pensereste mai di riuscire a trovare sul WWW o nella vita vera.

Link utili e fonti:

Wikipedia IT

TOR Project

TOR Browser

Hidden Wiki

Molto Google, soprattutto.