Il forum dei Drow, dei Vampiri e delle creature dell'oscurità
Oggi è lun apr 29, 2024 08:48

Tutti gli orari sono UTC + 1 ora [ ora legale ]





Apri un nuovo argomento Rispondi all’argomento  [ 9 messaggi ] 
Autore Messaggio
 Oggetto del messaggio: Motori internet a caccia del web sconosciuto
MessaggioInviato: mer feb 25, 2009 12:51 
Non connesso
Signore di Necropolis
Avatar utente
 Profilo

Iscritto il: mer mar 24, 2004 14:59
Messaggi: 9776
Località: Necropolis
Nuova generazione di motori a caccia del web sconosciuto
di RICCARDO BAGNATO
tratto da www.repubblica.it
Le nostre ricerche scandagliano solo una minima parte delle pagine esistenti. Oltre il 90 per cento resta nascosto. Ma alcuni progetti - Kosmix, DeepPeep e Openarchives.org - si ripromettono di renderle visibili. Con algoritmi che ragionano come la mente umana. Superando i tradizionali limiti di spider e crowler tipici di Google & C.

LA PUNTA di un iceberg. Meno del 10 per cento per cento di tutto il Web esistente. E' quanto - secondo alcune autorevoli ricerche - riescono a indicizzare in realtà i migliori motori di ricerca online. E il restante 90 per cento? Lo chiamano "Deep Web", ovvero il Web profondo, invisibile, non raggiungibile grazie agli attuali motori di ricerca. Ma che alcune nuove tecnologie promettono di poter rendere disponibili a breve.

Quanto è profondo il Web? Difficile dirlo. Secondo l'azienda Bright Planet, che nel settembre 2001 ne ha sondato le profondità, "Deep Web" sarebbe un vero e proprio pozzo di San Patrizio, un miniera d'oro, un'immensa foresta vergine a confronto del giardinetti di casa a cui ci avrebbero abituati i normali motori di ricerca. Per altri sarebbe addirittura la nuova frontiera del Web. Tanto che gli stessi numeri uno della ricerca, da Google a Yahoo!, negli ultimi anni stanno moltiplicando gli sforzi per capire come indicizzare questo immenso patrimonio altrimenti irraggiungibile, e quindi renderlo disponibile ai propri utenti.
D'altra parte stiamo parlando delle informazioni archiviate e organizzate in database, dei contenuti consultabili soltanto su siti protetti da password, o delle tante pubblicazioni scientifiche e non in PDF che non hanno ancora trovato un solo lettore disposto a segnalarne la presenza con un link.

Già, perché gli attuali motori di ricerca ogni giorno perlustrano il Web alla ricerca di nuove pagine da offrire tra i risultati delle nostre ricerche, e lo fanno essenzialmente seguendo uno dopo l'altro i link presenti nel Web per mezzo di software ad hoc chiamati spider ("ragni") o crawler ("scansionatori"). Così facendo rintracciano le pagine web esistenti, ricostruendo di volta in volta un rapporto di senso fra loro, riuscendo a suggerire successivamente quale potrebbe essere il risultato più utile, sulla base del numero di link e del tipo di link che rimanda a quella determinata pagina o documento. Al contrario, se verso una pagina o un documento non esiste nessun link, quella stessa pagina o documento non verrà raggiunto, e di conseguenza sarà ignorato.

Peccato che in questo modo si perdono milioni di informazioni utili. La Bright Planet stima che il 54 per cento del Web profondo è costituito dai risultati che ottiene un utente in seguito a una richiesta effettuata consultando ad esempio un orario di volo. Ed è per questo che BigG & Co. non sono in grado di rispondere pienamente a domande come: "Qual è la tariffa più conveniente da Milano a Londra per il prossimo giovedì?", così come denuncia il New York Times che sul fenomeno "Deep Web" ha appena pubblicato una breve inchiesta.

Novità in arrivo? Recuperare questo capitale di informazioni irraggiungibile è sicuramente lo scopo di Anand Rajaraman, cofondatore di Kosmix, una start-up creata per l'appunto per la ricerca nel web profondo, fra i cui investitori c'è addirittura Jeffrey P. Bezos, amministratore delegato di Amazon.com. Ma non è il solo ad interessarsi all'argomento. La professoressa Juliana Freire, dell'Università dello Utah, ha infatti lanciato il progetto DeepPeep, che sfrutta un algoritmo apparentemente capace di simulare le modalità con cui la mente umana ragiona, così da ovviare a quel maldestro cammino che porta i vari spider o crawler a scansionare il Web link dopo link. E infine c'è il progetto Openarchives.org, promotore del protocollo OAI-PMH, con cui si cerca di indicizzare i documenti sui motori di ricerca inviando loro metadati in formato Xml, in modo da rendere più appetibili e comprensibili i contenuti anche in assenza di link. Per ora, tuttavia, l'unica cosa certa è che oltre il 90 per cento delle informazioni online non sono disponibili attraverso i normali motori di ricerca. Rimane forse da domandarsi: e se lo fosse? E' un traguardo auspicabile?

_________________
ImmagineWhat if I say I’m not like the others
What if I say I’m not just another one of your plays
You’re the pretender
What if I say I will never surrender


Top
 

 Oggetto del messaggio: Re: Motori internet a caccia del web sconosciuto
MessaggioInviato: mer feb 25, 2009 22:17 
Non connesso
Miglior Avatar Natalizio
Avatar utente
 Profilo

Iscritto il: mer lug 13, 2005 14:43
Messaggi: 8646
Posso permettermi di dire che se quel90% resta nascosto è perchè non frega quasi nulla a nessuno di quel materiale?

Certo, certo, sono sempre informazioni in più...

_________________
Every day meditate for ten minutes. If you have no time, meditate for an hour.


Top
 

 Oggetto del messaggio: Re: Motori internet a caccia del web sconosciuto
MessaggioInviato: mer feb 25, 2009 23:16 
Non connesso
Admin di Valm Neira
Admin di Valm Neira
Avatar utente
 WWW  Profilo

Iscritto il: mar feb 03, 2004 12:50
Messaggi: 34449
Località: Valm Neira
Non sono sicurissimo, parla di materiale "non linkato" oppure "protetto con password".
Direi che se del materiale non viene pubblicato e/o pubblicizzato significa che non lo si vuole divulgare, appunto, pubblicamente.

Devo farmi un'idea più precisa, comunque. ;)

_________________
Immagine
Siamo simili in molti modi, tu ed io. C'è qualcosa di oscuro in noi. Oscurità, dolore, morte. Irradiano da noi. Se mai amerai una donna, Rand, lasciala e permettile di trovare un altro uomo. Sarà il più bel regalo che potrai farle.
Che la pace favorisca la tua spada. Tai'shar Manetheren!


Top
 

 Oggetto del messaggio: Re: Motori internet a caccia del web sconosciuto
MessaggioInviato: gio feb 26, 2009 14:39 
Non connesso
Moderatore
Avatar utente
 Profilo

Iscritto il: gio apr 01, 2004 18:20
Messaggi: 5694
Località: Altopiano di Leng
Nah, a te non frega niente solo perché scrivendo drow su google trovi Valm tra i primissimi risultati :D

_________________
"[...]vedete dei marinai che stanno scaricando delle tasse..."
-Grande Pacho 'M Hell-


Top
 

 Oggetto del messaggio: Re: Motori internet a caccia del web sconosciuto
MessaggioInviato: gio feb 26, 2009 21:13 
Non connesso
Avatar utente
 Profilo

Iscritto il: ven set 07, 2007 12:19
Messaggi: 8657
Località: Nelle oscure terre boschive elvetiche...
Indubbiamente interessante come cosa ma...anche molto noiosa e dispendiosa :sisi:
Se tanto le informazioni principali le trovi normalmente, non c'è motivo di andare a cercare il pelo nell'uovo :nono:
A meno che uno non abbia tempo da perdere XD

_________________
"...muoio ogni attimo e rinasco nuovo e senza ricordi:vivo e intero,non più in me, ma in ogni cosa fuori."

"L'uccello si sforza di uscire dall'uovo.L'uovo é il mondo.Chi vuol nascere deve distruggere un mondo.L'uccello vola a Dio.Il Dio si chiama Abraxas."


Spoiler: Visualizza


Top
 

 Oggetto del messaggio: Re: Motori internet a caccia del web sconosciuto
MessaggioInviato: ven feb 27, 2009 10:52 
Non connesso
Avatar utente
 Profilo

Iscritto il: mer set 24, 2008 09:32
Messaggi: 597
Località: Casadimatti... ehm, Collegno
Ciao a tutta la banda.

Abraxas ha scritto:
Se tanto le informazioni principali le trovi normalmente, non c'è motivo di andare a cercare il pelo nell'uovo


Abraxas, se voglio cercare il volo più economico per andare da A a B, e i voli segnati nel 10% "visibile" non sono abbastanza economici, io non faccio il viaggio. (caso reale - viaggio a Londra saltato - estate 2008)

Se nel restante 90% c'è una maniera o un volo per andare a Londra in maniera più economica, questo non mi sembra un "pelo nell'uovo".
Al massimo... un pelo di Torx in Albione! :jollone: (oh, almeno UNA battuta me la fate fare? :jollone: )

Poi, non so quanto di interessante ci sia effettivamente, ma varrebbe la pena di approfondire l'argomento.

JM2C
Salud.
Torx

_________________
Che tu creda di farcela o meno, comunque avrai ragione. (H. Ford) (HENRI, NON HARRISON)

Non discutere mai con un idiota: ti trascinerà al suo livello e ti batterà con l'esperienza. (Arthur Block, ma io l'ho sentita da Sergio Giovannetti)

La vita è una malattia mortale: finora non se ne è salvato neanche uno!

Immagine

Immagine


Top
 

 Oggetto del messaggio: Re: Motori internet a caccia del web sconosciuto
MessaggioInviato: ven feb 27, 2009 11:29 
Non connesso
Signore di Necropolis
Avatar utente
 Profilo

Iscritto il: mer mar 24, 2004 14:59
Messaggi: 9776
Località: Necropolis
Secondo me è molto interessante soprattutto a livello di quantità di materiale reperibile (quanto alla qualità poi, si presume che chi faccia un'indagine più approfondita non servendogli le 4 info di base che giustamente trova sui primi, e più attendibili siti, sappia anche scremare cum grano salis)

Si faccia l'esempio di immagini o di informazioni su un determinato fenomeno/settore. A voler fare una ricerca dettagliata, ogni motore di ricerca offre quegli stessi 8 siti che si ricopiano tra loro: l'approfondimento (o la ricerca di immagini nuove e diverse dalle prime 6 pagine di ogni motore di ricerca, sempre quelle) almeno per quanto mi riguarda la trovo sempre in sublink di link di pagine che contengono rimandi cui ci accedi in modo spesso troppo difficioltoso, casuale e dispendioso di tempo

Senza considerare che, 6 casi su 10 i top link nei maggiori motori di ricerca sono dovuti alla capacità dei singoli di organizzare bene la pagina con richiami, banner, pubblicità, e tutte quelle cose che Muze ci spiega sul concetto di "visibilità immediata" della page

Per cui, visto che non sempre visibilità = qualità o dettaglio dell'informazione, riuscire a creare un sistema che possa pescare a quella minira di info internet che spesso foss'anche per motivi di mancata voglia o capacità di visualizzazione rimangono in 3, 4, o 5 linea, bhè potrebbe essere interessante, al netto chiaro degli zilioni di spazzatura che verrebbero a galla: ma poi sta all'utenza scremare.

Magari riuscire a prevedere opzioni che consentano di graduare il livello di profondità della rete che si vuole raggiungere, in modo da tutelare certe categorie (es: bambini) o cmq settare il tipo di ricerca a seconda del tipo di utente e delle sue esigenze

_________________
ImmagineWhat if I say I’m not like the others
What if I say I’m not just another one of your plays
You’re the pretender
What if I say I will never surrender


Top
 

 Oggetto del messaggio: Re: Motori internet a caccia del web sconosciuto
MessaggioInviato: ven feb 27, 2009 14:31 
Non connesso
Moderatore
Avatar utente
 Profilo

Iscritto il: gio apr 01, 2004 18:20
Messaggi: 5694
Località: Altopiano di Leng
E pensate a quanti orripilanti cosplay potrò trovare! :twisted: :ahah:

_________________
"[...]vedete dei marinai che stanno scaricando delle tasse..."
-Grande Pacho 'M Hell-


Top
 

 Oggetto del messaggio: Re: Motori internet a caccia del web sconosciuto
MessaggioInviato: lun apr 06, 2009 11:48 
Non connesso
Moderatore
Avatar utente
 WWW  Profilo

Iscritto il: sab mar 27, 2004 18:27
Messaggi: 3267
Località: Ancona
Segnalo qui un motore di ricerca estremamente interessante, soprattutto per chi con internet ci lavora e non solo ci cazzeggia.
Immagine

Questo sito "clusterizza" i risultati della ricerca, ovvero li raggruppa per argomento, permettendovi di depurare la ricerca di quello che non vi interessa.
Scommetto che ne sentiremo parlare molto in futuro.

Un esempio:
Immagine
Buon divertimento


Top
 

Visualizza ultimi messaggi:  Ordina per  
Apri un nuovo argomento Rispondi all’argomento  [ 9 messaggi ] 

Tutti gli orari sono UTC + 1 ora [ ora legale ]



Chi c’è in linea

Visitano il forum: Nessuno e 5 ospiti


Non puoi aprire nuovi argomenti
Non puoi rispondere negli argomenti
Non puoi modificare i tuoi messaggi
Non puoi cancellare i tuoi messaggi

Cerca per:
Vai a:  
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group  
Design by Muzedon.com  
Traduzione Italiana phpBBItalia.net basata su phpBB.it 2010