Autore: TheMasmo
Data: 08-08-05 18:17
Ciao,
ho realizzato un primo modulo che opera cosi:
1) scarica la 1° pagina del forum (quella + recente) in html e la salva
2) in questa pagina cerca la scritta "messaggi vecchi"
3) cerca l'href a sx + vicino
<a href="list.php?f=1&t=34758&a=2"><FONT color='#000000' class="PhorumNav">Messaggi vecchi
4) richiama il sito http://astrofili.tnx.it/forum/ con di seguito quello
che ho trovato nell'href, nel caso di sopra list.php?f=1&t=34758&a=2
quindi http://astrofili.tnx.it/forum/list.php?f=1&t=34758&a=2
5) salva la buova pagina e ripete da 2
In questo modo ho tutte le pagine con tutti gli oggetti.
Il secondo modulo preleva queste pagine (che ora sono il locale), e
analizza tutte le righe che hanno il testo READ all'interno. In pratica
trovo tutti i link agli oggetti delle pagine di sopra.. ad esempio
<a href="read.php?f=1&i=35030&t=35030">Problemino!!</a>
Tutte i link, vengono aperti e scaricati in modo testo dentro il db.
Il 1° modulo richiede sui 2 e mezzo per scaricare tutte le 111
pagine.
Il 2° modulo... bo, sono andato a mangiare e quando sono tornato
aveva finito... ci vorra +/- una mezzoretta..
E' + difficile a dirlo che a farlo.
Jean.. la ricerca è sotto la scritta 1° Forum di Astronomia amatoriale in Italia
Nuovo messaggio | Torna all'inizio | Vai all'argomento | Ricerca
BYE
Massimo
|
|