Scaricare intero sito web

Pubblicità

lalalla

Nuovo Utente
Messaggi
33
Reazioni
3
Punteggio
26
Buongiorno a tutti,

come da titolo ho la necessità di scaricare un intero sito web (o meglio una grossa parte di esso). In pratica devo farne una copia locale.
Dalle mie ricerche in rete ho notato che ci sono alcuni programmi che lo fanno. Non ho potuto però risolvere queste problematche.

- Il sito di cui vorrei fare una copia locale è protetto da accesso username/password (di cui dispongo l'accesso). Per tanto devo "autenticare il programma"
- Il download non dovrebbe avvenire "tutto in un colpo solo" poichè -presumo che- il sito web sia protetto da sistemi "anti-copia"
- Vorrei limitare il download a tutti i link (e sottolink) presenti in una specifica parte della pagina web. (si tratta di ca. 1000 link principali)

Ringrazio anticipatamente per il vostro aiuto.
 
Ma è un sito di tua proprietà e di cui sei autorizzato all'accesso? In ogni caso, se è un sito dinamico senza i database non fai molto.

Inviato dal mio Nexus 6P utilizzando Tapatalk
 
Il sito non è di mia proprietà, e sono autorizzato all'accesso.
Non è propriamente dinamico. In pratica il contenuto che mi interessa viene caricato. Si tratta di testo. Il problema è che sono davvero tante pagine con altrettanti riinvii interni.

io in pratica vorrei fare una copia offline di (una grossa parte) delle pagine.
 
Se ti danno i dati di accesso scarichi tutto in ftp,scarichi il database e te lo metti in locale su xampp o simili
 
Prova intanto con qualche "spider" che ti tira giù le pagine staticamente e vedi se ti è sufficiente. Cerca "spider" tra i plugin di Firefox, un tempo c'era anche Spiderzilla, ma non so come funzionano ora, sono anni che non li uso.

Inviato dal mio Nexus 6P utilizzando Tapatalk
 
Se ti danno i dati di accesso scarichi tutto in ftp,scarichi il database e te lo metti in locale su xampp o simili
Sfortunatamente non ho accesso ftp

Prova intanto con qualche "spider" che ti tira giù le pagine staticamente e vedi se ti è sufficiente. Cerca "spider" tra i plugin di Firefox, un tempo c'era anche Spiderzilla, ma non so come funzionano ora, sono anni che non li uso.

Ho cercato tra i plugin ma con il termine "spider" non ho trovato niente. Ho trovato un plug-in (sempre per firefox) "Save Page WE" (idem "SingleFile | Save a page as a single HTML file") che fa esattamente quello di cui ho bisogno, ma sfortunatamente limitato alla pagina aperta in quel istatne (mentre io necessito di salvare in locale una grossa quantità di pagine, con ripettivi collegamenti [link]).
 
Sono in formato pdf con protezione DRM?

No si tratta proprio di un sito web, con molte pagine. Non si tratta di PDF con protezione DRM.
Il sito continene - per altro- a sua volta dei file pdf, i quali però non sono protetti da DRM.
è il sito stesso a essere protetto (login + accesso in proxy)
 
Ho già avuto modo di provarlo. Sfortunatamente non risesco a risolvere la problematica dell'autenticazione per l'accessio al sito web e per tanto non riesco a scaricare niente.
Cosa c'entra l'autenticazione? Hai detto che sei autorizzato ad accedere al sito.

Inviato dal mio Nexus 6P utilizzando Tapatalk
 
Cosa c'entra l'autenticazione? Hai detto che sei autorizzato ad accedere al sito.

Inviato dal mio Nexus 6P utilizzando Tapatalk
Confermo. Io sono autorizzato ad accedere al sito. Il problema consiste nell'autorizzazione del programma ad accedere (loggarsi) al sito, per poter scaricarne il contenuto. In pratica devo istruire il programma per eseguire il login (senza che lo faccia manualmente io), altrimenti non posso scaricare nulla in automatico
 
No, era per dire che "webcopy" funziona allo stesso modo. Inoltre se vedi nella definizione del progetto è prevista la possibilità di fare il login automatico.. ma cosa hai provato?!?

Almeno, io l'ho provato per curiosità visti che c'è pure una versione portable, e mi funziona tranquillamente anche su sito dove è richiesto l'accesso.
Si, è un po' spartano. Ma va

Cyotek webcopy ha un'interfaccia decisamente migliore e più opzioni. Mi ha anche dato più errori però, e anche un sito piuttosto semplice semplice non è riuscito a completarlo.

Inviato dal mio Nexus 6P utilizzando Tapatalk
 
Ultima modifica:
Pubblicità
Pubblicità
Indietro
Top