Salve ragazzi, ho poca esperienza col Python e avevo intenzione di ampliare un piccolo script che ho e renderlo più grande ed autonomo.
Per il momento lo script, usando urllib2, ha una lista di pagine, le apre ad una ad una e controlla quale corrisponde a certi parametri, quelle che vengono considerate giuste le apre a video (questa era la mia idea iniziale ed è stata semplicissima da realizzare). Ora per rendere il tutto più autonomo vorrei ampliare questo script, elenco di seguito quello che gli vorrei far fare:
- Ho caricato in una variabile una stringa contenente tutto il sorgente della pagina fatto sommariamente in questo modo <tanto codice html> 23 ottobre 1992 <altro codice html> (Esiste una sola data nella pagina che è solo quella che mi serve, ma ci possono essere altri numeri)
- Ora devo caricare il giorno in una variabile giorno, il mese in una variabile sempre di tipo stringa ma a numero (es. febbraio 02) e l'anno sempre in una variabile stringa come per giorno.
- A questo punto deve aprire un altra pagina e riempire il form nella sezione "data:" con <giorno>.<mese>.<anno>
Ora, da quello che so è possibile compilare il form con urllib2 una volta avute le varibili necessarie (quelle della data) anche se preferirei un'altro modo se lo conoscete, ma la parte che mi risulta più difficile è quella della gestione del testo della pagina html per estrarre le informazioni che mi servono, avete qualche consiglio? ci sono delle librerie che mi rendono il lavoro un po' più semplice?
Grazie, Buonagiornata
Per il momento lo script, usando urllib2, ha una lista di pagine, le apre ad una ad una e controlla quale corrisponde a certi parametri, quelle che vengono considerate giuste le apre a video (questa era la mia idea iniziale ed è stata semplicissima da realizzare). Ora per rendere il tutto più autonomo vorrei ampliare questo script, elenco di seguito quello che gli vorrei far fare:
- Ho caricato in una variabile una stringa contenente tutto il sorgente della pagina fatto sommariamente in questo modo <tanto codice html> 23 ottobre 1992 <altro codice html> (Esiste una sola data nella pagina che è solo quella che mi serve, ma ci possono essere altri numeri)
- Ora devo caricare il giorno in una variabile giorno, il mese in una variabile sempre di tipo stringa ma a numero (es. febbraio 02) e l'anno sempre in una variabile stringa come per giorno.
- A questo punto deve aprire un altra pagina e riempire il form nella sezione "data:" con <giorno>.<mese>.<anno>
Ora, da quello che so è possibile compilare il form con urllib2 una volta avute le varibili necessarie (quelle della data) anche se preferirei un'altro modo se lo conoscete, ma la parte che mi risulta più difficile è quella della gestione del testo della pagina html per estrarre le informazioni che mi servono, avete qualche consiglio? ci sono delle librerie che mi rendono il lavoro un po' più semplice?
Grazie, Buonagiornata