Aiuto per convertire file HTML in JSON/CSV/XLSX

Pubblicità
Stato
Discussione chiusa ad ulteriori risposte.

Xmas83

Utente Attivo
Messaggi
96
Reazioni
2
Punteggio
38
Ciao a tutti!
Ho un file HTML con domande a risposta multipla (una sola corretta) che vorrei convertire in un file JSON.
Nel file HTML i dati importanti sono:
- colonna TEXT in cui c'è la domanda (ad esempio, la prima: 1. In una polmonite da Staphylococcus aureus...);
- colonne TEXT in cui ci sono 5 risposte (a, b, c, d, e);
- colonna OK in cui c'è un numero da 1 a 5 che corrisponde alla risposta corretta tra le 5.

Ciò di cui avrei bisogno è convertire quel file HTML in un JSON con le regole di quello allegato (che riporta le prime due domande come esempio).
Se convertire in JSON è complicato, in alternativa si potrebbe convertire in CSV o in XLSX.
E' una cosa fattibile? Considerate che io proprio non saprei da dove iniziare...

P.S.: non riesco ad allegare i file, quindi potete scaricarli da qui.
 
Puoi utilizzare un web scraper. Ad esempio per python c'è scrapy
Una volta estratti i dati che ti servono li puoi convertire in qualsiasi formato.
 
Allora mi sa tanto che o lo fai a mano, oppure paghi/trovi qualcuno che lo implementi per te.
 
Purtroppo non sono proprio in grado di farlo... :(
Ciao potresti usare javascript , puoi prendere i dati partendo dall'elemento <tbody> per ogni riga("child") <tr> eliminando le prime due nel ciclo che esegui pre tutti i child dell'elemento.
ovviamente nel ciclo ti leggi i dati a sua volta delle colonne e te li salvi in un json e a fine ciclo scrivi il json in un file.

Non ho visto attentamente il json ma indifferentemente sta a te formattare i dati poi nei cicli o formattarli in seguito(dipende dalla tua esigenza).
 
Stato
Discussione chiusa ad ulteriori risposte.
Pubblicità
Pubblicità
Indietro
Top