Analisi numero parole

Pubblicità

cesar21

Nuovo Utente
Messaggi
1
Reazioni
0
Punteggio
2
Ciao a tutti, chiedo scusa in anticipo se non ho pubblicato nell'area più adatta del forum e chiedo ai moderatori di spostarla nell'area che loro ritengono più adatta!
Chiedo a voi più esperti nella speranza che qualcuno tra voi mi sappia dare qualche indicazione o indirizzarmi verso qualcuno che se ne intende.

Sto costruendo un sito che analizza vari documenti caricati dagli utenti (txt/pdf/doc). Tuttavia prima di tale analisi e in seguito all'upload del documento dovrei creare un "meccanismo" che sia in grado di analizzarne il numero di parole (contenute nel documento) e che generi in automatico un prezzo in base appunto al numero di parole, così che l'utente possa pagare prima dell'analisi vera e propria. Non so se mi sono spiegato bene, spero di sì!
 
e che generi in automatico un prezzo in base appunto al numero di parole, così che l'utente possa pagare prima dell'analisi vera e propria. Non so se mi sono spiegato bene, spero di sì!

Il conteggio delle parole è banale. E in verità esistono gazillioni di librerie per l'analisi dei testi. Il difficile è il fatto di dover avere a che fare con tanti tipi diversi di documenti. Se fossero solo txt, sarebbe banale. Ma per i PDF, i DOC e suppongo tu voglia aggiungerne altri, c'è bisogno di librerie apposite che ti consentano di estrarre il testo scritto.
 
Esatto, devi definire quali e quanti formati di documento vuoi accettare e poi adottare per ognuno la modalità adeguata: un file di testo dovrai contare le parole, un documento di Word processor il numero di parole fa parte delle proprietà (per cui non le devi nemmeno contare), dovrebbe essere così anche per PDF (ma ci sono un sacco di librerie dedicate). Ovviamente se si tratta di un PDF di immagini dovresti prima processarlo con un OCR.

Inviato dal mio Nexus 6P utilizzando Tapatalk
 
Pubblicità
Pubblicità
Indietro
Top