Analisi numero parole

cesar21

Nuovo Utente
1
0
Ciao a tutti, chiedo scusa in anticipo se non ho pubblicato nell'area più adatta del forum e chiedo ai moderatori di spostarla nell'area che loro ritengono più adatta!
Chiedo a voi più esperti nella speranza che qualcuno tra voi mi sappia dare qualche indicazione o indirizzarmi verso qualcuno che se ne intende.

Sto costruendo un sito che analizza vari documenti caricati dagli utenti (txt/pdf/doc). Tuttavia prima di tale analisi e in seguito all'upload del documento dovrei creare un "meccanismo" che sia in grado di analizzarne il numero di parole (contenute nel documento) e che generi in automatico un prezzo in base appunto al numero di parole, così che l'utente possa pagare prima dell'analisi vera e propria. Non so se mi sono spiegato bene, spero di sì!
 

Andreagamer1999

Utente Attivo
4,667
1,402
CPU
Core 2 duo e6600
Dissipatore
CoolerMaster
Scheda Madre
Intel
Hard Disk
240gb Kingston / 240gb hdd maxtor
RAM
4gb DDR2 667mhz
Scheda Video
GTX 660 palit
Scheda Audio
Integrata
Monitor
1080p 60hz
Alimentatore
650w
Sistema Operativo
Windows 7

pabloski

Utente Èlite
2,191
521
e che generi in automatico un prezzo in base appunto al numero di parole, così che l'utente possa pagare prima dell'analisi vera e propria. Non so se mi sono spiegato bene, spero di sì!
Il conteggio delle parole è banale. E in verità esistono gazillioni di librerie per l'analisi dei testi. Il difficile è il fatto di dover avere a che fare con tanti tipi diversi di documenti. Se fossero solo txt, sarebbe banale. Ma per i PDF, i DOC e suppongo tu voglia aggiungerne altri, c'è bisogno di librerie apposite che ti consentano di estrarre il testo scritto.
 

rctimelines

Utente Èlite
4,981
1,811
CPU
Ryzen 7 2700X | i5-6600k@4.5 | i5-4460... altri
Dissipatore
wraith MAX | Scythe Katana2|Arctic Freezer 11LP
Scheda Madre
Asrock Fatal1ty 4K | Asus Prime Z270P | Acer Veriton
Hard Disk
Samsung 970evo m.2 | vari | Samsung 860 evo
RAM
16GB G.Skill TridentZ 3000 | 16GB CORSAIR 2133 | 8GB DDR3 1600
Scheda Video
RadeonPro WX3100 4G | KFA2 GTX 970 4G | Quadro k620 2G
Monitor
DELL 2419P 2K + Benq 17" | LG Ultrawide 27''
Internet
fibra 1000
Sistema Operativo
Windows10-pro64/OpenSUSE-QL15.1/Debian 10.3
Esatto, devi definire quali e quanti formati di documento vuoi accettare e poi adottare per ognuno la modalità adeguata: un file di testo dovrai contare le parole, un documento di Word processor il numero di parole fa parte delle proprietà (per cui non le devi nemmeno contare), dovrebbe essere così anche per PDF (ma ci sono un sacco di librerie dedicate). Ovviamente se si tratta di un PDF di immagini dovresti prima processarlo con un OCR.

Inviato dal mio Nexus 6P utilizzando Tapatalk
 

Entra

oppure Accedi utilizzando

Discussioni Simili

Hot del momento