Analisi numero parole

cesar21

Nuovo Utente
1
0
Ciao a tutti, chiedo scusa in anticipo se non ho pubblicato nell'area più adatta del forum e chiedo ai moderatori di spostarla nell'area che loro ritengono più adatta!
Chiedo a voi più esperti nella speranza che qualcuno tra voi mi sappia dare qualche indicazione o indirizzarmi verso qualcuno che se ne intende.

Sto costruendo un sito che analizza vari documenti caricati dagli utenti (txt/pdf/doc). Tuttavia prima di tale analisi e in seguito all'upload del documento dovrei creare un "meccanismo" che sia in grado di analizzarne il numero di parole (contenute nel documento) e che generi in automatico un prezzo in base appunto al numero di parole, così che l'utente possa pagare prima dell'analisi vera e propria. Non so se mi sono spiegato bene, spero di sì!
 

Andreagamer1999

CAR GUY
Utente Èlite
6,673
2,469
CPU
Core 2 duo e6600
Dissipatore
CoolerMaster
Scheda Madre
Intel
HDD
240gb Kingston / 240gb hdd maxtor
RAM
4gb DDR2 667mhz
GPU
GTX 660 palit
Audio
Integrata
Monitor
1080p 60hz
PSU
650w
OS
Windows 7

pabloski

Utente Èlite
2,721
793
e che generi in automatico un prezzo in base appunto al numero di parole, così che l'utente possa pagare prima dell'analisi vera e propria. Non so se mi sono spiegato bene, spero di sì!

Il conteggio delle parole è banale. E in verità esistono gazillioni di librerie per l'analisi dei testi. Il difficile è il fatto di dover avere a che fare con tanti tipi diversi di documenti. Se fossero solo txt, sarebbe banale. Ma per i PDF, i DOC e suppongo tu voglia aggiungerne altri, c'è bisogno di librerie apposite che ti consentano di estrarre il testo scritto.
 

rctimelines

Utente Èlite
5,144
2,023
CPU
Ryzen 7 2700X | i7-6700k@4.5 | i5-4460... altri
Dissipatore
wraith MAX | Scythe Katana2|Arctic Freezer 11LP
Scheda Madre
Asrock B450 Fatal1ty 4K | Asus Prime Z270P | Acer Veriton
HDD
Samsung 970evo m.2 | vari | Samsung 860 evo
RAM
16GB G.Skill TridentZ 3000 | 16GB CORSAIR 2133 | 8GB DDR3 1600
GPU
RadeonPro WX3100 4G | ZOTAC GTX 1070 8G | Quadro k620 2G
Monitor
DELL 2419P 2K + Benq 17" | LG Ultrawide 27''
Net
fibra 1000
OS
Windows10-pro64/OpenSUSE-QL15.1/Debian 10.3
Esatto, devi definire quali e quanti formati di documento vuoi accettare e poi adottare per ognuno la modalità adeguata: un file di testo dovrai contare le parole, un documento di Word processor il numero di parole fa parte delle proprietà (per cui non le devi nemmeno contare), dovrebbe essere così anche per PDF (ma ci sono un sacco di librerie dedicate). Ovviamente se si tratta di un PDF di immagini dovresti prima processarlo con un OCR.

Inviato dal mio Nexus 6P utilizzando Tapatalk
 

Entra

oppure Accedi utilizzando

Discussioni Simili

Hot: Sei vaccinato? [sondaggio anonimo]

  • Primo ciclo vaccinale completo (1-2 dosi)

    Voti: 418 78.6%
  • Fatta 1a dose, in attesa della 2a

    Voti: 18 3.4%
  • Sono prenotato per la 1a dose

    Voti: 13 2.4%
  • Non so se vaccinarmi

    Voti: 14 2.6%
  • Non ho intenzione di vacciarmi

    Voti: 57 10.7%
  • Fatta anche la terza dose

    Voti: 12 2.3%