RISOLTO Pdf in OCR

Stato
Discussione chiusa ad ulteriori risposte.

MetaEX

Punks Not Dead
Utente Èlite
1,744
111
CPU
Intel Core i9 7890XE
Dissipatore
Corsair Hydro 115i RGB Platinum Radiatore da 280 mm, Ventola Doppia ML PRO da 140 mm RGB PWM, Controllo Avanzato
Scheda Madre
ROG RAMPAGE VI EXTREME
HDD
Corsair MP600 CORE XT 4000,7 GB
RAM
GSkill F4-3200C15D-16GTZSW Memoria RAM da 2x8 GB, DDR4, 3200 MHz, CL15
GPU
XFX SPEEDSTER QICK319 RADEON RX 6750XT CORE Gaming Scheda Grafica con 12GB GDDR6 HDMI 3xDP
Audio
Aune X1sGT
Monitor
BenQ PD2500Q Monitor per Designer 25 Pollici QHD, 2560 x 1440 QHD
PSU
EVGA SuperNOVA 850 G3 850W Nero
Case
Cooler Master Storm Trooper Gaming
Periferiche
Hauppauge WinTV HVR-5525 (Model 150xxx, Hybrid DVB-T/T2/C/S2, IR)
OS
Microsoft Windows 11 22H2
Salve a tutti,
Possiedo una grande quanità di PDF in ocr, esiste uno scanner che potrebbe ricercare una frase o parola all'interno di 1500 PDF? Grazie del suggerimento, ciao
 

Ibernato

Utente Èlite
4,328
2,047
OS
Windows 10 Pro / Ubuntu 22.04
Salve a tutti,
Possiedo una grande quanità di PDF in ocr, esiste uno scanner che potrebbe ricercare una frase o parola all'interno di 1500 PDF? Grazie del suggerimento, ciao
Ciao,
esiste Tesseract come OCR. Se hai dimestichezza con Python/C/C++, potresti crearti un programmino e leggere in loop i PDF ed estrarre la parola che cerchi.
Io ho trovato questo sviluppato con tesseract https://github.com/A9T9/Free-Ocr-Windows-Desktop/releases (vedi se può esserti utile)
 
  • Mi piace
Reazioni: Moffetta88

MetaEX

Punks Not Dead
Utente Èlite
1,744
111
CPU
Intel Core i9 7890XE
Dissipatore
Corsair Hydro 115i RGB Platinum Radiatore da 280 mm, Ventola Doppia ML PRO da 140 mm RGB PWM, Controllo Avanzato
Scheda Madre
ROG RAMPAGE VI EXTREME
HDD
Corsair MP600 CORE XT 4000,7 GB
RAM
GSkill F4-3200C15D-16GTZSW Memoria RAM da 2x8 GB, DDR4, 3200 MHz, CL15
GPU
XFX SPEEDSTER QICK319 RADEON RX 6750XT CORE Gaming Scheda Grafica con 12GB GDDR6 HDMI 3xDP
Audio
Aune X1sGT
Monitor
BenQ PD2500Q Monitor per Designer 25 Pollici QHD, 2560 x 1440 QHD
PSU
EVGA SuperNOVA 850 G3 850W Nero
Case
Cooler Master Storm Trooper Gaming
Periferiche
Hauppauge WinTV HVR-5525 (Model 150xxx, Hybrid DVB-T/T2/C/S2, IR)
OS
Microsoft Windows 11 22H2
Sto a zero di programmazione, ma ti ringrazio ugualmente...
 

MetaEX

Punks Not Dead
Utente Èlite
1,744
111
CPU
Intel Core i9 7890XE
Dissipatore
Corsair Hydro 115i RGB Platinum Radiatore da 280 mm, Ventola Doppia ML PRO da 140 mm RGB PWM, Controllo Avanzato
Scheda Madre
ROG RAMPAGE VI EXTREME
HDD
Corsair MP600 CORE XT 4000,7 GB
RAM
GSkill F4-3200C15D-16GTZSW Memoria RAM da 2x8 GB, DDR4, 3200 MHz, CL15
GPU
XFX SPEEDSTER QICK319 RADEON RX 6750XT CORE Gaming Scheda Grafica con 12GB GDDR6 HDMI 3xDP
Audio
Aune X1sGT
Monitor
BenQ PD2500Q Monitor per Designer 25 Pollici QHD, 2560 x 1440 QHD
PSU
EVGA SuperNOVA 850 G3 850W Nero
Case
Cooler Master Storm Trooper Gaming
Periferiche
Hauppauge WinTV HVR-5525 (Model 150xxx, Hybrid DVB-T/T2/C/S2, IR)
OS
Microsoft Windows 11 22H2
si ma processa sinagola pagina, dovrebbe processare tutte le 1500 PDF, file
 

MetaEX

Punks Not Dead
Utente Èlite
1,744
111
CPU
Intel Core i9 7890XE
Dissipatore
Corsair Hydro 115i RGB Platinum Radiatore da 280 mm, Ventola Doppia ML PRO da 140 mm RGB PWM, Controllo Avanzato
Scheda Madre
ROG RAMPAGE VI EXTREME
HDD
Corsair MP600 CORE XT 4000,7 GB
RAM
GSkill F4-3200C15D-16GTZSW Memoria RAM da 2x8 GB, DDR4, 3200 MHz, CL15
GPU
XFX SPEEDSTER QICK319 RADEON RX 6750XT CORE Gaming Scheda Grafica con 12GB GDDR6 HDMI 3xDP
Audio
Aune X1sGT
Monitor
BenQ PD2500Q Monitor per Designer 25 Pollici QHD, 2560 x 1440 QHD
PSU
EVGA SuperNOVA 850 G3 850W Nero
Case
Cooler Master Storm Trooper Gaming
Periferiche
Hauppauge WinTV HVR-5525 (Model 150xxx, Hybrid DVB-T/T2/C/S2, IR)
OS
Microsoft Windows 11 22H2
OK Ibernato, grazi di nuovo , notte!
 

Selia09

Utente Attivo
393
3
CPU
pentium 4
Scheda Madre
Agp
HDD
Due tera
RAM
1Gb Buffalo ( due banchi da 500 )
Monitor
Viewsonic VP930
PSU
530
OS
Windows
Salve a tutti, provo a scrivere qui visto le applicazioni di nicchia di cui parliamo e la specificità del problema.

Vedo che gli scanner ocr non riconoscono il corsivo e lo riportano normalmente come il resto del testo. Conoscete qualche app che lo mantiene?
 

MetaEX

Punks Not Dead
Utente Èlite
1,744
111
CPU
Intel Core i9 7890XE
Dissipatore
Corsair Hydro 115i RGB Platinum Radiatore da 280 mm, Ventola Doppia ML PRO da 140 mm RGB PWM, Controllo Avanzato
Scheda Madre
ROG RAMPAGE VI EXTREME
HDD
Corsair MP600 CORE XT 4000,7 GB
RAM
GSkill F4-3200C15D-16GTZSW Memoria RAM da 2x8 GB, DDR4, 3200 MHz, CL15
GPU
XFX SPEEDSTER QICK319 RADEON RX 6750XT CORE Gaming Scheda Grafica con 12GB GDDR6 HDMI 3xDP
Audio
Aune X1sGT
Monitor
BenQ PD2500Q Monitor per Designer 25 Pollici QHD, 2560 x 1440 QHD
PSU
EVGA SuperNOVA 850 G3 850W Nero
Case
Cooler Master Storm Trooper Gaming
Periferiche
Hauppauge WinTV HVR-5525 (Model 150xxx, Hybrid DVB-T/T2/C/S2, IR)
OS
Microsoft Windows 11 22H2
questo è il mo 3d come vi permettete? HEheheh ciao buon anno a tutti ?
 
  • Mi piace
Reazioni: Selia09 e Mursey

Andretti60

Utente Èlite
6,440
5,091
Scusa, non capisco la domanda.
PDF è un formato per documenti, OCR è una tecnica per estrarre testi da una immagine. Prima parli di 1500 documenti, poi parli di 1500 pagine.
Acrobat Reader permette di cercare un testo su tutti i documenti contenuti in una cartella
 

MetaEX

Punks Not Dead
Utente Èlite
1,744
111
CPU
Intel Core i9 7890XE
Dissipatore
Corsair Hydro 115i RGB Platinum Radiatore da 280 mm, Ventola Doppia ML PRO da 140 mm RGB PWM, Controllo Avanzato
Scheda Madre
ROG RAMPAGE VI EXTREME
HDD
Corsair MP600 CORE XT 4000,7 GB
RAM
GSkill F4-3200C15D-16GTZSW Memoria RAM da 2x8 GB, DDR4, 3200 MHz, CL15
GPU
XFX SPEEDSTER QICK319 RADEON RX 6750XT CORE Gaming Scheda Grafica con 12GB GDDR6 HDMI 3xDP
Audio
Aune X1sGT
Monitor
BenQ PD2500Q Monitor per Designer 25 Pollici QHD, 2560 x 1440 QHD
PSU
EVGA SuperNOVA 850 G3 850W Nero
Case
Cooler Master Storm Trooper Gaming
Periferiche
Hauppauge WinTV HVR-5525 (Model 150xxx, Hybrid DVB-T/T2/C/S2, IR)
OS
Microsoft Windows 11 22H2
penso che hai preso in pieno, mi servirebbe scansire 1500 pagine gia passate in OCR, sono dei PDF, ma capisci bene che non posso aprirne uno per uno e fare la rilevazione ma tutte le 1500 insieme ora proviamo l'acrobat, thx
 

MetaEX

Punks Not Dead
Utente Èlite
1,744
111
CPU
Intel Core i9 7890XE
Dissipatore
Corsair Hydro 115i RGB Platinum Radiatore da 280 mm, Ventola Doppia ML PRO da 140 mm RGB PWM, Controllo Avanzato
Scheda Madre
ROG RAMPAGE VI EXTREME
HDD
Corsair MP600 CORE XT 4000,7 GB
RAM
GSkill F4-3200C15D-16GTZSW Memoria RAM da 2x8 GB, DDR4, 3200 MHz, CL15
GPU
XFX SPEEDSTER QICK319 RADEON RX 6750XT CORE Gaming Scheda Grafica con 12GB GDDR6 HDMI 3xDP
Audio
Aune X1sGT
Monitor
BenQ PD2500Q Monitor per Designer 25 Pollici QHD, 2560 x 1440 QHD
PSU
EVGA SuperNOVA 850 G3 850W Nero
Case
Cooler Master Storm Trooper Gaming
Periferiche
Hauppauge WinTV HVR-5525 (Model 150xxx, Hybrid DVB-T/T2/C/S2, IR)
OS
Microsoft Windows 11 22H2
grazie infinite.... scansite, e problema risolto ottimo regalo di buon anno :-) ciao!
 
  • Mi piace
Reazioni: Andretti60
Stato
Discussione chiusa ad ulteriori risposte.

Entra

oppure Accedi utilizzando
Discord Ufficiale Entra ora!

Discussioni Simili