Realizzazione portale

Pubblicità

naitian

Utente Attivo
Messaggi
19
Reazioni
0
Punteggio
40
Avrei una domanda, da profano (essendo un web designer)... Per sviluppare un portale, diciamo un archivio di qualche migliaio di documenti (o PDF oppure che si apriranno nella pagina stessa, è da vedere ancora), all'interno dei quali sarà possibile effettuare delle ricerche (su titoli, testi ecc insomma su tutto), è sufficiente creare un CMS, magari in Joomla, oppure per rendere più performante il sistema sarebbe bene creare dei CGI, in PERL, o magari PYTHON, per esempio?
Un portale di tali dimensioni in PHP reggerebbe?

Il mio timore è che la ricerca full-text, all'interno quindi del contenuto dei pdf, con una tecnologia come PHP su migliaia di documenti possa essere lento... Oppure non c'è differenza di efficienza con cgi perl, python ecc.?

Con la programmazione me la cavo quando mi ci metto, si tratterebbe di pochi comandi (la navigazione del portale e appunto la ricerca dei documenti ospitati), quindi se anche devo entrare in un mondo che non conosco come i CGI non mi spaventa, anche perché ho mesi davanti, però si tratta di capire se questo è necessario o meno...

Grazie mille !
 
Forse dovresti crearti delle funzioni apposta (che se poi vuoi integrarle in joomla od altro cms sei libero di farlo) che fanno l'indicizzazione dei documenti su delle tabelle nel database al momento dell'inserimento del documento (lato admin), quindi un utente che cerca, lo fa nel database che restituisce poi il/i documento/i interessati. Non puoi fare diversamente, perché se hai anche 100 pdf di 10 pagine ciascuno, la ricerca diventa moto lenta e consuma un sacco di risorse lato server nonché rischi di arrivare al timeout dello script ovvero tra apertura del pdf, decodifica, ricerca, carico in un oggetto dei risultati e chiusura pdf, se non contiamo che se il pdf ha qualche immagine embedded la cosa peggiora ancora di più in quanto essa viene "compressa" usando il base64_encode (che in pratica per 100kb d'immagine ti pesa 133kb nel pdf).

Del resto, confermo: PHP è un signor linguaggio ;)
 
Grazie a entrambi per la risposta, i suggerimenti e anche per l'iniezione di fiducia in php, da web designer sicuramente mi fa piacere :) avendoci già lavorato.
Ho sentito parlare di Lucene, che tra l'altro è stata reimplementata anche in PHP. Su wikipedia si dice anche "possono essere indicizzati con Lucene testi in PDF, HTML, Microsoft Word così come ogni in altro tipo di file dal quale sia possibile estrarre informazioni".
O comunque se non proprio Lucene, qualcosa del genere insomma.
 
No non ho ancora deciso, anche perché ho un po' ti tempo ancora per farlo.

Essenzialmente trattandosi di una biblioteca con documenti ricercabili nemmeno mi occorrerebbe un CMS, essendo poche le pagine effettive (a differenza dei documenti ospitati che sono migliaia); avevo però pensato che usare un CMS mi avrebbe aiutato nell'integrazione di queste funzioni di ricerca lato server, ma forse non è nemmeno necessario in effetti; qualcosa di abbastanza semplice in Perl si potrebbe fare.

Come resa, meglio Perl o PHP ? :)
 
Lascia perdere PHP e fallo in python, usando un framework tipo django o turbogears comunque per la ricerca comunque ci sono vari software che potrebbero avere una resa maggiore per la ricerca fulltext e l'indicizzazione di documenti a cui poi puoi interfacciarti con il linguaggio scelto
 
Grazie kyx... Azz ma sei stato bannato?? :(
Che tipo di software? Riguardo a quel Lucene, per esempio, c'è PyLucene... Qualcosa di simile va bene?
 
Pubblicità
Pubblicità
Indietro
Top