Salve,
vorrei chiedere un consiglio a riguardo di un futuro acquisto.
In breve, ho svolto un lavoro di tesi all'estero che dovrei continuare nei prossimi mesi.
Date le policy di sicurezza per la gestione dei dati, non ho avuto la possibilità di avere accesso al cluster da remoto.
Perciò, avrei la necessità di creare una workstation in grado di svolgere la stessa tipologia di analisi che stavo conducendo, nonché essere fruibile per il futuro.
In breve, la task più "impegnativa" consiste nell'applicare un metodo di detezione di comunità basato su modelli generativi Baesyani usando un pacchetto di python chiamato graph-tool.
Abbiamo testato questo pacchetto eseguendo l'analisi variando il numero di threads e RAM a disposizione su un cluster con CPU Intel Xeon Gold 6138 (max f. turbo boost 3.7 GHz), notando che sostanzialmente bastavano 3 threads e 3GB di RAM per singola analisi. Questo non per dire che fosse il requisito minimo ma che tendienzialmente il tempo di analisi rimaneva invariato all'aumentare delle risorse. Idealmente svolgerei sulle 5/7 analisi al massimo contemproaneamente (ma spesso ne svolgevo solo 3/4). Il problema è che, su grossi network, potrebbe volerci qualche giorno per ottenere i risultati dell'analisi. Quello di cui sono sicuro è che beneficerei di un alta velocità in single core, dal momento che la maggior parte degli strumenti che utilizzo in R studio non beneficiano della parallelizzazione. Sono quasi sicuro che anche l'incremento della performance in single core possa avere una influenza nel tempo di analisi che richiede il metodo di detezione di comunità che sto usando. Tuttavia non ho avuto modo di poterlo testare. In conclusione, l'orientarmi verso la scelta tra numero di threads disponibili / velocità di clock mi rimane un po' difficile.
Posto che vorrei investire sui 1000 euro (+/- 250 euro) , mi stavo orientando per capire quale potesse essere la migliore configurazione per la mia necessità:
- Optare per una build usata con un i9 7980 XE, dato il numero elevato di cores e threads (18C/36T) rinunciando a efficienza energetica e a una ridotta velocità di clock a fronte di un maggior numero di threads (e quindi avere la possibilità di svolgere molte più analisi insieme).
- Optare per un nuovo i7 12700K (o F non K), orientandomi a una maggiore velocità di clock e maggiore efficienza energetica sacrificando 16T. Non so, inoltre, se un processore più moderno porti più vantaggi a livello di efficienza computazionale per motivi di maggiore efficenza di gestione delle task (che sto ipotizzando, in quanto a me oscuri) e/o librerie aggiornate per calcoli relativi ad algebra lineare e similari.
Spero di non essere stato eccessivamente prolisso.
Vi ringrazio in anticipo per il vostro aiuto.
P.S.
Ho già a disposizione SSD, Hard disk e alimentatore.
Il budget è da intendersi su mobo+CPU+ dissipatore +32/16Gb ram [a espandere in un secondo momento ci vuol poco]
vorrei chiedere un consiglio a riguardo di un futuro acquisto.
In breve, ho svolto un lavoro di tesi all'estero che dovrei continuare nei prossimi mesi.
Date le policy di sicurezza per la gestione dei dati, non ho avuto la possibilità di avere accesso al cluster da remoto.
Perciò, avrei la necessità di creare una workstation in grado di svolgere la stessa tipologia di analisi che stavo conducendo, nonché essere fruibile per il futuro.
In breve, la task più "impegnativa" consiste nell'applicare un metodo di detezione di comunità basato su modelli generativi Baesyani usando un pacchetto di python chiamato graph-tool.
Abbiamo testato questo pacchetto eseguendo l'analisi variando il numero di threads e RAM a disposizione su un cluster con CPU Intel Xeon Gold 6138 (max f. turbo boost 3.7 GHz), notando che sostanzialmente bastavano 3 threads e 3GB di RAM per singola analisi. Questo non per dire che fosse il requisito minimo ma che tendienzialmente il tempo di analisi rimaneva invariato all'aumentare delle risorse. Idealmente svolgerei sulle 5/7 analisi al massimo contemproaneamente (ma spesso ne svolgevo solo 3/4). Il problema è che, su grossi network, potrebbe volerci qualche giorno per ottenere i risultati dell'analisi. Quello di cui sono sicuro è che beneficerei di un alta velocità in single core, dal momento che la maggior parte degli strumenti che utilizzo in R studio non beneficiano della parallelizzazione. Sono quasi sicuro che anche l'incremento della performance in single core possa avere una influenza nel tempo di analisi che richiede il metodo di detezione di comunità che sto usando. Tuttavia non ho avuto modo di poterlo testare. In conclusione, l'orientarmi verso la scelta tra numero di threads disponibili / velocità di clock mi rimane un po' difficile.
Posto che vorrei investire sui 1000 euro (+/- 250 euro) , mi stavo orientando per capire quale potesse essere la migliore configurazione per la mia necessità:
- Optare per una build usata con un i9 7980 XE, dato il numero elevato di cores e threads (18C/36T) rinunciando a efficienza energetica e a una ridotta velocità di clock a fronte di un maggior numero di threads (e quindi avere la possibilità di svolgere molte più analisi insieme).
- Optare per un nuovo i7 12700K (o F non K), orientandomi a una maggiore velocità di clock e maggiore efficienza energetica sacrificando 16T. Non so, inoltre, se un processore più moderno porti più vantaggi a livello di efficienza computazionale per motivi di maggiore efficenza di gestione delle task (che sto ipotizzando, in quanto a me oscuri) e/o librerie aggiornate per calcoli relativi ad algebra lineare e similari.
Spero di non essere stato eccessivamente prolisso.
Vi ringrazio in anticipo per il vostro aiuto.
P.S.
Ho già a disposizione SSD, Hard disk e alimentatore.
Il budget è da intendersi su mobo+CPU+ dissipatore +32/16Gb ram [a espandere in un secondo momento ci vuol poco]
Ultima modifica: