DOMANDA Data Scientist, come si diventa?

  • Autore discussione Autore discussione Saxo
  • Data d'inizio Data d'inizio
Pubblicità

Saxo

Nuovo Utente
Messaggi
67
Reazioni
3
Punteggio
29
Ciao a tutti,
ho notato che cercando sul forum appaiono in maniera un pò sparsa e casuale queste due parole assieme "Data Scientist".
Con questo post volevo cercare di raggruppare alcune informazioni che personalmente mi mancano e che magari mancano anche ad altri interessati del settore. Chiederei a chi già svolge questo lavoro che tipo di percorso di studi ha seguito, o ancora meglio se ha seguito qualche corso online o "fisico" che rilascia certificazioni o attestati specifici.
Io personalmente sono alla ricerca di un percorso post-universitario (sono già laureato triennale) che mi permetta senza lasciare l'attuale lavoro di poter ottenere certificazioni informatiche specifiche atte a spingere così in futuro per ricoprire una posizione di Data Scientist.
Vediamo se riusciamo ad aprire un bel confronto di idee
 
Data Scientist e' una disciplina relativamente nuova, ci sono alcuni college americani che la insegnano nei corsi di Computer Science, ma almeno nei USA si usa come titolo professionale se si hanno sia conoscenze scientifiche (un Master o un PhD in una materia scientifica come per esempio biologia), conoscenze informatiche (si sa usare un computer in maniera fluente per analizzare dati usando applicazioni gia' esistenti) e/o conoscenze di programmazione relative alla analizi di dati. TANTI dati, infatti il grosso della disciplina e' rivolto a Machine Learning (che e' il mio campo) e Data Mining.
Questo e' quello che so, ma non vivendo in Italia non posso dirti se in Italia esistono simili percorsi didattici.
 
Ciao a tutti,
ho notato che cercando sul forum appaiono in maniera un pò sparsa e casuale queste due parole assieme "Data Scientist".
Di questi tempi "Data Scientist" è un po' una buzzword, tutti ne parlano, pochi sanno cosa sono e ancor meno lo sono veramente.
"Data Scientist" è colui che lavora con i dati, li pulisce e ne estrae informazioni mediante l'uso di svariate tecniche statistiche e matematiche che si traducono in algoritmi anche molto complessi. E' un lavoro che richiede passione e tempo, gran parte delle volte si fallisce o si raggiungono risultati scarsi, fintantochè eventualmente si ha successo.
Con questo post volevo cercare di raggruppare alcune informazioni che personalmente mi mancano e che magari mancano anche ad altri interessati del settore. Chiederei a chi già svolge questo lavoro che tipo di percorso di studi ha seguito, o ancora meglio se ha seguito qualche corso online o "fisico" che rilascia certificazioni o attestati specifici.
Io personalmente sono alla ricerca di un percorso post-universitario (sono già laureato triennale) che mi permetta senza lasciare l'attuale lavoro di poter ottenere certificazioni informatiche specifiche atte a spingere così in futuro per ricoprire una posizione di Data Scientist.
Vediamo se riusciamo ad aprire un bel confronto di idee
Non ci sono certificazioni "reali" per un data scientist, è bensì necessaria una forte predisposizione: solide basi matematico-statistiche, mente analitica ma anche un buon intuito. Ovviamente la programmazione è importante ma è solo uno dei tanti strumenti.
Io personalmente ho studiato data science alla magistrale di informatica, seguendo l'omonimo curriculum (insieme di esami professionalizzanti). A Padova c'è un corso magistrale attivo dall'anno scorso che focalizza ancor maggiormente sul tema.
Data Science poi è un argomento che ben si presta agli studi di dottorato o master di secondo livello (non corsi di qualche settimana) per cui puoi ben intuire quanto si possa approfondire ulteriormente.

Proprio qualche giorno fa ho visto questo, di una delle persone che seguo su linkedin (un data scientist di Facebook):
magari può esserti di ispirazione.
 
Grazie ad entrambi per le vostre risposte!
Devo doverosamente chiarire la mia posizione, così magari da focalizzarci meglio sul mio quesito e trovare una linea guida. Lavoro nel settore "Life Science", più precisamente per una multinazionale americana che vende strumentazione inerente allo studio del DNA, quindi ricerca e diagnostica. Sono un Biologo che ricopre il ruolo di assistenza tecnica e supporto scientifico. Da qui nasce il mio interesse per la gestione dei dati.
Tra tutte le competenze che potrebbe servire ad un data scientist quella della programmazione è sicuramente quella su cui sono più carente, ecco perchè mi chiedevo se qualcuno del forum conoscesse qualche certificatore online per acquisizione di skill specifiche in Data Science. Non mi servirebbe essere un vero e proprio programmatore a tutto tondo, ma avere quelle competenze necessarie per approcciarmi a questo mondo davvero interessante.

Vedo che avete citato Data Mining, Machine Learning e Software di analisi di dati; mi piacerebbe approfondire queste conoscenze con magari qualche corso, per caso conoscete qualche sito/ente/scuola di riferimento?
 
Grazie ad entrambi per le vostre risposte!
Devo doverosamente chiarire la mia posizione, così magari da focalizzarci meglio sul mio quesito e trovare una linea guida. Lavoro nel settore "Life Science", più precisamente per una multinazionale americana che vende strumentazione inerente allo studio del DNA, quindi ricerca e diagnostica. Sono un Biologo che ricopre il ruolo di assistenza tecnica e supporto scientifico. Da qui nasce il mio interesse per la gestione dei dati.
Tra tutte le competenze che potrebbe servire ad un data scientist quella della programmazione è sicuramente quella su cui sono più carente, ecco perchè mi chiedevo se qualcuno del forum conoscesse qualche certificatore online per acquisizione di skill specifiche in Data Science. Non mi servirebbe essere un vero e proprio programmatore a tutto tondo, ma avere quelle competenze necessarie per approcciarmi a questo mondo davvero interessante.
Forte! Immagino macchine per sequenziare il DNA...? Ho dato un paio di esami affini di bioinformatica (trattamento di DNA e proteomica) e mi sono piaciuti veramente molto (penso siano stati i voti più alti :asd: ) e pure la mia tesi magistrale era nel campo medico (machine learning su neuroimmagini). Effettivamente sono ambiti in cui la "scienza dei dati" sta prendendo piede anche se è ancora molto acerba... per quanto riguarda quello che potresti studiare, se un corso universitario "ufficiale" è da escludere, proverei con qualche MOOC introduttivo sulle piattaforme più comuni. Certificazioni vere e proprie non ci sono, gran parte della conoscenza va dimostrata con i fatti (apri un blog, metti in mostra qualche lavoro attinente...).
 
Io sono un fisico, di vecchia data, che inizio' a interessarsi alla programmazione perche' quando io ero all'universita' non c'erano molti pacchetti di librerie gia' pronte, occorreva "sporcarsi le mani" usando Fortran e C e scriversi i programmi da soli. Finii con il appassionarmi e adesso e' quello che faccio per lavoro.

Nel tuo caso, per avvicinarti al mondo della programmazione ti invito a iniziare con Python. E' un linguaggio con molte limitazioni, ma e' gratuito, lo trovi per ogni piattaforma, e' facilissimo da imparare e non ha bisogno di suite di programmazione. Scrivi un programmino facile in pochi minuti. Il suo grosso vantaggio, nel tuo caso, e' che c'e' gia' una bella mole di librerie gia' pronte che fanno un sacco di cose, incluso analisi matematica e visualizzazione dei risultati. In pratica usi Python come linguaggio "glue", ossia come una colla tra librerie gia' pronte, devi solo raggruppare i tuoi dati in modo da "darli in pasto" a una libreria matematica, e poi trovare una altra libreria per visualizzare i risultati ottenuti. Io lo uso sovente, per diverse applicazioni, proprio recentemente per qualcosa di simile a quello che ti ho descritto.
Puoi iniziare dal sito ufficiale Python e seguire molti dei tutorial che trovi in rete. La maggior parte della documentazione e' in inglese, ma non dovresti avere problemi (e' pur sempre un inglese molto specialistico con un vero ristretto vocabolario, non e' certo Shakespeare).
https://www.python.org/

Alcune librerie matematico scientifiche per python:
http://www.numpy.org/ (questo lo ho uso pesantemente)
https://www.scipy.org/
http://numba.pydata.org/

Per visualizzare dati uso matplotlib:
https://matplotlib.org/
 
Grazie ad entrambi! Constatato che per adesso non ci sono certificazioni ufficiali, direi che il percorso migliore è allenare / sviluppare conoscenze nell'ambito per poi applicarle appena possibile e dimostrare le proprie abilità.
Se ci fossero aggiornamenti sicuramente ci aggiorneremo!
 
Constatato che per adesso non ci sono certificazioni ufficiali

Magari qualcosa c'è ( vuoi che i soliti gatti e volpi non si siano già organizzati? ) ma lascia il tempo che trova. Data scientist del resto rimane una buzzword e il settore di per sè è ampissimo.

Sono d'accordo sulla necessità di acquisire competenze e dimostrare di saperne fare utile. Nello specifico ti posso dire che sul fronte algoritmico si va dalla statistica, all'analisi bayesiana fino alle tecniche di machine learning più o meno tradizionali ( algoritmi evolutivi, support vector machines, ma soprattutto reti neurali deep, il famoso deep learning ).

Lo strumento principale in quest'ambito è Python, dato che è facilissimo da apprendere ( siccome molti data scientist non sono di base degli informatici, questo punto è importante ) e ha un vastissimo ecosistema di librerie ( si va dalla presentazione ed elaborazione dei dati con Numpy, Scikit, Matplotlib, ecc... fino alle librerie per l'implementazione degli algoritmi, in particolare molto diffuso è Tensorflow per le reti neurali ).

Python non è l'unico ( ma sta al primo posto come diffusione ). R è un altro linguaggio molto usato nel settore e ovviamente c'è l'arcinoto Matlab. Esponenti molto minoritari sono Julia, Scala e F#.
 
Grazie per la risposta pabloski.
Per ora sto sviluppando consocenze di Python in attesa di vedere qualche certificazione ufficiale in modo da potersi muovere meglio in questi ambienti. Non è facile inserirsi in questo mondo soprattutto in Italia.
 
Pubblicità
Pubblicità
Indietro
Top