09 June DATA ANALYTICS CON APACHE SPARK: ripartono i corsi per sviluppatori di Murate Idea Park

Murate Idea Park non si ferma! Ripartono, infatti, a luglio i corsi per sviluppatori targati MIP, per i quali sono disponibili anche borse di studio per under 35.

Il prossimo corso in partenza è DATA ANALYTICS CON APACHE SPARK.

Il corso si colloca nello scenario operativo per applicazioni e casi d’uso che lavorano sui Big Data. Apache Spark è un framework open-source per l’analisi  di grandi quantità di dati su cluster e per il calcolo  distribuito in memory che nasce da risultati di ricerca dei laboratori della University of California Berkeley, oggi rilasciato e mantenuto dall’ Apache Software Foundation.

L’attività formativa ha lo scopo di illustrare e far comprendere come funziona Spark internamente: i meccanismi, le logiche, l’utilizzo su cluster e lo sviluppo mediante APIs.

Apache Spark gioca un ruolo importante nelle  moderne applicazione che hanno necessità di lavorare su grandi quantità di dati.

Infatti grazie alle sue prestazioni (flessibilità, modularità e  integrazioni con altre tecnologie dell’ecosistema tecnologico) rappresenta, oggi, una delle tecnologie più innovative in ambito Big Data ed è usata dalle più  importanti aziende del panorama IT.

Apache Spark trova sempre più spazio all'interno di  aziende di piccole e grandi dimensioni in svariati settori: delle analisi predittive, all'internet delle cose, passando per i sistemi di recommendation ed analisi di logs per la definizione di sistemi predittivi e descrittivi.

Big tech powerhouses companies come, Yahoo, eBay e Netflix utilizzano Spark su vasta scala, elaborando diversi petabyte di dati su cluster di oltre 8.000 nodi.

Netflix, ad esempio, usa Spark come framework distribuito su cui basa uno dei più sofisticati e performanti  algoritmi per generare, in tempo reale, consigli  personalizzati.

 

E’ facilmente utilizzabile nei linguaggi di programmazione Java, Scala e Python, e prevede anche un’integrazione  con il linguaggio statistico R.

La sua facilità d’uso ed il modello di astrazione dal calcolo distribuito su cluster ed "in memory" lo rende accessibile  ad un vasto pubblico di sviluppatori, data engineer e data  scientist.

 

Il corso è pensato per sviluppatori o per chi si approccia alla figure legate allo sviluppo software nel settore del trattamento dei dati. Sarebbe gradita una pregressa conoscenza di un linguaggio di programmazione ad alto livello . Gli esempi di Apache Spark e gli esercizi pratici sono proposti in Java e Scala con qualche esempio in Python, quindi sarebbe auspicabile saper programmare in uno di questi linguaggi. Possedere conoscenze di base di SQL è un plus, mentre non è imprescindibile avere conoscenze precedenti di Apache Hadoop.

 

Per il corso sono previste borse di studio per inoccupati, studenti ed under 35.

Candidati qui: https://docs.google.com/forms/d/e/1FAIpQLSebMyMLQ-SE8tPQ92Cs37Ys1Kkk4pNS51QzRIRa21yBtfpPKw/viewform?fbclid=IwAR0dXJVA0AYl11Ixgg__PJ3TXMmNPk8sZyn0fyUVLS2vN8ONqQcNSMqVaFc