Contattaci: +39.0266043166 - Questo indirizzo email è protetto dagli spambots. È necessario abilitare JavaScript per vederlo. | Info Commerciali: 800.180.700
      Info Commerciali:  800.180.700 | Email: Questo indirizzo email è protetto dagli spambots. È necessario abilitare JavaScript per vederlo.
      Aggiornati insieme a noi
      Slider
      Big data: che cosa sono

      Big data: che cosa sono

      Lunedì, 11 Novembre 2019 16:22
      I big data (o megadati) cambieranno il modo di fare business. Il massiccio flusso di dati che viaggia in rete cambierà i processi di raccolta e gestione delle informazioni, farà emergere inoltre nuove tecnologie e nuove figure professionali. 

      I megadati rappresentano oggi uno degli strumenti chiave delle strategie di marketing e delle analisi di mercato. I big data infatti prevedono la condivisione mirata delle informazioni con applicativi software e sistemi di comunicazione specifici.

      I big data sono spesso caratterizzati dall'ampio volume di dati in molti ambienti, l'ampia varietà di tipi di dati memorizzati nei sistemi di big data e la velocità con cui i dati vengono generati, raccolti ed elaborati. Caratteristiche identificate da Doug Laney,  analista di Meta Group Inc., in uno studio del 2001. Recentemente, diverse altre caratteristiche sono state aggiunte nella definizione dei big data, tra cui: veridicità, valore e variabilità.

      Il peso dei big data nel business

      Le aziende utilizzano i big data accumulati nei loro sistemi per migliorare le operazioni, fornire un migliore servizio clienti, creare campagne di marketing personalizzate basate su specifiche preferenze dei clienti e, in definitiva, aumentare la redditività. Le aziende che utilizzano i big data detengono un potenziale vantaggio competitivo rispetto a quelle che non lo sono poiché sono in grado di prendere decisioni aziendali più rapide e informate, a condizione che utilizzino i dati in modo efficace.

      Ad esempio, i big data possono fornire alle aziende informazioni preziose sui propri clienti che possono essere utilizzate per perfezionare campagne e tecniche di marketing al fine di aumentare il coinvolgimento dei clienti e i tassi di conversione.
      L'analisi dei big data consente alle società di diventare sempre più incentrate sul cliente. I dati storici e in tempo reale possono essere utilizzati per valutare le preferenze in evoluzione dei consumatori, consentendo di conseguenza alle aziende di aggiornare e migliorare le proprie strategie di marketing e diventare più sensibili ai desideri e alle esigenze dei clienti. I big data vengono anche utilizzati dai ricercatori medici per identificare i fattori di rischio di malattia e dai medici per diagnosticare malattie e condizioni nei singoli pazienti. 

      Alcuni esempi 

      I big data provengono da una miriade di diverse fonti, come sistemi di transazioni commerciali, database dei clienti, cartelle cliniche, registri clickstream di Internet, applicazioni mobili, social network, repository di ricerca scientifica, dati generati dalle macchine e sensori di dati in tempo reale utilizzati ambienti IoT. I dati possono essere lasciati nella loro forma grezza in sistemi di big data o preelaborati utilizzando strumenti di data mining o software di preparazione dei dati, quindi sono pronti per usi analitici particolari.

      Diversi metodi di analisi dei big data:
      • Analisi comparativa: l'esame delle metriche sul comportamento degli utenti e l'osservazione del coinvolgimento dei clienti in tempo reale al fine di confrontare i prodotti, i servizi e l'autorità del marchio di un'azienda con quelli della concorrenza.
      • Audit dei social media: informazioni su ciò che le persone dicono sui social media su un'azienda o un prodotto specifico che va oltre ciò che può essere consegnato in un sondaggio o sondaggio. Questi dati possono essere utilizzati per aiutare a identificare il pubblico target per le campagne di marketing osservando l'attività che circonda argomenti specifici attraverso varie fonti.
      • Analisi di marketing: include le informazioni che possono essere utilizzate per rendere la promozione di nuovi prodotti, servizi e iniziative più informati e innovativi.
      • Soddisfazione dei clienti: rivelano come si sentono i clienti nei confronti di un'azienda o di un marchio, in caso di potenziali problemi, in che modo preservare la fedeltà al marchio e in che modo migliorare gli sforzi del servizio clienti.

      Varietà di dati

      • dati strutturati in database e data warehouse basati su SQL
      • dati non strutturati, come file di testo e di documenti contenuti in cluster Hadoop o sistemi di database NoSQL
      • dati semistrutturati, come i registri del web server o lo streaming dei dati dai sensori
      Tutti i vari tipi di dati possono essere archiviati insieme in un data lake, che in genere si basa su Hadoop o un servizio di archiviazione di oggetti cloud. Inoltre, le applicazioni per big data spesso includono più origini dati che altrimenti non potrebbero essere integrate. Ad esempio, un progetto di analisi dei big data potrebbe tentare di valutare il successo di un prodotto e le vendite future correlando i dati di vendita passati, i dati di restituzione e i dati di revisione dell'acquirente online per quel prodotto.

      La velocità si riferisce alla velocità con cui vengono generati i big data e devono essere elaborati e analizzati. In molti casi, i set di big data vengono aggiornati in tempo reale o quasi in tempo reale, anziché gli aggiornamenti giornalieri, settimanali o mensili effettuati in molti data warehouse tradizionali. Le applicazioni di analisi dei big data importano, correlano e analizzano i dati in arrivo e quindi rendono una risposta o un risultato basato su una query generale. Ciò significa che i data scientist e altri analisti di dati devono avere una comprensione dettagliata dei dati disponibili e possedere un senso delle risposte che stanno cercando per assicurarsi che le informazioni che ottengono siano valide e aggiornate.

      La gestione della velocità dei dati è anche importante in quanto l'analisi dei big data si espande in campi come l'apprendimento automatico e l'intelligenza artificiale (AI), in cui i processi analitici trovano automaticamente modelli nei dati raccolti e li utilizzano per generare approfondimenti.

      Come vengono archiviati ed elaborati i big data - 
      La necessità di gestire la velocità dei big data impone requisiti unici per l'infrastruttura di calcolo sottostante. La potenza di elaborazione richiesta per elaborare rapidamente enormi volumi e varietà di dati può sopraffare un singolo server o cluster di server. Le organizzazioni devono applicare un'adeguata capacità di elaborazione alle attività relative ai big data al fine di raggiungere la velocità richiesta. Ciò può potenzialmente richiedere centinaia o migliaia di server in grado di distribuire il lavoro di elaborazione e operare in collaborazione in un'architettura cluster, spesso basata su tecnologie come Hadoop e Apache Spark.

      Per migliorare ulteriormente i livelli di servizio, i provider di cloud pubblici offrono funzionalità di big data tramite servizi gestiti che includono:
      • Amazon EMR 
      • Microsoft Azure HDInsight
      • Google Cloud Dataproc

      Negli ambienti cloud, i big data possono essere archiviati come:
      • Hadoop Distributed File System (HDFS)
      • archiviazione di oggetti cloud a basso costo, come Amazon Simple Storage Service (S3)
      • Database NoSQL
      • database relazionali
      Per le organizzazioni che desiderano implementare sistemi di big data locali, oltre alle tecnologie open source Apache di uso comune oltre a Hadoop e Spark includono:
      • YARN: gestore delle risorse e lo scheduler di lavoro integrati di Hadoop, che sta per Yet Another Resource Negotiator ma è comunemente noto solo con l'acronimo
      • framework di programmazione MapReduce, anch'esso un componente chiave di Hadoop
      • Kafka, una piattaforma di messaggistica e streaming di dati da applicazione a applicazione
      • il database HBase
      • Motori di query SQL-on-Hadoop, come Drill, Hive
      Indirizzi e contatti

      Via Zucchi, 39/C 20095 - Cusano Milanino (MI)
      Ingresso Via Zucchi 39 G - Int. 3
      tel: (+39) 0266043166 - fax: (+39) 0266048942
      e-mail: Questo indirizzo email è protetto dagli spambots. È necessario abilitare JavaScript per vederlo.

      SOTEHA S.r.l. Socio Unico
      Sede legale: Via Ticino, 6
      20095 Cusano Milanino (MI)
      CCIAA / R.E.A. Milano 1617965
      Capitale sociale € 20.000,00
      P.IVA 02967250966 C.F. 02095410649

      Partner
      ZUCCHI39 LOFT TECHNOLOGY
      sicurezza.net