5 minute read

L’automazione cambia Data Science e visual analytics

TIBCO Software spiega come ottenere insight eseguibili, che abbiano un impatto sui processi di business, con AutoML di Gaetano Di Blasio

Un obiettivo fondamentale per i visual analytics e la data science è quello di identificare insight eseguibili, i cosiddetti “actionable” che abbiano un impatto sui processi di business con lo scopo di aumentare il fatturato, migliorare la produttività o mitigare i rischi. «L’intelligenza artificiale automatizzata o il machine learning automatizzato specificamente per la data science possono aiutare a raggiungere questo obiettivo - afferma Michael O’Connell, Chief Analytics Officer di TIBCO Software – che aggiunge - AutoML può aumentare in modo notevole la produttività dei data scientist automatizzando i compiti più banali e consentendo di dedicare maggior tempo all’innovazione». AutoML with transparency, spiega ancora il manager può anche guidare e formare gli utenti su come ottenere il massimo dai loro dati e dall’ambiente di data science, implementando nel contempo best practice. «Il ruolo e la funzione dei data scientist sono in crescita: essi hanno accentrato tutto quello che serve per portare a termine il loro compito». Un compito che può comprendere il progetto e il deployment di sistemi end-to-end per testare i modelli e per inferenza. Questo per job batch che girano lanciati con un clock o un trigger e per elaborazione di eventi in tempo reale. «Tali sistemi end-to-end comprendono tipicamente accesso e federazione di dati, strategie di caching, feature engineering, machine learning e model ops, che può comprendere la “containerizzazione” di modelli, l’aggiunta di interfacce RESTful e il deployment in sistemi operazionali, in ambienti ibridi e qualche volta multi-cloud», ci spiega ancora O’Connell. I data scientist vogliono diventare più produttivi. Per questo, afferma il manager di Tibco «AutoML li aiuta assistendo gli analisti nella preparazione dei dati, la pulizia degli stessi, la feature selection, feature engineering e modellazione, con explainability». L’assistenza digitale di AutoML, continua il manager, è in fase di estensione alle piattaforme di data science che scalano attraverso ambienti cloud ibridi con deployment in architetture basate su eventi. Idealmente, i sistemi AutoML dovrebbero generare flussi automatici che sono modificabili e informativi in merito al funzionamento del software. Questo dovrebbe includere il far emergere i passi o i nodi del workflow e come essi vengono creati e configurati per l’analisi. «I flussi generati dovrebbero, e possono, rappresentare un’esperienza educativa per il data scientist su come utilizzare il software in modo ottimale. Un sistema AutoML è anche un modo per implementare best practice, sia per il data scientist esperto e professionale, sia per il praticante con meno esperienza. Così, quando l’utente si muove attraverso una pipeline di data science, l’ambiente aiuta a collegare, pulire e preparare i dati, oltre a ingegnerizzare caratteristiche per la costruzione di modelli. Inoltre, il sistema dovrebbe idealmente offrire una guida su questioni come i set di validazione di blocco (hold-out), combinazioni di caratteristiche e modelli e possibilità di spiegazione (explainability) dei modelli» sostiene il Chief Analytics Officer di Tibco.

Advertisement

Questi mette le mani avanti: «Non stiamo affermando che l’obiettivo sia la completa automazione di tutto nell’ambito della data science, com’è stato sostenuto da altri. Il goal non è quello di realizzare un ambiente di automazione totale in cui la pressione di un grande pulsante rosso significhi ‘lavoro concluso’. Piuttosto, l’obiettivo è quello di formare l’utente come assistente digitale, automatizzare i compiti di più basso livello, educarlo e implementare buone pratiche scientifiche». Il manager continua, sostenendo che il software AutoML ideale aiuta gli analisti di business, i data scientist e gli sviluppatori attraverso la rimozione della complessità e l’accelerazione del deployment in ambienti reali di produzione. Queste capacità, sottolinea il manager, stanno cominciando a spostare il focus di business analyst, data scientist, sviluppatori e business executive sulla soluzione dei problemi attuali con le migliori soluzioni disponibili. Automatizzare i compiti di basso livello consente di disporre di maggior tempo per lo sviluppo di approcci innovativi alla crescita del fatturato, alla riduzione del rischio e alla cancellazione dei costi inutili.

AI automatizzata per tutti Il gran numero di figure coinvolte rende difficile semplificare i processi e organizzare i differenti workflow. Qui sussiste, quindi, la possibilità di migliorare la produttività, grazie alla generazione automatica di questi differenti workflow per compiti quali la preparazione dei dati, la feature engineering, feature selection e modellazione. «L’automazione dei processi dalla preparazione alla sintonizzazione del modello produce workflow trasparenti

Michael O’Connell, Chief Analytics Officer di TIBCO Software

e modificabili che possono diventare più velocemente versioni pronte per la produzione in sistemi operazionali», dice l’esperto, continuando: «Quando un data scientist crea un modello predittivo, sviluppare i numerosi diversi workflow richiesti può rivelarsi un lavoro impegnativo. Quando, invece, sono generati automaticamente, ci possono essere importanti vantaggi in termini di tempo, modelli più accurati e best practice applicate su tutto». La preparazione automatica dei dati e il machine learning possono creare notevoli incrementi nella produttività per gli analisti di business e i data scientist. Automatizzando differenti stadi del workflow dai business analyst ai data scientist alla produzione, si creano modelli che si sintonizzano e si implementano come ambienti cloud nativi di produzione. Per indirizzare questioni più complesse, il deployment e il collegamento a feed di dati dei modelli di machine learning stanno diventando più semplici, per supportare decisioni più veloci e più smart in tempo reale. Non si tratta di creare una scatola neraqualsiasi sia l’obiettivo e l’ambito applicativo. «Un’area di valore fondamentale nella data science è legata alla realizzazione di previsioni accurate in ambienti operativi reali. Così come le linee produttive fisiche automatizzate hanno creato la moderna era industriale, si pensi ai robot utilizzati per costruire autovetture», L’automazione della data science sta inaugurando l’era industriale digitale attraverso la possibilità di applicare le analytics rapidamente a diversi domini da parte di esperti che non sono più costretti a svolgere attività di basso livello. Attraverso l’automazione, la data science può svilupparsi più rapidamente per risolvere problemi del mondo reale, offrendo nel contempo a tutti benefici misurabili lungo tutta la catena del valore. v

POTETE LAVORARE, MA A DISTANZA Lo smart Working ha permesso a molte imprese di non bloccarsi completamente. Continuare a usarlo può accelerare e favorire la ripresa, come spiegano gli esperti che abbiamo intervistato

POTETE LAVORARE, MA A DISTANZA Lo smart Working ha permesso a molte imprese di non bloccarsi completamente. Continuare a usarlo può accelerare e favorire la ripresa, come spiegano gli esperti che abbiamo intervistato

This article is from: