Oracle ha annunciato che Oracle MySQL HeatWave ora supporta l'apprendimento automatico (ML) all'interno del database oltre all'elaborazione delle transazioni e all'analisi precedentemente disponibili—l'unico servizio di database cloud MySQL a farlo. MySQL HeatWave ML automatizza completamente il ciclo di vita del ML e memorizza tutti i modelli addestrati all'interno del database MySQL, eliminando la necessità di spostare i dati o il modello in uno strumento o servizio di apprendimento automatico. L'eliminazione dell'ETL riduce la complessità dell'applicazione, abbassa i costi e migliora la sicurezza sia dei dati che del modello. HeatWave ML è incluso nel servizio cloud MySQL HeatWave database in tutte le 37 regioni di Oracle Cloud Infrastructure (OCI). Fino ad ora, aggiungere capacità di apprendimento automatico alle applicazioni MySQL è stato proibitivo e ha richiesto molto tempo per molti sviluppatori. Innanzitutto, c'è il processo di estrazione dei dati dal database e in un altro sistema per creare e distribuire modelli ML. Questo approccio crea silos multipli per l'applicazione dell'apprendimento automatico ai dati delle applicazioni e introduce latenza mentre i dati si spostano. Inoltre porta alla proliferazione dei dati fuori dal database, rendendoli più vulnerabili alle minacce alla sicurezza, e aggiunge complessità per gli sviluppatori di programmare in più ambienti. Secondo, i servizi esistenti si aspettano che gli sviluppatori siano esperti nel guidare il processo di addestramento del modello ML; altrimenti il modello è sub-ottimale, il che degrada la precisione delle previsioni. Infine, la maggior parte delle soluzioni ML esistenti non include funzionalità per fornire spiegazioni sul perché i modelli che gli sviluppatori costruiscono forniscono previsioni specifiche. MySQL HeatWave ML risolve questi problemi integrando nativamente le capacità di apprendimento automatico all'interno del database MySQL, eliminando la necessità di ETL dei dati in un altro servizio. HeatWave ML automatizza completamente il processo di addestramento e crea un modello con il miglior algoritmo, le caratteristiche ottimali e gli iper-parametri ottimali per un dato set di dati e un compito specifico. Tutti i modelli generati da HeatWave ML possono fornire spiegazioni sul modello e sulla predizione. HeatWave ML offre le capacità rispetto ad altri servizi di database cloud: Addestramento dei modelli completamente automatizzato: Tutte le diverse fasi della creazione di un modello con HeatWave ML sono completamente automatizzate e non richiedono alcun intervento da parte degli sviluppatori. Questo si traduce in un modello sintonizzato che è più accurato, non richiede lavoro manuale e il processo di addestramento è sempre completato. Altri servizi di database cloud come Amazon Redshift forniscono integrazione con capacità di apprendimento automatico in servizi esterni, che richiedono ampi input manuali da parte degli sviluppatori durante il processo di addestramento ML. Spiegazioni del modello e dell'inferenza: La spiegabilità del modello aiuta gli sviluppatori a capire il comportamento di un modello di apprendimento automatico. Per esempio, se una banca nega un prestito ad un cliente, la banca deve poter determinare quali parametri del modello sono stati presi in considerazione o se il modello contiene qualche bias. La spiegabilità delle predizioni è un insieme di tecniche che aiutano a rispondere alla domanda del perché un modello di apprendimento automatico ha fatto una specifica predizione. La spiegabilità delle predizioni sta diventando sempre più importante al giorno d'oggi, poiché le aziende devono essere in grado di spiegare le decisioni prese dai loro modelli di apprendimento automatico. HeatWave ML integra sia la spiegazione del modello che le spiegazioni di predizione come parte del suo processo di formazione dei modelli. Di conseguenza, tutti i modelli creati da HeatWave ML possono offrire spiegazioni del modello e dell'inferenza senza bisogno di dati di allenamento al momento della spiegazione dell'inferenza. Oracle ha aumentato le tecniche di spiegazione esistenti per migliorare la performance, l'interpretabilità e la qualità. Altri servizi di database cloud non offrono una spiegabilità così ricca per tutti i loro modelli di apprendimento automatico. Sintonizzazione degli iperparametri: HeatWave ML implementa un nuovo algoritmo di riduzione basato sulla ricerca del gradiente per la sintonizzazione degli iperparametri. Questo permette di eseguire la ricerca di iperparametri in parallelo senza compromettere l'accuratezza del modello. La sintonizzazione degli iperparametri è la fase più dispendiosa in termini di tempo dell'addestramento dei modelli ML e questa capacità unica fornisce a HeatWave ML un vantaggio significativo in termini di prestazioni rispetto ad altri servizi cloud per la costruzione di modelli di apprendimento automatico. Selezione dell'algoritmo: HeatWave ML usa la nozione di modelli proxy—che sono modelli semplici che esibiscono le proprietà di un modello complesso completo—per determinare il miglior algoritmo ML per l'addestramento. Usando un modello proxy semplice, la selezione dell'algoritmo viene fatta in modo molto efficiente senza perdita di precisione. Nessun altro servizio di database per costruire modelli di apprendimento automatico ha questa capacità di modellazione proxy. Campionamento intelligente dei dati: Durante l'addestramento del modello, HeatWave ML campiona una piccola percentuale dei dati per migliorare le prestazioni. Questo campionamento viene fatto in modo tale che tutti i punti dati rappresentativi siano catturati nel set di dati campione. Altri servizi cloud per la costruzione di modelli di apprendimento automatico adottano un approccio meno efficiente—utilizzando il campionamento casuale dei dati—che campiona una piccola percentuale di dati senza considerare le caratteristiche della distribuzione dei dati. Selezione delle caratteristiche: La selezione delle caratteristiche aiuta a determinare gli attributi dei dati di allenamento che influenzano il comportamento del modello di apprendimento automatico per fare previsioni. Le tecniche di HeatWave ML per la selezione delle caratteristiche sono state addestrate su un'ampia gamma di serie di dati in diversi domini e applicazioni. Da queste statistiche e meta informazioni raccolte, HeatWave ML è in grado di identificare in modo efficiente le caratteristiche rilevanti in un nuovo set di dati. Oltre alle capacità di apprendimento automatico, Oracle ha rilasciato altre innovazioni al servizio MySQL HeatWave. L'elasticità in tempo reale permette ai clienti di aumentare e diminuire il loro cluster HeatWave a qualsiasi numero di nodi, senza tempi morti o di sola lettura e senza bisogno di riequilibrare manualmente il cluster. È inclusa anche la compressione dei dati, che permette ai clienti di elaborare il doppio della quantità di dati per nodo e abbassa i costi di quasi il 50 per cento, mantenendo lo stesso rapporto prezzo-prestazioni. Infine, una nuova funzione pause-and-resume permette ai clienti di mettere in pausa HeatWave per risparmiare sui costi. Alla ripresa, sia i dati che le statistiche necessarie per MySQL Autopilot vengono automaticamente ricaricati in HeatWave.