Case Study
CalcioMercato.com

Machine Learning e moderazione intelligente

gisdata logo
Il Cliente

CALCIOMERCATO.COM nasce nel 1996 da una idea di Carlo Pallavicino, procuratore sportivo tra i più affermati e altri agenti e giornalisti calcistici, come sito professionale interamente dedicato al calcio.

Il sito è da 15 anni il punto di riferimento per tutti gli appassionati di calcio e i professionisti del settore, grazie alle sue riconosciute qualità di:

  • Tempestività e immediatezza: sito aggiornato incessantemente, con avvenimenti seguiti in tempo reale con circa 150 lanci quotidiani
  • Completezza: campionati italiani e calcio internazionale
  • Semplicità e obiettività: sempre dritto al punto, pochi commenti separati dai fatti
  • Esclusive e anticipazioni: perché è informazione fatta da chi vive il mondo del calcio tutti i giorni e in prima persona, avvalendosi del contributo di una redazione preparata e di attenti corrispondenti.

Capitoli di lavorazione
  • ETL (Extract Transform Load)
  • Data Wrangling
  • Machine Learning
  • Data Lake
  • Artificial Intelligence
  • Managed Services
Vantaggi ottenuti
  • Cost-Savings
  • Ottimizzazione dell'apprendimento
  • Maggiore precisione nel training
  • Pay-per-use
  • Pay-per-train
Servizio Corley di riferimento:

Machine Learning su AWS
dettagli

Progetto ed esigenze

Calciomercato.com offre ai propri utenti la possibilità di commentare le ultime notizie calcistiche in modo da rinforzare la community e permettere a tutti di seguire e discutere i temi della propria squadra del cuore nel modo più coinvolgente. Per garantire a tutti la possibilità di partecipare Calciomercato.com attua un processso di moderazione dei commenti per escludere dalla comunità i contenuti che non rispettano le linee guida e di moderazione permettendo in questo modo una "sana" partecipazione nel processo di condivisione.

Questo processo di moderazione manuale costringe un numeroso gruppo di persone ad essere sempre attivo e presente, per permettere l'approvazione di un commento in una finestra di massimo 10 minuti.

Servizio svolto

Grazie a AWS SageMaker (Machine Learning) e ai dati collezionati nel corso di più di 10 anni di storia del portale calciomercato.com, Corley ha potuto addestrate un modello specificatamente disegnato per l'analisi testuale (NLTK - Natural Language Toolkit), riuscendo in questo modo a automatizzare il processo di validazione commenti con un processo automatico. Il meccanismo di addestramento è stato eseguito su una grande mole di commenti, facendo parti di fatto dello storico di CalcioMercato.com, quantificabili in alcuni milioni di entry.

Grazie alla tecnologia gestita di AWS SageMaker è stato possibile avvantaggiarsi di un'insieme di strutture fondanti e algoritmi di MachineLearning altamente ottimizzati per: catalogazione, analisi sentimentale e gestione dei contenuti testuali in arrivo dagli utenti che interagiscono sulla piattaforma.

In aggiunta, la piattaforma AWS SageMaker, permette, oltre alla costruzione del modello di intelligenza artificiale, anche la ricerca di molteplici ottimizzazioni degli algoritmi tramite l'utilizzo del sistema Hyperparameters Tuning Job. Nello specifico questa tecnologia permette l'esecuzione parallela delle fasi training con diversi parametri di configurazione, con l'obiettivo di ricercare la migliore soluzione possibile riducendo enormemente i tempi di sviluppo e di ottimizzazione della rete ad apprendimento.

A questo comportamento possiamo sommare il modello di pagamento a consumo, ovvero le fase di training cubano solo il costo relativo alle risorse utilzzate per la ricerca della soluzione, permettendo in questo modo un cost-saving importante unito ad una gestione ottima dell'infrastruttura.

L'utilizzo dei servizi della famiglia AWS SageMaker ha dato un importante boost alle attività di training e al perfezionamento costante del processo di machine learning, mantenendo i costi operativi entro limiti prestabiliti e al tempo stesso iniettando un grande valore di innovazione all'interno di CalcioMercato.com.

Benefici ottenuti

Grazie all'introduzione di questo meccanismo di Machine Learning, il portale di CalcioMercato ha visto una importante metamorfosi nella gestione dei commenti. Sfruttando l'algoritmo automatico di validazione, è stato possibile gestire molti più commenti in pochissimo tempo e con bassissimi margini di errori. Ciò ha avuto un impatto a diversi livelli:

  • i tempi di approvazione dei commenti si è ridotto da parecchi minuti (validazione umana) a pochi secondi (validazione automatica)
  • di conseguenza l'interazione tra i visitatori e il portale è decisamente automentata, potendo godere di un meccanismo di commenti rapido e regolamentato
  • i moderatori hanno potuto ridurre l'impegno personale nella validazione manuale dei commenti, potendo così concentrare i proprio sforzi su altre attiità editoriali importanti

Il caso di studio è stato riportato da diverse testate editoriali, tra cui Engage, YouMark e il Podcast AWS.


Abbiamo intrapreso un percorso di Machine Learning con Corley. Non ci aspettavamo che in così poche settimane arrivsassimo a questi risultati.

Denis Casanuova, CTO CalcioMercato.com