Chi ha paura del dato cattivo?

di Roberto Carnazza

Laureato in Scienze della Comunicazione all’Università di Bologna, comincia subito la sua carriera lavorativa sul web, nella neonata Yahoo! Italia. Passa poi da Universal Interactive e Profero, per giungere nel 2006 in Starcom Italia, dove ha ricoperto la carica di Digital Director per più di 4 anni. Nel 2010 ha intrapreso una nuova “sfida”, lanciando sul mercato italiano le attività di Weborama, oggi leader europeo nella Data Science con un retaggio storico profondamente ancorato alla tecnologia per la gestione delle attività di marketing online.

Dati di prima e dati di terza parte. Come e cosa scegliere

Si sente spesso dire “i dati di terza parte non funzionano”.

Peggio, relatori di livello lo raccontano a vaste platee, senza specificare altro, quasi sempre paragonandoli a generici dati di prima parte che funzionano meglio.

Ma in che contesto? In che ambito i dati di prima parte sarebbero meglio di quelli di terza?

I dati sono uno strumento di business intelligence con molte applicazioni (ottimizzare contenuti e creatività, targetizzare campagne, arricchire data base), ma nella maggior parte dei casi si usano solo in ambito media per guidare le campagne.

Ecco che funzionare meglio sarà riferito al conversion rate o al CTR.

Ha senso comparare dati di prima e terza parte in questi termini?
È ovvio che i dati di prima daranno risultati migliori.

La spiegazione è nella definizione di dati di prima parte: dati che appartengono al marketer. Di CRM, di navigazione, di campagna. In breve utenti che hanno interagito col brand o ne sono clienti.
È chiaro che chi ha già mostrato interesse per la marca sarà propenso a interagire o ad acquistare ancora.
Si tratta di azioni di retargeting, a metà strada tra pubblicità e CRM.

La maggior efficacia del dato di prima parte dipende dal fatto che metà del lavoro pubblicitario è già fatto (utente/cliente acquisito).
È improprio parlare di uso pubblicitario dei dati di prima, per lo più attivati in retargeting, approccio lontano dagli obiettivi della pubblicità classica.
Altro è lavorare su utenti ancora sconosciuti, raccogliendo informazioni da fonti terze per guidare la comunicazione.
Ecco i dati di terza parte, con cui gli utenti sono profilati dal punto di vista comportamentale e sociodemo.

In sostanza, per retargeting e CRM la scelta migliore sono i dati di prima parte; per prospecting e recruiting sarà necessario affidarsi ai dati di terza parte, suddivisi a loro volta in due grandi categorie:

  • Deterministici: derivanti da una specifica azione o da auto-dichiarazione come ricerche su classified, transazioni o rilascio di anagrafiche; dati puntuali cui non serve elaborazione se non ex post.
  • Probabilistici: basati sull’aggregazione di vari data-point per dedurre un interesse o una caratteristica.

In logica di efficienza di campagna i deterministici portano spesso performance migliori, ma i probabilistici (più economici da raccogliere) aggiungono valore quanto ad arricchimento ed estensione dell’audience permettendo di individuare i look-alike.
Semplificando: per colpire utenti simili ai converter, si dovranno individuare (altre) caratteristiche comuni a questi ultimi.

Ciò potrebbe essere fatto usando solo dati di prima parte ma limitando il campo d’azione ad utenti già noti, dando vita ad azioni di CRM con obiettivi di cross/up-sell.
Per lavorare in ottica di prospecting, invece, meglio affidarsi ai dati di terza.
Quelli deterministici possono essere molto funzionali, ma presentano problemi di scarsità e/o di significatività.
Usando dati demografici è possibile costruire audience ampie ma non necessariamente rilevanti: sapendo che gli utenti del servizio X sono per lo più donne, si indirizzerà la campagna a tutte le donne, ma non è detto che la maggioranza di esse sia interessata.
Con i dati d’acquisto invece si ottengono audience rilevanti ma molto piccole.
Ad esempio “se chi compra X ha acquistato anche Y, si comunicherà X a tutti gli acquirenti di Y”.
I dati probabilistici, grazie alla loro abbondanza e alla loro granularità, permettono, invece, di costruire modelli strutturati e scalabili applicabili a grandi DB di terze parti e consentono di individuare prospect reattivi.

Concludendo:

Dati di prima parte
Pro: deterministici, riferiti a chi ha già interagito col brand
Contro: numericamente scarsi, limitati agli utenti e ai clienti noti
Uso: retargeting, azioni di CRM, up/cross-sell
Dati di terza parte deterministici
Pro: collegati ad azioni forti o al rilascio di dati personali
Contro: numericamente (acquisti, registrazioni), o molto generici (dichiarativi socio/demo dichiarati)
Uso: direct e customer insight
Dati di terza parte probabilistici
Pro: abbondanti, granulari, ottimi per la modellizzazione
Contro: interessi generici, meno efficaci dei deterministici per le azioni direct
Uso: prospecting, modellizzazione, look-alike, audience extension

Per non cadere in pericolose generalizzazioni è bene capire subito quali siano gli scopi per cui si vogliono utilizzare i dati e settare le aspettative di conseguenza.