In chiusura del nostro percorso nei dati di oggi, raccontiamo il quasi sconosciuto Project Origin voluto dalla World Federation of Advertisers e dalle piattaforme per misurare tutti i consumi video.
Questo articolo è apparso per la prima volta su LINK Numero 28 - Metrix. Viaggio all’ultima frontiera delle metriche del 24 marzo 2022
Quando si parla della rete si fa spesso riferimento al mare aperto. Sarebbe come muoversi in un altro elemento dove valgono altre leggi. Le similitudini arrancano per tenere dietro a un medium che ha ridefinito i confini della nostra vita. Il modo in cui comunichiamo online, ci intratteniamo, ci relazioniamo, facciamo acquisti ha di volta in volta messo in crisi qualsiasi sistema che regolava la vita personale e quella civile. Nuove parole, nuove possibilità, nuove malattie, nuovi crimini, nuove concezioni dell’identità individuale e collettiva. Evoluzione da un lato, involuzione dall’altro. Caos, spesso. La metafora del mare aperto regge fino a un certo punto, la vita in mare è pur sempre regolata da leggi antiche e codici aggiornati. Con internet non si sa mai come fare. È sregolato, smisurato, in piena plenitudine digitale. Alla sua nascita si è scelto di non regolarlo, oggi da più parti se ne invoca l’uscita dall’autogestione. Insomma, il liceo è finito.
Qui vogliamo ragionare su qualcosa di apparentemente più piccolo, la misurazione dei comportamenti degli utenti online (e non). Attualmente non esistono metriche condivise e certificate che misurino quello che facciamo sulle piattaforme. Sono definite di volta in volta dai singoli soggetti – i proprietari delle piattaforme – e applicate ai loro dati. Questo significa che è Google a definire cos’è una visualizzazione su YouTube, ed è sempre Google che misura le performance di una campagna pubblicitaria sulle sue proprietà. Non c’è nessun ente esterno che verifichi la bontà e la verità di quel dato. Insomma, l’investitore pubblicitario dovrà accontentarsi della parola di Google – e fino a ora, a giudicare dagli investimenti, pare sia bastata. Ma con l’aumentare delle campagne digital gli investitori sentono sempre di più l’esigenza di avere dati condivisi e confrontabili. Lamentano, tra le altre cose, la mancanza di trasparenza del sistema e da più parti emergono dubbi sulla veridicità dei numeri e il sospetto che siano figli di un sistema influenzato dalla frode delle macchine (bot).
Le ragioni degli investitori sono sostenute e strutturate dall’associazione mondiale che li rappresenta, la potente Wfa (World Federation of Advertisers). Una delle richieste più sentite, anche più della trasparenza del dato, è la difficoltà di misurare l’efficacia di una campagna crossmediale che si sviluppa, per così dire, su più mezzi. Dalla tv a Instagram. Troppo diverse le metriche e quindi difficili da comparare rendendo impossibile stabilire con certezza l’andamento di una campagna. Nel mirino della Wfa, però, non ci sono solo le piattaforme ma anche la cara vecchia tv. Che poi tanto vecchia non è più da quando è collegata alla rete, al mare aperto. Lascia intendere, la Wfa, che i sistemi di rilevazione locali come Auditel non siano più sufficienti a dare conto di ciò che è visto/fatto sul televisore di casa. Che servano misurazioni capaci di seguire lo spettatore-utente-consumatore ovunque egli diriga la sua attenzione.
Da qui nascono propositi rivoluzionari: andare oltre i sistemi di misurazione locali, divisi per medium, per creare un solo sistema globale in grado di misurare tutto. Una specie di Google dei consumi culturali, fatta, ça va sans dire, con l’aiuto e il sostegno delle piattaforme stesse. La prima incarnazione plastica di questo Moloch si registra nel Regno Unito e porta il nome avveniristico di Project Origin, una partnership sostenuta da diversi soggetti: i brand, Wfa, Ana (la sigla corporativa che rappresenta agenzie e centri media), Isba (investitori, la Upa inglese) e da Google, Facebook, Amazon e TikTok.
Le linee guida di Wfa
Origin è stato strutturato a partire dal manifesto proposto da Wfa, che costituisce la stella polare dei bisogni e delle ambizioni dei suoi associati in un set di principi che dovrebbe guidare la progettazione e l’implementazione dei futuri sistemi di misurazione dei consumi. Pertanto, bisogna partire da qui.
La prima evidenza è che l’oggetto di misurazione crossmediale è il video, tra tv tradizionale e streaming, lineare e non. Le ambizioni iniziali di misurare tutto si sono date un contegno, limitandosi a quanto rappresenta comunque l’80% degli investimenti mondiali in pubblicità (advertising, quindi adv). Una rapida scorsa alle richieste dei pubblicitari. Un sistema che: 1. renda possibile il conteggio dei consumi attraverso tutti i formati media e gli editori; 2. permetta ai pubblicitari di misurare per intero la loro campagna e le fasi che la compongono: a. la pianificazione(pre-campaign); b. la gestione in tempo reale della campagna in corso, per ottimizzare le scelte; c. la valutazione della stessa a conclusione (post campaign evaluation); 3. realizzi la parte più alta dei desiderata, il suo vero nocciolo, la de-duplicazione della reach (i contatti, in buona sostanza: quante persone hanno visto la campagna pubblicitaria? Chi sono?), e della frequency (cioè la frequenza di esposizione: quante volte queste persone sono state esposte al messaggio?). Tutte richieste sensate, basilari. Ma un sogno per i mad men di tutte le latitudini. Fino a oggi il sistema più avanzato e condiviso dal mercato è stato quello della tv. Che risponde a queste domande ma su base statistica. Quindi, per convenzione. Ora lo si vorrebbe attuare su base censuaria. Conoscere il dato reale. Come vedremo, nonostante il digitale consenta più accuratezza, continuerà a restare un sogno che si scontra con le norme, attuali e future, che proteggono la privacy degli utenti.
Il tema della deduplica. Per rispondere alle domande solari dei pubblicitari dovremmo sapere chi sta vedendo cosa in un dato momento. Poter attribuire a ogni atto di visione un nome e un cognome, o un numero, come preferite. Tutte cose tecnicamente possibili ma piuttosto orripilanti sotto il profilo della salvaguardia della privacy e della libertà individuale. Infatti sono proibite dal Gdpr. Gli scenari futuri della normativa sulla privacy saranno ancora più severi dell’attuale e si va verso un mondo senza cookie (cookieless). Quindi, come aggirare questo ostacolo? Allo stato attuale l’unica soluzione individuata da Wfa è il Vid.
Il Virtual People Id è un modello che a partire dai dati di consumo delle persone reali è in grado di creare degli avatar. Persone virtuali per definizione prive di privacy. A ogni impression proveniente da un data provider è assegnato un Vid secondo un processo che resta comunque di natura statistica – non c’è infatti nessuna certezza che alla stessa persona sia associato sempre lo stesso avatar. È bene ripeterlo, il Vid non è un’identità elettronica della singola persona reale ma una recluta di un esercito di avatar che nel suo insieme dovrebbe riprodurre il comportamento di un gruppo di persone reali. Un modello che funziona secondo le logiche e le numeriche dei big data. In questo senso la privacy è salva perché non esisterebbe nessun legame diretto tra i dati censuari di cui dispone l’editore, dietro consenso dell’utente come da norme a tutela della privacy, e il sistema di misurazione crossmediale immaginato da Wfa. Grazie ai Vid si otterrebbe la famosa deduplica di reach and frequency.
Con l’aumentare delle campagne digital gli investitori sentono sempre di più l’esigenza di avere dati condivisi e confrontabili. Lamentano, tra le altre cose, la mancanza di trasparenza del sistema e da più parti emergono dubbi sulla veridicità dei numeri e il sospetto che siano figli di un sistema influenzato dalla frode delle macchine (bot).
Per quanto forse eccessivamente tecnico può essere interessante, per chi ha avuto la forza di leggere fino a qui, entrare nel cuore del sistema dei Vid. Spoiler: c’è Google inside.
Essenziali sotto ogni rispetto sono i dati degli editori, quelli che in gergo si chiamano dati di prima parte. Riguardano i comportamenti di visione che ognuno di noi mette in atto all’interno dell’offerta di ciascun editore. Netflix, per fare l’esempio più facile, possiede i dati di quello che facciamo sulla sua piattaforma, è del tutto lecito e comprensibile che sappia cosa guardiamo, quando, fino a dove, in quale sequenza e via dicendo. Ma tali dati sono suoi e Wfa non può usarli per tracciarci ovunque si spingano i nostri consumi video. Possono, però, essere usati per modellare un Vid. Il processo prevede l’utilizzo di un algoritmo che svolga questo lavoro. Il training del modello dei Vid – che avviene su base nazionale e deve essere aggiornato più volte all’anno – consiste di tre passaggi.
Passaggio 1. In questo primo step i dati di prima parte dei publisher sono ceduti (offline) al sistema attraverso un processo in doppio cieco (Double Blind Match) che permette di allenare il modello per la creazione di Vid.
Passaggio 2. Nel secondo passaggio avviene la magia. I dati di prima parte opportunamente privati della loro identità sono messi in relazione con una source of truth (una fonte della verità) per essere calibrati secondo dati statistici riguardanti la popolazione nazionale. Il numero di abitanti per regioni e città italiane, la numerosità delle classi di età, la tipologia di consumi e le abitudini di consumo che sono state misurate da una ricerca di base in essere (tipo quella di Auditel) o prodotta ad hoc per questo tipo di misurazione. Insomma, qualcosa di molto fondato statisticamente che permetta al Vid Operator di calibrare i comportamenti di consumo del pubblico provenienti dai singoli editori/publisher per dare vita a Vid (i nostri avatar) che siano una sintesi tra i comportamenti reali ma avvenuti in un singolo medium (YouTube, per esempio) e i comportamenti di consumo crossmediali (non più solo YouTube, ma anche Netflix, Rai e via dicendo) che abbiano una loro credibilità statistica. Più numerosi sono i Vid più, in teoria, si comportano in modo simile agli utenti reali in sistemi mediali complessi. Non siamo loro ma loro sono noi.
Passaggio 3. Con il terzo passaggio, come avrete capito, abbiamo la nascita dei Vid la cui esistenza permette la conquista del Graal o, per ora, soltanto una sua macchinosa approssimazione: la deduplica di reach and frequency. Ogni accesso, ogni atto di visione, da qualsiasi parte arrivi, che sia un dispositivo o un altro, un browser o un altro, avrà un suo statisticamente legittimo proprietario. Non siamo arrivati al censuario ma all’ibrido censuario/campionario, non abbiamo la realtà ma una sua stima complessa. Al cuore della trasformazione alchemica c’è un Trismegisto che conosciamo bene, Google del pianeta Alphabet.
Il ruolo di Google
L’algoritmo che rende possibile questa trasmutazione del dato di prima parte è fornito dall’azienda di Mountain View e ha una storia. Nasce nel 2013 quando Koehler, Skvortsov, and Vos (KSV) di Google Inc. presentano un metodo per misurare la portata e la frequenza delle campagne online da un singolo dispositivo. Il metodo combina i registri (log) dell’advertising server, i dati di consumo in mano all’editore, quelli di census e un campione rappresentativo (panel) al fine di produrre cookie e contare impression in modo corretto. Successivamente, nel 2016 i due Koehler e Skvortsov con il supporto di Ma e Liu (KSML), sempre di Google Inc., estendono questo metodo alla misurazione di diversi tipi di dispositivi: smartphone, tablet e desktop. Propongono anche un modello per convertire i cookie che contano dispositivi in cookie che contano persone. Introducono l’idea di Activity Distribution Function (Adf), il cui scopo è quello di calcolare la probabilità che una persona generi diversi tipi di cookie.
E siamo a oggi, o meglio, al 2019. Questa volta sono all’opera i soli Evgeny Skvortsov e Jim Koehler (SV), che presentano una tecnologia che implementa le metodologie precedenti (2013 e 2016) in modo da assegnare persone virtuali a ciascuno degli eventi di visione registrati nei log da molteplici dispositivi. Ognuno degli avatar risultanti è provvisto di dati anagrafici e di gender per stimare la reach and frequency deduplicata di una campagna salvaguardando la privacy delle persone. Il sistema che si ottiene, si dice, è autosufficiente (self efficient). Si alimenta con i dati che riceve, si autocorregge e si mantiene in vita migliorando i propri risultati.
Origin/Halo e la parte dei broadcaster
Come anticipato, Origin è la prima plastica incarnazione della stella polare individuata dalla Wfa e funziona secondo i principi espressi qui sopra. È stato creato da Isba in collaborazione con Wfa e da Ana ed è allo stadio di sperimentazione (proof of concept, PoC). Aderiscono alla sperimentazione i grandi marchi globali (tra cui Pepsico, Unilever, P&G, Coca Cola), i centri media (Omnicom, Publicis, GroupM, Dentsu, tra gli altri) e le piattaforme (Google, Amazon, Facebook e TikTok). Oltre a rendere possibili misurazioni crossmediali si pone l’obiettivo dichiarato di cambiare l’esperienza dell’utente migliorando l’impatto della pubblicità sui suoi consumi mediali. Si concentra sul video, sia esso di origine televisiva – compresa l’offerta digitale dei broadcaster – o esclusivamente online, ma si prepara a estendersi anche all’audio, dalle radio allo streaming (ai podcast). La governance che si vuole dare è quella del Jic (Joint Industry Committee), cioè la stessa di Auditel, Barb e Agf: indipendente, rappresentativo di tutti gli attori coinvolti nel mercato, con una netta separazione tra il ruolo di azionisti e quello di clienti. Il modello di finanziamento prevede che i costi siano sostenuti per un 40% dagli investitori pubblicitari, un 20% dalle agenzie e il rimanente 40% dagli editori. La prospettiva è quella di un super Jic globale, con incarnazioni locali come Origin, che possibilmente sostituisca i Jic locali.
Come indicato da Luciano Floridi, professore ordinario di filosofia ed etica dell’informazione presso l’Oxford Internet Institute e l’Università di Bologna, la scelta di non regolare la rete ha lasciato il mercato libero di svilupparsi e di stabilire le sue stesse regole. Gli animal spirit del capitalismo hanno trovato un ambiente vergine da colonizzare, ridefinendo la stessa economia e il rapporto tra finanza e paesi sovrani: chi fa le regole fa il gioco. Parafrasando Floridi, aggiungerei, per tornare al nostro argomento, che chi fa il metro misura il mondo.
Al momento il prototipo di Origin (Halo) sta testando il funzionamento concreto del modello di Vid usando dati reali, partendo prima dai soli dati tv e poi da dati crossmediali veri e propri. I risultati sulla tv si dicono incoraggianti, ma i broadcaster sono di altro avviso. Gli editori televisivi ritengono che il modello dei Vid non fornisca affatto risultati reali e comparabili con quelli generati da Barb (il sistema di misurazione della tv nel Regno Unito). Oltretutto ritengono che il sistema sia poco trasparente, che non abbia mai una vera prova angolare della sua bontà ma tenda ad auto-confermarsi nei suoi errori. Barb dal canto suo non ha ovviamente nessuna intenzione di confluire in Origin; i broadcaster britannici sono contenti del suo operato e non hanno nessuna intenzione di farsi misurare da un sistema poco trasparente che nel suo cuore ha l’algoritmo di Google. Come potrebbero abbandonare un mondo che hanno contribuito a fondare e a fare evolvere per abbracciare una scatola nera gestita dalle piattaforme? Ovvero da quei soggetti che inseguono la disintermediazione del mercato video come hanno compiuto quella del mercato audio e che già negli ultimi dieci anni hanno superato ampiamente per guadagni da pubblicità le televisioni? Vista da questa prospettiva sembra il lupo che invita Cappuccetto Rosso nel bosco. Dal canto loro, le piattaforme non hanno alcun bisogno di un Jic mondiale, vivono in un mercato poco regolato che hanno fatto a loro immagine e somiglianza e in cui prosperano. Su spinta di Wfa ritengono comunque utile partecipare alla sperimentazione, scrivere gli algoritmi e cercare di portare tutto il mondo del video, televisione inclusa, sul loro campo da gioco.
L’importanza del metro
In questa guerra dei mondi le metriche condivise svolgono un ruolo essenziale. Da un lato necessitano di essere aggiornate alle abitudini di consumo correnti e al mercato, quindi di venire incontro alle richieste dei pubblicitari; dall’altro rischiano di spostare gli equilibri del gioco ancora più a favore dei Gafa (Google, Apple, Facebook, Amazon). Da questo aspetto di mercato che appare marginale e tutto sommato un affare confinato agli interessi delle aziende che lavorano nei media e nell’informazione, derivano questioni di portata più universale. Come indicato da Luciano Floridi, professore ordinario di filosofia ed etica dell’informazione presso l’Oxford Internet Institute e l’Università di Bologna, la scelta di non regolare la rete ha lasciato il mercato libero di svilupparsi e di stabilire le sue stesse regole. Gli animal spirit del capitalismo hanno trovato un ambiente vergine da colonizzare, ridefinendo la stessa economia e il rapporto tra finanza e paesi sovrani: chi fa le regole fa il gioco. Parafrasando Floridi, aggiungerei, per tornare al nostro argomento, che chi fa il metro misura il mondo. Prendendo le misure al mondo è libero di dargli forma, di vestirlo come meglio gli pare. Non è un caso che metro in inglese – la lingua di internet, quella che lo scrive e lo pensa – si dice ruler, parola che significa al contempo regolatore, colui che fa le regole, che esercita un dominio, un governo.
Ci troviamo in un momento storico decisivo per tante ragioni. E questa delle regole da dare alla rete è una tra quelle che definiranno l’ecologia del mondo a venire. È arrivata l’ora che il regolatore (ruler) faccia il suo mestiere (ruling). È un lavoro improbo, complicato, osteggiato da lobby potentissime, spiriti pervasivi, veri signori della rete sorti invocando e celebrando la libertà, in nome della quale tutto è stato lecito, ma che hanno fatto, con i fatti algoritmici, un intrico di legami che gestiscono il flusso (flow) del nostro vivere online, e offline. Integrali complessi che spesso sdegnano la libertà individuale e collettiva. Dal metro (ruler) che ci dobbiamo dare come comunità dipende pertanto l’esito di questa fase magmatica adolescenziale della rete: fase necessaria, forse non eludibile, di questi primi 40 anni di internet (il protocollo Tcp/Ip è del 1982) che oggi, però, necessita di un’evoluzione. Fortuna che da questo punto di vista l’Europa (e dove sennò) sta muovendo i primi passi. Ma c’è molto da fare, persino troppo, e l’Europa da sola non basta. Il concetto dei limiti, dei confini, dei remedies da imporre alle superpotenze sembra l’unica strada possibile per ristabilire un equilibrio, un ordine sostenibile alla plenitudine digitale nella quale viviamo e nella quale vivremo nel nostro futuro. Le metriche da questo punto di vista devono essere definite da enti terzi super partes, prevedere un set di regole uguali per tutti, creare dei sistemi di equivalenze che permettano di confrontare i consumi fatti sui diversi e tanti media che contribuiscono a fare le nostre giornate.
Fabio Guarnaccia
Direttore di Link. Idee per la televisione, Strategic Marketing Manager di RTI e condirettore della collana "SuperTele", pubblicata da minimum fax. Ha pubblicato racconti su riviste, oltre a diversi saggi su tv, cinema e fumetto. Ha scritto tre romanzi, Più leggero dell’aria (2010), Una specie di paradiso (2015) e Mentre tutto cambia (2021). Fa parte del comitato scientifico del corso Creare storie di Anica Academy.
Vedi tutti gli articoli di Fabio Guarnaccia