« Topic Data », le vrai-faux firehose de Facebook

« Topic Data », le vrai-faux firehose de Facebook

Mardi 10 mars, une annonce Facebook a fait l’effet d’une bombe dans la communauté marketing et l’industrie du social media intelligence. Facebook ouvre son firehose !

Facebook s’allie en effet avec Datasift pour lancer « Topic Data » et donner un accès à certaines informations sur les statuts Facebook de leurs utilisateurs. Nous nous sommes penchés sur la nouvelle et l’avons décortiquée pour vous. Elle se décompose notamment en deux éléments, la notion de « firehose » et les résultats à attendre de « Topic Data ».

 

Un Firehose ? Qu’est-ce que c’est ?

Le terme « Firehose » nous vient de Twitter. En 2010, Twitter a décidé de commercialiser l’accès aux tweets via leur API.

Trois options sont alors possibles :

  • Spritzer : Un accès gratuit à environ 1% des tweets, via l’API publique.
  • Gardenhose : Un « tuyau de jardinier » pour capter entre 10 et 20% des  tweets, via une API délivrée par Twitter au cas par cas.
  • Firehose : Un accès à 100% des tweets publiques (soit 500 millions de tweets par jour) en temp réel. Cette « lance à incendie » coûte $1 pour 1 000 tweets.

Trois sociétés spécialisées se sont vite démarquées en achetant l’accès au Firehose et en proposant de le revendre : Gnip (racheté par Twitter), Topsy (racheté par Apple) et Datasift (assailli de rumeurs d’acquisition). Datasift est partenaire avec la majorité des médias sociaux pour proposer un accès aux API de Twitter, Reddit, WordPress, Tumblr, Wikipedia, Youtube, IMDb etc… ces API sont des briques indispensables pour faire de la veille sur les médias sociaux. Et jusqu’à présent Facebook ne donnait un accès qu’aux pages et groupes publiques.

 

 Topic Data de Facebook : des données anonymisées

L’annonce de « Topic Data » promet de pouvoir tirer des insights sur les 1.3 milliards d’utilisateurs Facebook. Il suffit d’entrer des requêtes sur le nom de marque ou n’importe quel mot-clé pertinent pour ensuite obtenir des données anonymisées sur le sujet. Les données sont livrées par Facebook à Datasift qui les redistribue à ses clients. Facebook et Datasift ont travaillé avec Privacy by Design, une organisation gouvernementale canadienne dédiée à l’anonymisation des données afin de protéger la vie privée de leurs utilisateurs. Cette option permet à Facebook de puiser dans l’immense majorité des statuts/photos ou vidéos que ses utilisateurs publient en privé, tout en gardant leur anonymat.

Ces règles du jeu contraignent donc l’industrie à changer certaines pratiques, sur le plan de l’analyse mais également sur le degré de confiance à accorder aux insights.

Firehose pic

 

Les limites du vrai-faux Firehose

Étant donné que l’accès a « Topic Data » est limité, on ne peut réellement pas l’appeler un « Firehose ». Nous notons les quelques limites qui méritent d’être énoncées :

  1. Pas d’accès aux données brutes :   Les données ne donneront que des chiffres et peu de détails sur le contenu réel. Si vous avez déjà fait un export Excel des analytics d’une page Facebook, attendez vous au même principe.
  2. La Boîte noire : En l’absence de données brutes,  il faut faire confiance à Facebook pour filtrer le bruit, le spam, le faux… mais aussi pour assurer un niveau de qualité dans l’analyse du texte. En janvier Facebook a fait l’acquisition de Wat.ai des spécialistes en « Natural Language Processing », donc on peut espérer un taux de fiabilité habituel, soit autour de 75%. Par exemple, en cas de mauvaise qualification automatisée de l’ironie, il sera impossible d’estimer ou rectifier des erreurs à la main.
  3. Absence d’archives : La data n’est disponible que sur 30 jours glissant et ne permet pas de consulter le passé. Cette limite complique l’analyse des saisonnalités ou la détection des tendances et signaux faibles.
  4. 100 personnes minimum : Si la marque ou le marché est trop petit et insuffisamment mentionné, Facebook ne livrera pas de données afin de ne pas compromettre l’anonymat des utilisateurs.
  5. Données uniquement disponibles sur les US et UK : Ces marchés sont plus matures sur le sujet et sont naturellement les premiers à bénéficier de Topic Data. Il s’agit néanmoins d’un déploiement progressif, les autres pays et langues devraient suivre.

Nous voyons ici une limitation technologique qui peut poser problème. Un simple accès à un dashboard ou à un outil de veille n’est pas suffisant. Il s’agit également de s’assurer de la véracité de la donnée et de combler les lacunes des outils par de l’analyse humaine. Nous avons déjà des approches et méthodologies qui permettront de faciliter la compréhension et la contextualisation du sujet.

Si vous voulez plus de détails sur les données disponibles dans l’API, cliquez ici.

 

Des opportunités dans la Social TV ?

Pour conclure, plusieurs industries vont pouvoir bénéficier de Topic Data. Par exemple, la social TV voit un nouveau monde d’opportunités s’ouvrir ! Les français sont nombreux à commenter les émissions de TV en direct de leurs statuts Facebook. En analysant ces données les émissions pourront adapter leur contenu, jauger les audiences intéressées et également estimer l’impact de « bad buzz » perçus sur Twitter mais pas forcément ailleurs. Nielsen Twitter TV Ratings aura des sources complémentaires de données à apporter aux acteurs de la Social TV.

Facebook Topic Data est une progression intéressante pour notre secteur et va fournir des insights intéressants aux entreprises souhaitant toujours mieux comprendre leurs clients, leur marché et leurs parties prenantes. Les limites de Topic Data ne seront que technologiques et pourront être ménagées par de bons analystes.

La réputation de l’Huile de Palme en France

La réputation de l’Huile de Palme en France

Suite au léger bad buzz envers la dernière campagne Nutella (d’autres sites en parlent) nous nous sommes penchés sur l’évolution de la réputation de l’huile de palme. En analysant les 12 derniers mois de discussions et mentions de l’huile de palme en France et dans le monde nous pouvons observer comment le sujet évolue dans les conversations des français au fil des actualités, de différentes campagnes des organisations et d’opérations marketing. Avant de regarder les data, un peu d’histoire.

 

Sur les dernières années, l’huile de palme en France c’est une histoire avec trois temps forts :

  • En 2010, la campagne Greenpeace UK contre Kit-Kat : Un buzz international obtenu grâce à une vidéo et une réaction maladroite de la part de Nestlé.
  • En 2012 une « taxe Nutella » est présentée aux commissions des affaires sociales au Sénat et à l’Assemblée Nationale par les députés Jean-Louis Roumegas et Véronique Massonneau (EELV). Un débat se lance sur la contribution de l’huile de palme à l’obésité ou au cancer mais l’amendement est abandonné.
  • En 2013, le premier ministre Jean-Marc Ayrault assure au gouvernement malaisien que la taxe est enterrée.

Les data et la réputation de l’huile de palme:

A travers le monde occidental, l’huile de palme est un sujet d’intérêt fort pour les ONG environnementales, les activistes et les consommateurs sensibles aux sujets de la déforestation et la préservation des espèces en danger d’extinction. En France, la problématique santé dominait les inquiétudes des consommateurs. Cependant, notre étude indique qu’une bascule s’est opérée à la fin de l’année 2014. Les français rejoignent le reste du monde et démontrent désormais un intérêt plus fort pour l’environnement et la déforestation.

Les signaux forts / faibles qui pourraient affecter les marques :

  • Expropriation terriennes en Malaisie, Indonésie, Amazonie… Plusieurs peuples autochtones sont déplacés de leurs terres, souvent dans la violence. Les images sont poignantes et virales.
  • La santé des agriculteurs et leurs conditions de travail posent parfois problème. L’huile de palme est un sujet médiatiquement porteur pour les ONG, certaines (anti-OGM) font un lien entre l’insecticide Paraquat et son danger pour la santé humaine. D’autres ONG pointent du doigt la présence d’enfants dans les champs de palme. A l’image des conditions de travail au Bangladesh dans le textile, ce sujet pourrait conduire à une crise.
  • La montée du Cameroun qui veut concurrencer l’Asie du Sud-Est sur l’exportation d’huile de palme. Les enjeux de déforestation au Cameroun commencent à être relayés par des lanceurs d’alertes écologistes.

Les solutions pour les marques :

  • S’assurer du respect du discours sur l’huile de palme durable. Les politiques RSE sur l’huile de palme s’étendent désormais au-delà de l’environnement et seront attendues sur le traitement des travailleurs locaux ainsi que des populations autochtones.
  • Surveiller les publications scientifiques et leurs relais dans les communautés santé afin d’anticiper de potentiels résurgences sur la santé.
  • Garder un œil sur l’évolution du Cameroun et ne pas être pris de court si vos fournisseurs se font attaquer sur la déforestation.
  • Établir des relations avec les ONG et Key Opinion Leaders. L’absence de réponse ou argumentation entraînent une riposte, souvent en plaçant la marque sur une liste rouge ou noire.
Nationwide : la pub choc qui a gagné le Superbowl

Nationwide : la pub choc qui a gagné le Superbowl

Alors que les publicitaires pensaient avoir trouvé la bonne recette pour cartonner au Superbowl, Nationwide a fait tout le contraire. Après le match, c’est la marque d’assurance Nationwide qui se place en haut du classement des marques les plus évoquées sur le web pendant cette soirée avec 238 000 mentions, devant les 225 000 de Budweiser .

La formule préconisée par les agences est la suivante :

1. Publication de la pub en amont sur Youtube (entre 2 et 7 jours avant)
2. Seeding via les comptes sociaux
3. Activation RP et RP 2.0
4. Realtime marketing pendant le SuperBowl avec une équipe aux aguets
5. Interaction avec les autres marques sur Twitter

Mais Nationwide a fait différemment. Avant le Superbowl ils n’ont pas posté la pub sur Youtube, ils n’en ont parlé à personne ni fait de teasing sur les médias sociaux. Voici leur pub qui a marqué les esprits :

On joue sur l’aspect choc et morbide complètement à contre-pied de l’état d’esprit des autres publicités. Nationwide a décidé de ne pas dévoiler ce spot sur les accidents domestiques avant le match. Contrairement à la publicité contre la violence domestique de la NFL qui cherchait aussi le choc émotionnel, sa diffusion anticipée a réduit son impact sur le public américain. Plusieurs journalistes se sont même émus du fait que la magie des pubs du SuperBowl avaient disparu.
Cette formule choc comporte aussi un risque, qui pose la question du prix à payer quand on cherche à choquer. D’après Amobee une société d’analytics américaine, 64% des mentions de la pub Nationwide étaient négatives… la recherche de l’émotion a un prix. Effet supplémentaire, les internautes ont publié des mèmes avec le jeune garçon de la pub.

nationwide tweet

 

Aujourd’hui, NationWide a déclaré au Wall Street Journal qu’ils assumaient l’aspect choc de la publicité et se félicitaient d’avoir lancé une conversation nationale sur les accidents domestiques qui touchent les enfants.

Nouveau : Le Photo Monitoring sur les Réseaux Sociaux

Nouveau : Le Photo Monitoring sur les Réseaux Sociaux

Social Media Monitoring = Texte Monitoring ?

En une décennie, les solutions de veille web se sont améliorées mais aussi complexifiées. Les marques ont les moyens de repérer et analyser les prises de parole publics, que ce soit sur Twitter, Facebook, un blog, un forum, un site d’avis, son Tumblr, un site d’information etc… Pour identifier ces avis, il faut que l’internaute rédige a minima le nom de la marque ou de l’entreprise. Cependant les usages sur le web changent. Avec Instagram, Facebook, Tumblr, Snapchat, Shots, la tendance est au partage de photos depuis son smartphone. La teneur de ces photos ne change pas fondamentalement, c’est toujours un moyen d’expression pour les internautes voulant partager leur vie et leurs opinions.

Pour les marques, le manque à gagner est immense ! Les millions de photos partagées chaque jour sont une opportunité de comprendre comment les consommateurs interagissent avec les produits ou les points de ventes. Mais environ 90% des photos contenant un produit ou une marque n’ont pas de hashtag ou mot-clé associé, ce qui empêche la détection de ces contenus générés par les utilisateurs.

Test de Ditto : Le Photo Monitoring

Le Photo Monitoring est longtemps resté une technologie peu fiable et uniquement utilisée par les gouvernements ou les marques de luxe (actions anti-contrefaçon). Ditto, une société basée dans la région de Boston, apporte enfin une technologie pertinente pour les marques grâce à d’impressionnants algorithmes de reconnaissance de logos.

D’un point de vue technique, l’outil puise dans les API de Tumblr, Twitter et Instagram pour récupérer toutes les images partagées publiquement par les internautes. Chacune des images est analysée par des algorithmes de reconnaissance de logos et de reconnaissance d’expression faciale. Pour les utilisateurs finaux, la plateforme se présente comme les autres plateformes de veille traditionnelle. Les habitués retrouvent très vite leurs repères.

Chez Digital Insighters, on a testé Ditto. En voici un petit tour d’horizon, avec l’exemple de la marque Corona.

La rivière de photos utilisant le logo Corona

Ditto1

Les photos de profil des utilisateurs postant des photos de leurs bières

Ditto2

Les traditionnelles courbes de mention, impressions et niveau d’engagement

Ditto3

Les autres logos apparaissant le plus souvent dans les photos. On peut tirer des insights comme les affinités de marques non détectées par l’analyse de textes. Ici, Corona remonte avec beaucoup d’autres marques de bières de micro-brasseries américaines

Ditto4

Une liste des Key Opinion Leaders, c’est à dire les comptes influants publiant souvent des photos de Corona.

Ditto5

Les photos sont géolocalisées et présentées dans ces cartes. La précision permet d’aller même jusqu’au niveau du bar d’où les utilisateurs boivent leur Corona.

Ditto6Ditto7

 Quels usages pour les marques ?

Premièrement ce type d’outil sert aux prestations de Social Media Analytics. Comparer la différence entre les mentions et les photos qui sont partagées sur une marque ou un produit peut apporter de la valeur. Dans l’exemple sur Corona nous pouvons observer que les photos de bouteilles de bières sont partagées dans des contextes festifs (d’ivresse aussi) où il est plus simple de partager une image rapidement que d’indiquer la marque que l’on consomme.

Deuxièmement, des insights issus de l’analyse d’image peuvent servir en sponsoring. Un secteur où l’exposition compte beaucoup mais où la mesure du taux de transformation est loin d’être rigoureuse. Ici dans l’exemple Corona, nous avons noté que le logo apparaît souvent pendant des événements sportifs… et dans les jeux vidéos ! Des captures d’écran du jeux vidéo Fifa sont partagés sur les réseaux sociaux et contiennent naturellement les logo de sponsors. Mesurer l’impact du sponsoring en Earned Media est donc facilité par le photo monitoring.

Troisièmement, il existe des usages en événementiel. Identifier les lieux où le produit est le plus souvent mis en valeur (bars, boites, restaurants, hôtels, supermarchés, lieux culturels…) par les consommateurs permet aussi de mieux cibler les opérations de promotion sur le terrain.

… et quels freins ?

Il existe un frein que les marques doivent prendre en compte dans l’activation de cette veille photos. Comme au début du social media monitoring, les internautes peuvent se plaindre que leurs photos intéressent les marques. Pour désamorcer les craintes, nous recommandons l’approche de Jet Blue qui date de 2008 aux débuts de l’utilisation de Twitter par les marques.

 

Les technologies de photo monitoring viennent combler une lacune de nombreux outils de monitoring actuels. Ils offrent dès lors une nouvelle opportunité pour les marques : découvrir de nouveaux insights, comportements consommateurs ou utilisations de leur produit.

La personnalité préférée des ados est… sur Youtube

La personnalité préférée des ados est… sur Youtube

Alors que le JDD annonce que la personnalité préférée des français est Jean-Jacques Goldman, et que le classement n’évolue guère depuis deux décennies, penchons nous sur un classement plus dynamique. Variety publie le classement des personnalités préférées des adolescents (américains) et nous révèle une tendance beaucoup plus significative sur l’évolution des goûts à l’ère du digital.

Les « Youtubeurs » au Top 5

Contre toute attente le classement place 5 Youtubeurs en tête, bien devant Paul Walker (décédé fin 2013), Jennifer Lawrence ou Katy Perry. Ces personnalités gèrent des chaînes Youtube rassemblant entre 7 et 30 millions d’abonnés et totalisant jusqu’à 5.5 milliards de vues sur leurs chaînes. La moitié du Top 20 est composée de ces nouveaux phénomènes que nous ne connaissions pas il y a encore 5 ans.

La majorité des profils sont des humoristes du web, les deux premiers, Smosh et Fine Bros tournent encore certaines vidéos dans les dortoirs de leurs facs alors qu’ils empochent autour de 5.7 millions de dollars par an.

A 24 ans, le suédois Pewdiepie est le 3ème Youtubeur le plus populaire et aussi le plus riche (7.5 millions de dollars par an). En abordant les jeux vidéos avec humour et excès, Pewdiepie s’est placé sur une niche très porteuse. Les jeux vidéos sont une thématique qui attire de très nombreuses vues. En 4ème vient KSI. Très présent sur les séries de jeux vidéo Fifa, il élargit son style éditoriale vers l’humour et les caméras cachés.

Enfin, des Youtubeuses  occupent aussi le top 20, à l’image de Bethany Mota. Ses vidéos de tutoriels beauté, coiffure ou mode lui ont ouvert la voie vers une monétisation plus diversifiée. Bethany a sa propre ligne de vêtements chez Aéropostale (concurrent de Abercrombie & Fitch) et se lance aussi dans le parfum.

youtube-stars-shine-brightest

Comment expliquer leur popularité ?

  1. Youtube est l’activié la plus populaire sur le web chez les ados. Naturellement ils s’attachent plus à des personnalités qu’ils voient chaque semaine!
  2. Les personnalités Youtube seraient plus approchables et authentiques, un facteur de préférence qui prend de plus en plus d’importance chez les ados. D’après Variety, plus le discours d’une célébrité est formaté plus elle perd en popularité chez les jeunes. Sans surprise les ados sont friands de blagues et débordements pas toujours politiquement correct.
  3. Snobé par les médias traditionnels, les jeux vidéos trouvent leur « niche » sur Youtube. Les critiques de jeux rassemblent beaucoup plus de vues que les critiques de cinéma ou musique.
  4. La vision romantique d’une réussite fulgurante. Le public est séduit par l’accessibilité du succès. Il suffit de brancher une webcam et être créatif pour percer et devenir multi-millionaire…

Point méthodologique:

L’étude porte sur le marché américain uniquement. A l’image du JDD, les sondeurs ont proposé une liste fermée de célébrités et demandé aux ados leur avis sur l’accessibilité, l’authenticité, l’intelligence et la fiabilité des stars. La méthodologie a ses limites: par exemple Beyoncé n’était pas dans la liste. Finalement, la liste pointe vers une tendance réelle chez les ados américains et ce ne serait pas une surprise de voir Norman ou Cyprien en tête des célébrités préférées des adolescents français.