Enigma, l’entreprise qui va vous faire comprendre la big data

« - Papa, ma base de donnée a été retweeté par le président.
-       C’est bien que ton patron apprécie ton travail.
-       Non Papa, je te parle du président des Etats-Unis ! »

Il n’y a que chez Enigma, à New York, que vous pourriez entendre ce genre de conversation.

La startup créée par Hicham Oudghiri, un marocain basé à New York, il y a maintenant deux ans, a pris de l’ampleur et peut légitimement prétendre être un des leaders de la big data dans le monde. La preuve ce tweet du président Obama à propos d’une page dédiée au « shutdown » du gouvernement américain qui avait eu lieu au mois d’octobre et sur laquelle on pouvait visualiser, entre autres, l'évolution en temps réel du nombre d’employés dont le salaire aura été versé en retard.

C’est là toute l’ambition d’Enigma : faire de la big data un outil concret permettant de comprendre le monde dans lequel nous vivons pour les journalistes, les consultants, les banques, les activistes ou encore les scientifiques, et de leur permettre de prendre des décisions informées.

Qu’est-ce que la big data et quelle est son utilité ? 

Derrière ce grand méchant mot, une idée simple : il y a de plus en plus de données dans le monde mais elles ne sont pas accessibles et reste inutilisées. Hicham renchérit : « c’est incroyable le nombre de données disponibles, les gens n’en sont même pas conscients. »

Or « vous pouvez raconter des histoires, expliquer des affaires et des cas et prendre des décisions de façon sage » avec ces données, continue Hicham Oudghiri.

En croisant les données publiques des différents ministères et organisations gouvernementales et non-gouvernementales avec celles des entreprises, vous obtenez des données aussi utiles que variées.

Enquelques secondes et encore moins de clics, Hicham a pu me donner les plus gros clients de Boeing et les comparer avec ceux d’Airbus, me dire combien d’appartement le Royaume du Maroc possède et combien ils valent, combien d’employés Spotify a fait venir de l’étranger ou encore qui a eu un entretien avec le président Obama, combien de temps a duré cette réunion et qui est resté après les autres. Des données cruciales pour la presse et les contre-pouvoirs.

Grâce à ces données, les banques peuvent aussi prendre des décisions éclairées, parvenant plus facilement à détecter les fraudes et à confirmer le sérieux ou le manque de sérieux des demandeurs de prêt.

Enigma permet aussi aux scientifiques de remplacer certaines hypothèses par des faits et aux statisticiens de générer des études plus rigoureuses car reposant sur plus de données. Pour mieux réaliser le pouvoir des données, Hicham, pourtant humble, me raconte ainsi, avec un peu de fierté, comment, Enigma a aidé une équipe de statisticiens à déterminer l’importance des terrains de jeu pour enfants dans la réduction du nombre d’agressions sexuelles sur enfants, en croisant le nombre d’aggressions par zone géographique et le nombre de terrains de jeu.

Une course aux données

Pour parvenir à ces résultats, il faut répertorier une quantité impressionnante de données judicieusement choisies. Si Palantir, la plateforme de big data spécialisée dans la sécurité et dont les trois clients principaux sont la CIA, la NSA et le FBI, a choisi d'offrir une plateforme logicielle et de laisser ses clients entrer leur propre data, Hicham a choisi de fournir un outil d'analyse tout en réunissant les informations dispersées sur le web.

C’est donc en se lancant dans une chasse folle aux données que Hicham a commencé son aventure entrepreneuriale. Rapidement, il est rejoint par Marc DaCosta, un ami rencontré lors de son bachelor en philosophie (!) à l'université de Colombia aux Etats-Unis.

Les deux co-fondateurs consacrent alors 8 mois à réunir suffisamment de données pour que le service devienne pertinent, 8 mois de bootstrapping (un autre gros mot pour décrire un financement par ses propres moyens) avant de pouvoir présenter leur produit aux investisseurs.

Une patience qui a payé puisque la version alpha d’Enigma, lancée début 2012, séduit les investisseurs et a permit à Enigma de lever 1,45 millions de USD entre avril 2012 et février 2013 auprès de plusieurs investisseurs dont le New York Times Company.

La startup, qui est sortie de bêta le 1er mars 2013, compte désormais 18 employés dont 12 ingénieurs qui passent 40% de leur temps à ajouter de nouvelles données.

Hicham et son équipe ont un plan d'attaque bien rôdé pour rassembler toutes ces données : ils sélectionnent une série d'organisations stratégiques disposant d'informations accessibles au grand public et crawlent leurs sites web - ce qui veut dire en jargon web, programmer un robot pour qu'ils indexent toutes les informations présentes sur leurs sites - à la recherche de fichier lourds, contenant immanquablement des lignes et des lignes de data. Ils envoyent ensuite une requête aux organisations pour récupérer les données publiques n'étant disponible qu'offline.  

Hicham et sa troupe ont ainsi réunis toutes les informations publiques des 24 000 sites en .gov (le domaine réservé aux départements du gouvernement des États-Unis), du registre des entreprises américaines, de l'annuaire des startups Crunchbase, mais aussi des entreprises côtées. Et les entreprises jouent le jeu, m’explique Hicham. Leurs demandes leur ont été pratiquement systématiquement accordées et certaines entreprises vont jusqu’à leur envoyer des informations manuellement chaque jour – FedEx fournit ainsi, quotidiennement, la liste des objets ayant été livrés aux Etats-Unis dans leurs containeurs.

Aujourd’hui, l’équipe d’Enigma continue d’ajouter des données, en fonction de ce qu’ils estiment important et de ce que leur demandent leurs clients.

La startup, qui a remporté le TechCrunch Disrupt NY 2013, a ainsi réussi à se démarquer de ses concurrents. Sa vision holisitique permet au site de se distinguer des autres sites de big data dont le champs d'action est plus réduit alors que le nombre de data répértoriées - quelques 80 milliards de rangées de données, selon Hicham - lui promet une longueur d'avance sur ses concurrents.

Un freemium inversé, pour changer le monde

 

Pour pouvoir mener à bien ce travail de récupération de data, Enigma a choisi un modèle premium, donnant uniquement accès à ses données à ses abonnés. Sans surprise, ceux-ci se composent de journalistes – ce n’est pas pour rien que New York Times est un des investisseurs principal de l’entreprise - , d’institutions financières, de politiciens, de cabinet de conseil, de banques mais aussi d’activistes - certains ont pu bénéficier d'abonnements gratuits.

Dans le futur, une fois que le service aura attiré suffisamment de grands comptes pour rendre le service rentable ou tout du moins durable, Hicham Oudghiri espère pouvoir rendre plus de données accessibles au grand public, en mettant en place, dès le 1er ou le 2ème trimestre 2014, un modèle freemium. Une décision éthique plus qu’économique.

Ce passage au freemium ne génèrera pas directement de revenu mais permettra de donner accès au plus grand nombre à des informations qui pourraient changer le monde – ou tout du monde aider les individus à mettre en place des actions qui, elles, permettront d’améliorer le monde dans lequel nous vivons.

Il suffit de parler à Hicham pour se rendre compte que ce ne sont pas des paroles en l’air. Le Marocain croit fermement aux bénéfices de l’open data.

« Ces données sont publiques pour de bonnes raisons, m’explique t’il. Si nous avons la liste des visiteurs s’étant rendu à la Maison Blanche, c’est parce que les gens ont le droit de savoir ce qu’il s’y passe. »

« Je crois vraiment à l’importance de la transparence ; nos sociétés modernes doivent être construite sur la vérité, » continue t’il, avant d’ajouter en blaguant « les gouvernements ont des données sur nous, nous avons des données sur eux. »

Le côté obscur la big data 

Pour autant, lors de sa démonstration, Hicham Oudghiri a réussi à obtenir, en trois coups de cuillère à pot, des informations qui pourraient s'avérer dangereuses dans de mauvaises mains ou qui pourraient gêner les personnes dont l’intimité a ainsi été dévoilée. On imagine vite les risques que pourraient entraîner la diffusion de l’adresse de Robert De Niro – une information que Hicham a réussi à obtenir en un clic ! – ou l’offuscation de particuliers s’ils savaient que la valeur de leur appartement et la liste des biens qu’ils ont importé étaient accessibles à tous.

« C’est un compromis, nous ne pouvons pas mettre en place l’open data de façon sélective, » justifie t’il.

Hicham Oughiri assure ne fournir que des données publiques et respecter les lois en vigueur. Selon lui, si les citoyens estiment que certaines données sont dangereuses, ils peuvent demander à réguler contre leur publication.

« C’est effrayant, continue t’il, mais rappelez-vous l’inquiétude des gens au début de Google quand ils ont découvert que l’on pouvait apprendre à faire des bombes avec une simple recherche Google. »

La big data dans le monde arabe

Après les Etats-Unis, Enigma compte s’attaquer à l’Europe et aux pays des BRIC, une expansion qui sera facilitée par le nombre de data déjà réunies émanant des Etats-Unis mais concernant des pays étrangers.

Quid du monde arabe ? Hicham confie que ce n’est pas la première région dans laquelle Enigma s’étendra, bien qu’il soit convaincu de l’importance de la big data dans le développement du journalisme dans la région.

Cela ne l’empêche pas de partager sa surprise quant à l’état de l’Open Data, dans la région. Il note que, contre toute attente, ce sont Oman et l’Arabie Saoudite qui se démarquent par leurs efforts à mettre à disposition des données.

Partager

Articles similaires