Tout le monde connait aujourd’hui la big data, des jeux de données complexes permettant des recoupements et des analyses prédictives pour une entreprise.
Mais peu de personnes connaissent sa petite sœur : la small data. La small data va représenter toutes les micro-données qui sont collectés chaque jour par les entreprises à travers des tableurs, des comptes rendus, des plannings, des bases de données clients ou encore des capteurs physiques ou digitaux. Ce sont des données suffisamment « petites » pour être comprises par l’Homme, c’est-à-dire des données dont le volume et le format les rendent accessibles, informatives et exploitables

Toutes ces données très accessibles sont encore peu utilisées alors qu’elles représentent de véritables leviers d’aide à la décision, que ce soit dans les ressources humaines, le marketing, la logistique…
Lorsque ces données sont bien utilisées et interprétées, cela permet pour les entreprises de déterminer des analyses prédictives parfois plus performantes que celles issues de la big data, malgré le fait qu’elles puissent être moins nombreuses et sembler plus dérisoires.
Afin de comprendre avec un exemple concret ce qu’est la small data, vous pouvez visionner cette vidéo d’Olivier Sibony : https://www.youtube.com/watch?v=zSEgsrXAsGw.
Beaucoup d’entreprises sous-estiment le pouvoir des small datas en utilisant la big data et des millions d’échantillon de consommateurs, alors qu’ils pourraient en apprendre beaucoup plus en étudiant de petits échantillons dans le cadre d’études de marché.

Martin Lindstrom est un des précurseurs de l’utilisation de la small data. Selon lui, l’utilisation des small datas est basée sur la combinaison de l’observation de petits échantillons et de l’intuition. Les spécialistes du marketing peuvent notamment obtenir des informations sur le marché en travaillant auprès d’un segment cible et en les observant dans leur propre environnement.
Par rapport aux big datas, les small datas ont le pouvoir de déclencher des émotions et d’expliquer le comportement des clients. Elles peuvent révéler des informations détaillées sur l’introversion d’une personne, sa confiance en soi, si elle a des problèmes dans son couple, etc.
Selon Lindstrom, les relations entre les personnes et les segments de clientèle s’organisent autour de quatre critères :
- Le climat : il révèle par exemple comment l’environnement d’une personne affecte son régime alimentaire.
- Le pouvoir : le pouvoir ou le gouvernement en charge
- La religion : la prévalence de la religion dans un pays, en fonction de son influence, indique si le processus décisionnel d’une personne est influencé par son système de croyances.
- Les traditions : les normes culturelles influencent les comportements et les interactions des personnes.
En plus de trouver un intérêt marketing dans la small data, celle-ci peut également permettre de construire des modèles prédictifs à partir de petits volumes de données. Ces données peuvent provenir des industries, des données de fabrication, de la R&D ou encore du milieu médical.
Les algorithmes évolutionnaires
Selon la théorie de l’évolution de Darwin, plusieurs mécanismes sont à l’œuvre pour tendre vers des organismes vivants plus adaptés à leur environnement. On retrouve parmi ces mécanismes :
- Le codage des caractéristiques dans les gènes
- Les individus d’une même population sont tous différents
- Les individus sont plus ou moins adaptés à leur environnement,
- Les organismes transmettent une partie de leurs caractéristiques à leurs descendants,
- Les individus les plus adaptés se reproduisent plus « efficacement », leurs caractéristiques ont donc tendance à davantage se répandre dans la population.

Les algorithmes évolutionnaires partent de la théorie de l’évolution pour trouver le meilleur modèle répondant à une problématique.
L’idée est de faire évoluer un ensemble de solutions à un problème donné, dans l’optique de trouver les meilleurs résultats. Ce sont des algorithmes qui vont utiliser de manière itérative des processus aléatoires.
En produisant de nombreux modèles, ceux-ci vont être confrontés aux données présentes et vont évoluer en fonction de celles-ci. De plus, les différents modèles vont se confronter entre eux, déterminer lequel sera le plus “viable” jusqu’à trouver le modèle répondant le plus favorablement.
Utilisation des algorithmes évolutionnaires avec la small data
L’utilisation des small datas prend notamment un sens pour les essais cliniques pharmaceutiques où il y a peu de patients et donc peu de données. Grâce à des algorithmes évolutionnaires qui imitent la sélection darwinienne, il est possible en utilisant peu de données de détecter des signaux très faibles et de fournir des modèles exacts utilisables.
Elle peut également être utilisée lors de la conception d’un produit où chaque prototype coûte beaucoup d’argent. Il est alors possible d’utiliser les données issues de ces essais : les données collectées vont pouvoir être analysées par ces algorithmes évolutionnaires qui vont alors permettre de comprendre les critères, permettant de concevoir le meilleur produit ou encore de simuler beaucoup d’autres essais sans les faire physiquement.
- Algorithme évolutionniste. In: Wikipédia [Internet]. 2020 [cité 4 avr 2021]. Disponible sur: https://fr.wikipedia.org/w/index.php?title=Algorithme_%C3%A9volutionniste&oldid=175214492
- Augmented Analytics for Every Professional | MyDataModels [Internet]. [cité 4 avr 2021]. Disponible sur: https://www.mydatamodels.com/
- Lejealle C. Outil 46. Les small data. In: La MEGA boîte à outils du Digital en entreprise [Internet]. Paris: Dunod; 2018. p. 146‑7. (BàO La Boîte à Outils). Disponible sur: https://www.cairn.info/la-mega-boite-a-outils-du-digital-en-entreprise–9782100778379-p-146.htm
- Small Data : définition et utilisation pour mon entreprise [Internet]. MyDataModels. 2020 [cité 11 avr 2021]. Disponible sur: https://www.mydatamodels.com/fr/quest-ce-la-small-data-et-comment-puis-je-lutiliser-pour-mon-entreprise/
- Small Data ▷ définition, exemples et avantages, Big Data vs Small Data | Appvizer [Internet]. appvizer.fr. [cité 11 avr 2021]. Disponible sur: /magazine/analytique/small-data

Double cursus de Doctorat en Pharmacie en filière Industrie et de Master 2 Management