Définition : « données » et « informations »
Les données sont des enregistrements symboliques dans un contexte donné. Il existe un lien entre « données » et « informations ». D'un point de vue juridique, il est important de distinguer la couche de contenu, la couche de code et la couche physique.
Les données peuvent être considérées sous trois angles différents : en se concentrant sur leur contenu (« couche de contenu »), en se concentrant sur leur codage dans un fichier (« couche de code ») ou en se concentrant sur leur emplacement physique (« couche physique »). Cette différenciation est particulièrement importante pour l'évaluation juridique.
Source : Yochai Benkler, From Consumers to Users (2000)
Définition des données
Les données sont essentiellement des enregistrements symboliques (chiffres, lettres, etc.) de mesures, d'observations et d'autres informations connexes (lieu, heure, désignation, description, etc.) relatives à des objets et à des faits dans un contexte donné, ainsi que des déductions (secondaires) tirées de ces enregistrements.
Au sens de cette définition fondamentale, le phénomène des « données » existe depuis la première utilisation de l'écriture pour les activités administratives étatiques et économiques dans les civilisations antiques, c'est-à-dire depuis environ 5 000 ans. Le terme « données » lui-même est toutefois moins ancien. Dérivé du verbe latin dare (« donner »), le participe passé datum (« donné ») était utilisé au Moyen Âge en introduction des documents importants, accompagné de l'indication de la date et du lieu, et le contenu du document devenait ainsi « donné ». Plus tard, le pluriel « données » (en anglais « data ») s'est développé comme terme désignant les enregistrements symboliques de « faits » (situations) au sens défini ci-dessus et est largement utilisé dans les domaines de l'économie, de l'administration et des sciences.
Données numériques
Avec l'invention des calculateurs électroniques (numériques) dans les années 30 et 40 du XXe siècle, les données prennent de plus en plus la forme de chiffres (numériques) décontextualisés et calculables. Sous cette forme, elles peuvent être traitées par des machines symboliques universelles (« ordinateurs »), envoyées via des réseaux numériques et stockées dans des mémoires numériques. Cela vaut non seulement pour les enregistrements de mesures, d'observations et d'autres informations connexes, mais aussi pour les conversions numérisées de tout type d'artefacts symboliques tels que les textes, les images et les sons. En outre, indépendamment des enregistrements sous forme numérique, des données peuvent être générées artificiellement en quantités illimitées sous forme de données dites « synthétiques ». La conversion de tous les enregistrements et artefacts symboliques en données numériques (« chiffres ») pouvant être traitées par des machines est donc complète et constitue la principale caractéristique de l'ère numérique dans laquelle nous vivons.
Données et informations
Le terme « données » doit être mis en relation avec le terme « information ». La distinction entre ces deux termes ne découle pas principalement de leur contenu et de leur structure, mais du contexte dans lequel elles s'inscrivent. Les données sont enregistrées en premier lieu et indépendamment, dans une certaine mesure, de leur utilisation ultérieure. On parle d'informations lorsque des contenus formalisés sont transmis par un expéditeur (ou une source) à un destinataire. Les données peuvent ainsi devenir des informations dans un certain contexte d'action et de communication, par exemple lors de la consultation d'une collection de données (base de données). Les données deviennent alors une source d'informations (« expéditeur ») pour la personne qui les consulte (« destinataire ») et la base de données, avec les programmes d'application et les programmes système ainsi que les équipements techniques (processeurs, mémoires, terminaux et réseaux), devient un « système d'information ».
À l'inverse, les informations prennent les formes les plus diverses, mais ne reposent pas toujours sur des données, raison pour laquelle l'image habituelle de la pyramide « données-informations-connaissances » est, du moins en partie, insuffisante. En règle générale, les informations peuvent toutefois être converties en données numériques, c'est-à-dire enregistrées symboliquement (« numérisées ») afin, par exemple, d'être analysées, stockées de manière permanente ou envoyées via des réseaux.
Source : André Golliez, Geocommons pour la Suisse (2023)
Point de vue juridique et organisationnel
Il convient de distinguer les données des informations. Outre la signification des données, il est très important, d'un point de vue juridique et organisationnel, de s'interroger sur leur mode de stockage et de gestion. Selon Lessig (2002) et Benkler (2000), il convient de considérer séparément le contenu (« Content Layer »), le codage (« Code Layer ») et le lieu de stockage physique (« Physical Layer »).
Source : document de référence « Souveraineté numérique » (2024)