La numérisation

Tout le monde a entendu parler du numérique, mais tout le monde n'a pas une idée très claire de ce que c'est. Certains appareils fournissent directement des données numériques (les APN), mais la plupart numérisent des données analogiques.

Définitions

Le mot signal désigne une grandeur (en général électrique) traduisant une autre grandeur physique : par exemple la sortie d'un microphone dans lequel je parle. Ce signal est censé être analogue au son qu'il représente (d'où le nom), sa principale caractéristique est d'être continu, c'est-à-dire défini à chaque instant d'une part et possédant d'autre part une infinité de valeurs possibles entre son minimum et son maximum.
Un signal discret n'existe qu'en de très courts instants qu'on appelle échantillons.
La numérisation se compose de deux opérations : échantillonnage et quantification.

échantillonnage

C'est l'opération consistant à mesurer (très vite) le signal à des instants très rapprochés pour suivre au mieux les variations dans le temps du signal analogique.
La fréquence d'échantillonnage est le nombre de telles mesures par seconde. On l'exprime naturellement en hertz.

Quantification

C'est l'opération qui consiste à transformer l'échantillon en un nombre. Et pour cela on le compare aux différentes valeurs d'une échelle prédéfinie.
En électronique binaire (celle qu'on utilise jusqu'à présent) les échelles prédéfinies sont qualifiées par le nombre de bits exploités.
Avec 8 bits on dispose de 256 niveaux, avec 12 de 4096, avec 16 de 65536.
En conséquence un signal analogique numérisé sur 8 bits ne dispose que de 256 niveaux différents (de 0 à 255). On pourra trouver que c'est suffisant dans certains cas (nuances de couleur primaire) et très peu dans d'autres (son).

Questions primordiales

1 - Perd-on de l'information dans l'échantillonnage ?
2 - Perd-on de l'information dans la quantification ?
La réponse à la première question est : NON, à la deuxième : OUI.

1 - Le théorème de Shannon stipule que si on échantillonne un signal à une fréquence double de la plus haute fréquence contenue dans le signal, on ne perd rien du signal. En effet on est en mesure de reconstituer le signal à partir des échantillons. Et ça se démontre.

2 - Par contre, ne disposer que de 256 niveaux pour traduire toute l'étendue des variations d'une grandeur, c'est assez restrictif. D'où la nécessité de quantifier avec le nombre de bits le plus élevé possible pour minimiser cette perte. Mais bien entendu, ça se paye : un convertisseur 16 bits coûte plus cher et prend plus de temps.

à titre indicatif, dans les années 80, je disposais d'un appareil doté de convertisseurs 12 bits à 500 ns/point (2 MHz) et 8 bits à 50 ns/pt (20 MHz).
De nos jours on utilise jusqu'à 192 kHz/24 bits en audio (avec des dynamiques de 115 dB). On arrive à 150 MHz/14 bits.

Justification sommaire du théorème de Shannon

à propos de la non-perte d'information dans l'échantillonnage, on peut se demander pourquoi on ne pourrait pas avoir un petit « accident » sur la courbe entre deux échantillons qui échapperait par conséquent à la numérisation.

Mais c'est que justement si on a échantillonné à une fréquence supérieure à la plus haute fréquence présente dans le signal, cette situation ne peut avoir lieu : l'accident correspond à une fréquence supérieure à la fréquence d'échantillonnage (puisqu'il est plus petit).

Remarque sur la qualité CD

La fréquence d'échantillonnage choisie pour le standard CD-audio est 44,1 kHz. Sachant qu'on considère comme audible la gamme 20 Hz - 20 kHz, on voit que le critère de Shannon est respecté. Mais peut-on considérer la musique comme du régime permanent (sons constants ou lentement variables) ? La musique de tout style, de toute époque, est largement constituée de transitoires (chaque note de piano est une percussion) qui correspondent à des fréquences bien supérieures à ce qui est audible et pourtant nécessaires à une bonne restitution des attaques.