{{tag>livre lecture}} ====== Hyperpuissance de l'informatique ====== Livre de Gerard Berry, aux éditions Odile Jacob. ===== Introduction ===== L'informatique calcule sur l'information en se basant sur les algorithmes mis en œuvre dans les programmes exécutés par des machines. * Informatique: désigne spécifiquement la science et la technique du traitement de l'information. * Numérique: toute activités exploitant numérisation et traitement de l'information: photographie numérique, son numérique, édition numérique art numérique, économie numérique. *Automatique: science qui invente les algorithmes de contrôle embarqués: avions, satellites, voitures, robot. Il est important de noter que la nature physique des machines (leurs différentes architectures) et la variété des techniques de stockages n'ont pas d' importance sur le traitement des données ou leur stockage. L'informatique bouleverse les conceptions mécaniques et physiques traditionnelles. En enregistrant et en calculant sur l'information, on peut faire assez simplement des choses extraordinaires qu'il était très complexe voir impossible à mettre en œuvre sur des moyens mécaniques ou analogiques traditionnels. Les systèmes numérique apportent la souplesse et permettent d’éviter totalement l’accumulation du bruit qui limitait les traitements analogiques. L'informatique permet d'agir de manière **uniforme** sur une grande quantité de données physiques qui étaient traitées autrefois analogiquement de façon totalement indépendante. ===== Impacts ===== Bouleversement majeur comparable a la révolution industrielle. Il fait disparaître et crée des emplois. * Les services qui controlent finement l'information prennent le dessus sur les services historiques basés sur la seule valorisation des biens physiques: taxis/VTC, hôtellerie et agences de voyage/sites réservations. * Conception en milieu industriel: DAO, CAO, modélisations et simulations remplacent les conceptions par prototypes physiques. * Dématérialisation quasi totale pour La photographie, le son ou la vidéo. On écoute la musique par stream, on échange les photos en les regardant depuis les portables. Pensez à conserver les médias de stockage vinyle, cassettes, bandes pour pouvoir en parler aux générations futures. * Sciences et médecines sont impactés: les mesures sont numériques, traitements, simulation, réalité virtuelle et augmentée. La France est restée un peu en retrait de cette révolution concentrée sur l’énergie électrique, transport ferroviaire et spatial. Les 3 premières industries mondiales en terme de capitalisation sévissent dans l'industrie informatique: Apple, Alphabet, Microsoft. Une seule entreprise francaise dans les cent premières: Dassault Systèmes. Vue longtemps comme un outils, l'informatique n'a pas été vraiment enseignée aux étudiants, il suffisait de savoir l'utiliser nous plaçant de fait en position servile d'utilisateur de ce qui est conçu ailleurs. Il est faux de penser qu'on apprend l'informatique en l'utilisant. Tablette, téléphones ou ordinateurs portables ne doivent pas être fournis aux enfants sans suivi pédagogique. Ils deviennent addictifs sans apporter de compréhension de l'informatique. Est il acceptable qu' un élève arrive au baccalauréat sans réelle formation alors qu'il sera en contact direct et permanent a l'informatique dans sa vie professionnelle et personnelle? L'informatique est rentrée tôt en France dans la recherche universitaire (1960) mais est restée longtemps en dehors des grandes écoles qui se sont montrées plus conservatrices. Création en 1967 de l'IRIA devenue ensuite INRIA, recherche au CNRS et creation en 2009 de INS2I. ===== CHP 3 Les piliers de l'informatique ===== Toute donnée informatique manipulée par un ordinateur est un nombre en base 2 enregistré en mémoire. * Pour le texte, les tables de transcodage permettent d'associer des nombres à des symboles (table ASCII, ISO, UTF etc). * Les images sont des tableaux de pixels (picture cell) ou chaque pixel est un triplet de nombres encodant les intensités des couleurs rouge vert et bleu (RVB) * Le son est une suite d'intensités sonores enregistrés régulièrement. Pour le CD par exemple on utilise un encodage sur 16bits (valeur décimale 0-16367) avec un échantillonnages à 44KHz. Il est important d'adapter l' encodage des données en mémoire à la précision les interfaces de numérisation ou a l'usage prévu: * Rien ne sert d'encoder un son en mémoire sur 24 bits si l'interface de captage ne peut fournir que 16 bits. Les 8 bits supplémentaires par échantillon occuperont inutilement de l'espace et dépenseront de l’énergie lors de l'encodage/décodage. * En revanche, si on souhaite faire des traitements sur le son, échantillonnage/encodage sur 24bits se révélera utile car tout calcul complexe sur le son dégrade la précision. L'information, une fois encodée occupe de la place en mémoire: on parle de taille d'encodage ou en langage courant poids de la donnée. En informatique les quantités de données manipulées sont souvent très importantes, on manipules régulièrement des ordres de grandeurs tel que méga, giga, téra, péta, exa, zetta pour les bits, les op( nombre d'opérations par secondes) ou flop (opérations a virgule flottante). * Un disque dur vendu en 2017 a une capacité moyenne de 4 Téra Octets, * Un supercalculateur opère en péta flop * L'internet en 2015 générait un trafic de 72,5 exaoctets/mois Il faut bien différencier donnée et information. La donnée n'est pas l'information. La donnée est une valeur brute. L'information est déduite ou interprétée à partir de la donnée. Par essence, l'information est à géométrie variable. Elle dépendra de l'usage et du contexte. Si 20 est une donnée enregistrée en mémoire représentant une température en degré celcius, elle pourra apparaître douce à un Européen mais mal interprétée par un Américain utilisant les Fahrenheit, et sera infernale pour un ours blanc. Sur un support, ou lorsqu'elles sont transmises, les données sont brutes, non interprétées. La neutralité du net débattue régulièrement exprime cette nécessité de transmettre sans différenciation les données à l'état brutes. ==== Compression des données ==== * Compression sans pertes par factorisation des redondances. Economie en général de l'ordre du facteur 2 sans perte de qualité (FLAC, TIFF) * Compression avec pertes (JPEG, MP3). En se basant sur des spécificités physiologique de nos systèmes sensoriels. On supprime des espaces sur lesquels nous sommes peu sensibles. Les compressions obtenues sont plus élevées avec une compression de l'ordre d'un facteur 6 ou 10 mais il y a des approximations et pertes d'information, fichier resultat "proche" du fichier source. * La compression vidéo s'appuie sur notre perception visuelle très sensible au mouvement mais peu sensible aux zones immobiles qui peuvent alors être fortement compressées. ==== Big data ===== Être capable d'extraire une information compacte, intelligible et pertinente d'une masse importante de données. Problème techniquement complexe, et l'interprétation l'est aussi car il ne faut pas confondre corrélation et causalité. On site souvent pour exemple une étude ayant fait ressortir que dans certains où les communautés de cigognes étaient plus nombreuses on constatait des pics de natalité. Une étude bien conduite sur des données pertinente et posant des questions pertinentes peut produire des services considérables. a science des données est devenue un des secteurs les plus importants de l'informatique. En 2017, la chaire "Science des données" a été créee au collège de France. ===== Algorithmes ===== Les algorithmes sont des processus exécutables de façon systématiques. Ils existent depuis longtemps et ne sont pas uniquement présents dans les ordinateurs ou les automates. Une opération de calcul arithmétique comme l'addition fait appel à un algorithme, et de manière générale toute activité systématique pouvant être executée sans y penser est un algorithme. En informatique les algorithmes permettent de travailler des données numérisées et fournissent des résultats numérisés. Les algorithmes sont des objets de nature mathématique même si ce n'est pas celle que l'on apprend à l'école. L' informatique utilise souvent des théories qui n'ont pas été inventés pour elle, par exemple les séries de Fourrier pour les traitements sur le signal ou les théorie des nombres pour le chiffrement. L'évolution de la discipline conduit les informaticiens a de nouvelle théories matématiques notamment pour: * Étudier la **correction** de l'algorithme, c'est a dire sont adéquation au problème posé * Évaluer la **complexité** du programme c'est a dire son coût en ressources (temps de calcul, mémoire et énergie)