Berner Lee : proposition du web sémantique

From INTLNET
Jump to: navigation, search

Le temps passe vite. Il y a maintenant presque 20 ans, j'ai voulu restructurer la manière dont nous utilisons l'information, la manière dont nous travaillons ensemble -- et j'ai donc inventé la Toile, le World Wide Web. Et maintenant, 20 ans après, ici à TED, je vous demande votre aide pour une nouvelle restructuration.

Retournons en 1989: j'avais écrit à l'époque un mémo sur la mise en place d'un système d'hypertexte public. Ça n'avait pas intéressé grand-monde à l'époque. Mais 18 mois plus tard -- vous savez, les innovations se produisent comme ça -- 18 mois plus tard, mon patron m'a autorisé à y passer du temps, comme un genre de projet expérimental, pour tester un nouvel ordinateur que nous avions obtenu. Et il me donna donc le temps de le coder. Et j'ai donc écrit ce que devait être le langage HTML, le procotole hypertexte -- HTTP -- l'idée des liens URL, ces choses qui commence par "HTTP". J'ai écrit le code et je l'ai publié.

Pourquoi j'ai fait ça ? Et bien parce que j'étais dans un état de frustration. J'étais frustré -- Je travaillais comme ingénieur logiciel dans cet immense et exitant laboratoire de recherche, où beaucoup de gens venait travailler de partout dans le monde. Ils apportaient chacun des ordinateurs différents. Ils utilisaient aussi des formats de données différents. Toute une palette de systèmes de documentation différents. Donc, avec toute cette diversité, si je voulais y créer quelque chose en prenant un morceau à droite, un morceau à gauche, je devais à chaque fois me connecter à une nouvelle machine, je devais apprendre à utiliser un nouveau logiciel, et l'information que je voulais était dans un nouveau format de données. Et ils étaient tous incompatibles. C'était donc très frustrant. Cette frustration provenait de tout ce potentiel enfermé.

En fait sur tous ces disques, il y avait des documents. Donc si on pouvait tous les intégrer dans un hypothétique grand système de documentation virtuel, c'est à dire sur internet, alors la vie serait beaucoup plus simple. Et quand vous avez une idée comme ça, elle s'accroche vous, et même si les gens n'ont pas lu votre mémo -- En fait il l'a lu, on a retrouvé sa copie après sa mort. Il avait écrit "vague mais intéressant" au crayon dans un coin.

(Rires)

Mais d'une façon générale il était très difficile d'expliquer ce qu'était le web. Il est difficile d'expliquer aujourd'hui combien c'était difficile à expliquer à ce moment-là. Mais quand TED a été crée il n'y avait pas de web, des mots comme "cliquer" n'avait pas le même sens. Je pouvais montrer un bout d'hypertexte, une page avec des liens, on peut cliquer dessus, et hop, on se retrouve sur une autre page hypertexte. Pas vraiment impressionant. On avait déjà vu ça. On avait vu des liens hypertextes sur des CDROM. Ce qui était difficile était de les faire imaginer... Alors imaginez que ce lien peut vous emmener sur n'importe quel document que vous puissiez imaginer. C'est une barrière qui est très difficile à franchir pour certaines personnes. Et bien quelques personnes ont réussi. Alors oui. C'était difficile à expliquer mais il existait un mouvement de fond. Et c'est ça qui aura été le plus sympa. C'est ça qui aura été le plus existant. Pas la technologie, pas ce que les gens ont fait avec, Mais vraiment la communauté, l'esprit de tous ces gens qui se réunissaient, s'envoyaient des emails. C'était comme ça à cette époque.

Et vous savez quoi... C'est marrant... Mais d'une certaine manière, c'est comme cela à nouveau. Je demandais à tout le monde plus ou moins de mettre ses documents en ligne. "Pourriez-vous mettre vos documents sur ce web-machin?" Et... vous l'avez fait. Merci. Ça a été sympa non? C'était vraiment intéressant, car on s'est aperçu que ce qui se passait sur le web nous dépassait réellement. Il s'est passé bien plus de choses que ce que nous avions imaginé lorsque nous avions créé le premier site web. Maintenant, je veux que vous mettiez vos données sur le web ! Ce qui se passe c'est qu'il reste encore un énorme potentiel inexploité. Il y a toujours une énorme frustration. Car nous n'avons pas de données sur le web en tant que données.

Qu'est ce que ça veut dire? Quelle est la différence entre document, données... Et bien les documents vous les lisez, ok? En gros vous pouvez les lire, suivre les liens, mais c'est tout. Avec les données vous pouvez faire plein de trucs sur un ordinateur. Qui a ici vu la présentation de Hans Rosling ? Cool. Plein de personnes l'on vu. C'est l'une des meilleurs présentation de TED. Hans a fait cette présentation dans laquelle il montre dans différents pays, dans différentes couleurs, le niveau de revenus sur un axe avec les taux de natalité sur un autre, et le tout animé à travers le temps. Il a donc récupéré ces données et en a fait une présentation qui démonte les idées préconçues qu'ont les gens sur l'économie des pays émergents.

Il a utilisé un slide de ce type. Derrière cette présentation il avait plein de données. Les données c'est terne, carré, ennuyeux... C'est l'image que nous en avons, n'est-ce pas ? Car les données ne peuvent pas être utilisées naturellement tel quel. Mais en réalité les données influencent en grande partie nos vies. Cela arrive quand quelqu'un prend ces données et crée quelque chose avec. Dans notre cas, Hans a rassemblé toutes les données, il les a trouvé auprès des Nations-Unies, sur des sites webs. Il les a rassemblées, les a combinées pour donner quelque chose de plus intéressant et alors il les a insérées dans son logiciel, créé je crois par son fils, pour donner cette merveilleuse présentation. Et Hans a mis en avant le fait qu'il était très important d'avoir beaucoup de données. Et je suis heureux de l'avoir vu hier demandant encore avec insistance plus de données.

Et maintenant je voudrais que vous vous imaginiez, pas seulement 2 morceaux de données connectés, ou même 6, mais un monde où tout le monde aurait mis ses données sur le web. Virtuellement tout ce que vous pouvez imaginer serait sur le web. Et j'ai appelé cela "Linked Data" ("données liées") La technologie s'appelle "Linked Data" et elle est extrêmement simple. Si vous voulez mettre quelque chose sur le web, il y a 3 règles. La première chose est que nous utilisons toujours les adresses HTTP -- ces trucs qui commencent par http: -- Mais plus uniquement pour les documents, on va les utiliser pour décrire les documents. On va les utiliser pour des personnes, on va les utiliser pour des lieux, on va les utiliser pour vos produits, pour des événements. N'importe quel concept aura un nom commençant par http.

Deuxième règle: Si j'utilise une de ces adresses HTTP le web va me renvoyer des informations, en utilisant le protocole HTTP, des données dans un format standard Et ce sont des données utiles que quelqu'un aimerait connaitre, à propos de cette chose: si c'est un événement, qui s'y rend ? Si c'est un personne, où est-elle née ? Ce genre de choses. Donc la deuxième règle est qu'on me renvoie des informations importantes.

La troisième règle est que quand je récupère ces informations, ce ne sera pas uniquement le poids ou la taille ou le lieu de naissance de cette personne, on me fournira également des relations. Les données sont des relations. C'est ce qui est intéressant, les données sont des relations. Vous avez cette personne née à Berlin, Berlin est en Allemagne. Dès lors qu'il y a une relation, l'élément lié est nommé avec un nom commençant par http. Et à partir de son nom HTTP je peux accéder à cette ressource. Je peux accéder à cette personne, ensuite je peux accéder à la ville ou elle est née, à sa région, à sa ville, à la population de sa ville, et ainsi de suite... Je peux parcourir toutes ces choses.

Et voilà. C'est ça, "Linked Data". Il y a quelques années j'ai écrit un article intitulé Linked Data, et peu de temps après les choses ont commencé à bouger. Nous avons eu de plus en plus de ces boites que Hans décrivait, et nous avons vu de plus en plus de choses éclore. Ce ne sont pas que des plantes. Ce n'est pas seulement une racine qui fait vivre une plante. Pour chacune de ces plantes, peu importe sa nature, une présentation, une analyse, quelqu'un cherchant des tendances dans les données, peut interroger toutes ces données. et toutes ces données sont connectées. La chose vraiment important sur les données, c'est que plus vous avez de données connectés, plus elles deviennent puissant.

Linked Data est donc apparu, le concept, le mème a été essaimé. et quelques temps après, Chris Spitzer, de l'Université Libre de Berlin, qui fut l'un des premiers à publier des données interessantes, remarqua que Wikipédia, cette fameuse encyclopédie en ligne, qui contient plein de documents intéressants, possédait parfois des encadrés, des sortes de boites d'information. Et que dans ces boites d'information, il y a des données. Il a écrit un programme pour extraire ces données de wikipedia et les stocker au format Linked Data sur le web. Il a appelé son site DBpedia. DBpedia est représenté au milieu de cette slide par le rond bleu. et si vous continuez à faire des recherches sur Berlin, vous vous apercevez qu'il y a d'autres zones de données sur Berlin, et elles sont toutes connectées entre elles. Donc si vous récupérez quelque chose de DBpedia sur Berlin, vous vous retrouvez à récupérer les autres données en même temps. La chose incroyable est que cela commença à grossir. C'est à nouveau un mouvement de fond.

Maintenant examinons ces données. Les données apparaissent sous différentes formes. Pensez à la diversité du web. C'est un élément primordial pour le web, de pouvoir y ajouter n'importe quel type d'information. Il en va de même avec les données. Il existe plein de types de données. Il y a les données gouvernementales, des données d'entreprises, qui sont vraiment essentielles, les données scientifiques, les données personnelles, les données météorologiques, les données concernant les événements, les données des discussions, les informations, toutes sortes de données. Je vais en mentionner quelques unes pour que vous ayez une idée de leur diversité, et ainsi vous rendre compte de leur potentiel.

Commençons par les données gouvernementales. Barak Obama a dit dans un de ses discours que les données du gouvernement américain seront disponibles sur internet dans des formats accessibles. Et j'espère qu'ils utiliseront le format "Linked Data". C'est important. Pourquoi est-ce important? Pas seulement pour la transparence. Bien sûr la transparence est importante. Mais ces données proviennent de tous les départements gouvernementaux. Alors pensez comment ces données montrent comment nous vivons en amérique. C'est très utile, ça a de la valeur, je peux l'utiliser pour ma société, En tant qu'enfant, je peux l'utiliser pour faire mes devoirs. Ce que je dis ici, c'est qu'on peut rendre la gestion du monde meilleure, en rendant ces données disponibles.

En fait, si vous êtes décideur, et vous entendez parler de données gouvernementales particulières, vous verrez que ces gens ont souvent tendance à les garder pour eux. Hans appelle ça le serrage de base de données. Vous serrez votre base de données. Vous ne la laissez pas partir tant que vous n'en avez pas fait un joli site web. Ce que je suggère, c'est qu'avant de ... ... Oui, faites un joli site ! Je ne peux pas vous empêcher de faire un joli site. Faites-en donc un joli site. Mais avant cela, donnez-nous accès aux données non altérées. On veut des données. On veut des données non altérées. Il faut que nous demandions des données brutes maintenant. Et je vais vous demander de vous entrainer. Pouvez vous dire "Raw" ?

Audience: Raw!

Pouvez vous dire "Data" ?

Audience: Data!

Pouvez vous dire "Now" ?

Audience: Now!

Raw Data Now ! (Des Données Brutes Maintenant !)

Audience: Raw Data Now !

Pratiquez-le, c'est important. Car vous n'imaginez pas les excuses que trouvent les gens pour retenir leurs données pour vous empêcher d'y accéder, alors même que vous les avez payées avec vos impôts. Et ce n'est pas qu'en Amérique. C'est la même chose partout dans le monde. Et ce n'est pas uniquement les gouvernements. Les entreprises également.

Je vais juste vous faire part de quelques idées sur les données... Nous sommes ici à TED, et nous sommes particulièrement conscient des immenses challenges que l'humanité doit relever. Eliminer le cancer. Comprendre le cerveau pour traiter l'Alzheimer. Comprendre l'économie, la rendre plus stable. Comprendre comment le monde fonctionne. Ceux qui vont résoudre ces problèmes sont des scientifiques, ils ont des tonnes d'idées dans leur tête, ils essayent de les communiquer à travers le web. Mais beaucoup de connaissances de la race humaine se trouvent actuellement dans des bases de données qui ne sont pas actuellement partagées.

En fait si vous prenez juste un domaine comme Alzheimer, la recherche de médicaments par exemple, vous vous apercevez qu'il y a beaucoup de "Linked Data" qui apparaissent car les scientifiques de ce domaine se sont aperçu que c'était une bonne manière de sortir de leurs silos. Il y avait des données sur le génome dans cette base de données, dans ce bâtiment, et il y avait des données sur les protéines dans une autre... Et maintenant ils les ont réunies comme "Linked Data" et maintenant ils peuvent poser des questions que vous ne vous poseriez pas, moi non plus, mais eux oui... Quelles protéines sont utilisées dans la transduction des signaux et qui sont en rapport avec les neurones pyramidaux? Et bien vous prenez cette question, vous la mettez dans Google, Bien-sûr il n'y a pas de page sur web qui répond à cette question, car personne ne se l'est déjà posée. Vous récupérez 223,000 réponses, mais aucun résultat utilisable ! Vous interrogez les données cumulées du "Linked Data": 32 réponses, et chacune d'elle est une protéine qui a cette propriété. Et vous voyez la puissance de pouvoir poser ces questions pour un scientifique. Des questions qui créent des ponts entre différentes disciplines. C'est un changement radical. C'est vraiment très important. Et les scientifiques l'ont très bien compris. Les données que d'autres scientifiques ont collectées sont enfermées et nous devons les délivrer pour pouvoir nous atteler à ces grands problèmes.

Si je continue, vous allez vous dire que toutes les données proviennent des grosses institutions et que cela n'a rien à voir avec vous. Et bien cela est faux. Les données parlent de nos vies. Vous vous connectez sur votre réseau social favori. Vous selectionnez un ami, et hop, une relation, une donnée. Vous dites: cette photo représente cette personne, hop, une donnée. Données, données, données. A chaque fois que vous faite quelque chose dans un réseau social, le site crée des données et les utilise, les retravaille, et rend la vie des autres utilisateurs du site plus intéressante. Mais si vous allez dans un autre réseau social, disons spécialisé dans les voyages, et que vous voulez envoyer une photo à toutes les personnes de ce groupe, vous ne pourrez pas passer les murs. "The Economist" a écrit un article sur le sujet, de nombreux blogueurs en ont parlé. C'est une énorme frustration de ne pas pouvoir détruire les silos et apporter de l'interopérabilité entre les réseaux sociaux. Nous devons faire ça avec le "Linked Data".

Un dernier type de données, et peut-être le plus excitant. Pour venir ici, j'ai utilisé OpenStreetMap. OpenStreetMap est une carte mais aussi un wiki. Zoomez, ce truc carré est un théatre, où nous nous trouvons actuellement, le théatre Terrace. Il n'y avait pas de nom dessus. Alors je suis allé dans le mode édition, j'ai sélectionné le théatre, j'ai pu rajouter en bas le nom, puis sauvegarder, et maintenant si vous allez sur openstreetmap.org, retrouvez cet endroit, vous verrez que le théatre Terrace a maintenant un nom. J'ai fait ça. Moi ! J'ai fait ça sur la carte. Je viens de faire ça. Et vous savez quoi. Street Map n'est constitué que de personnes ayant rajouté leur petite touche. Et cela crée une ressource incroyable car chacun apporte sa ressource. "Linked Data" c'est exactement ça. Ce sont des gens qui produisent peu, mais dont le peu est connecté avec tout le reste. Voilà comment le "Linked Data" fonctionne. Vous faites votre part, et tout les autres aussi. Vous n'avez peut-être pas beaucoup de données vous-même, mais vous pouvez en demander. On vient de s'y entrainer.

Voilà. "Linked Data" est énorme. Je viens de vous en expliquer une petite partie. Il y a des données dans tout les aspects de nos vies, dans tout les aspects du travail et des loisirs. Et l'important n'est pas uniquement le nombre de sources des données, c'est de pouvoir toutes les relier. Et quand vous connectez les données, vous obtenez une puissance qui n'existe pas avec le web des documents. Vous en obtenez un pouvoir énorme. Nous arrivons à une étape où tous ceux qui pensent que c'est une bonne idée doivent agir. Et il y a beaucoup de personnes à TED qui font des choses même s'il n'y a pas un retour immédiat sur investissement, car cela payera uniquement lorsque beaucoup de personnes l'auront fait. Ils le feront car c'est le genre de personnes qui font des choses qu'ils seraient bon que tout le monde fasse. Cela s'appelle "Linked Data". Je veux que vous le fassiez, je veux que vous le demandiez, et je pense que cette idée mérite d'être partagée.

Merci.

(Applaudissements)