Vous vous souvenez de la scène du film AI (Intelligence Artificielle) où Jude Law fait une recherche avec le docteur Know ?
He bien on en est presque arrivé là.

Je suis tombé sur un projet extraordinaire : dbpedia (wiki.dbpedia.org/About)

Le principe : scanner wikipedia et en extirper toutes les données présentes sous forme de tableau.

Les données sont ensuite disponibles et questionnables avec des requêtes sparql (une espèce de langage sql).

Voici par exemple une requête qui demande tous les films dans lesquels Tom Cruise a joué avant 2000 : dbpedia.org/snorql/?query=SELECT+%3Fsubject+%3Flabel+%3Freleased+%3Fabstract+WHERE+%7B%3Fsubject+rdf%3Atype+%3Chttp%3A%2F%2Fdbpedia.org%2Fclass%2Fyago%2FMotionPictureFilm103789400%3E.%3Fsubject+dbpedia2%3Astarring+%3Chttp%3A%2F%2Fdbpedia.org%2Fresource%2FTom_Cruise%3E.%3Fsubject+rdfs%3Acomment+%3Fabstract.%3Fsubject+rdfs%3Alabel+%3Flabel.FILTER%28lang%28%3Fabstract%29+%3D+%22en%22+%26%26+lang%28%3Flabel%29+%3D+%22en%22%29.%3Fsubject+dbpedia2%3Areleased+%3Freleased.FILTER%28xsd%3Adate%28%3Freleased%29+%3C+%222000-01-01%22%5E%5Exsd%3Adate%29.%7D+ORDER+BY+%3FreleasedLIMIT+20

Une autre qui donne toutes les compagnies aériennes dans le monde: dbpedia.org/snorql/?query=SELECT+*+WHERE+%7B%3Fsubject+dbpedia2%3Awordnet_type+%3Chttp%3A%2F%2Fwww.w3.org%2F2006%2F03%2Fwn%2Fwn20%2Finstances%2Fsynset-airline-noun-2%3E.%3Fsubject+rdfs%3Alabel+%3Flabel.%3Fsubject+rdfs%3Acomment+%3Fabstract.FILTER+%28lang%28%3Flabel%29+%3D+%22en%22+%26%26+lang%28%3Fabstract%29+%3D+%22en%22%29%7D+LIMIT+20

Pfiu…