Où trouver des datasets intéressants et volumineux?

On a régulièrement besoin de trouver des datasets pour différents tests.
Une jolie liste a été publiée ici:

http://www.datasciencecentral.com/profiles/blogs/great-github-list-of-public-data-sets

Je complète ce post par celui-ci de Phil Whelan
http://www.bigfastblog.com/how-to-get-experience-working-with-large-datasets

http://www.freebase.com/ : A community-curated database of well-known people, places, and things

Google Public Data
http://www.google.com/publicdata/explore?ds=dj48l9qpd27ep_

http://hadoopilluminated.com/hadoop_illuminated/Public_Bigdata_Sets.html

02/01/16: un dataset de 1To déposé sur MS Azure par Criteo.








Comments