On a régulièrement besoin de trouver des datasets pour différents tests.
Une jolie liste a été publiée ici:
http://www.datasciencecentral.com/profiles/blogs/great-github-list-of-public-data-sets
Je complète ce post par celui-ci de Phil Whelan
http://www.bigfastblog.com/how-to-get-experience-working-with-large-datasets
http://www.freebase.com/ : A community-curated database of well-known people, places, and things
Google Public Data
http://www.google.com/publicdata/explore?ds=dj48l9qpd27ep_
http://hadoopilluminated.com/hadoop_illuminated/Public_Bigdata_Sets.html
02/01/16: un dataset de 1To déposé sur MS Azure par Criteo.
Une jolie liste a été publiée ici:
http://www.datasciencecentral.com/profiles/blogs/great-github-list-of-public-data-sets
Je complète ce post par celui-ci de Phil Whelan
http://www.bigfastblog.com/how-to-get-experience-working-with-large-datasets
http://www.freebase.com/ : A community-curated database of well-known people, places, and things
Google Public Data
http://www.google.com/publicdata/explore?ds=dj48l9qpd27ep_
http://hadoopilluminated.com/hadoop_illuminated/Public_Bigdata_Sets.html
02/01/16: un dataset de 1To déposé sur MS Azure par Criteo.
Comments
Post a Comment