世界银行:https://data.worldbank.org.cn/
联合国:https://www.un.org/zh/databases/index.html
中国国家数据: http://data.stats.gov.cn/
牛津大学项目: https://ourworldindata.org/
IMF 国际货币基金组织(与世界银行同为世界两大金融机构):https://www.imf.org/en/Data
IFS:http://www.ifs.du.edu/ifs/frm_MainMenu.aspx
经济合作与发展组织 OECD:http://oecdchina.org/statistics/index.html
大学的校园网数据库,这个看各个学校的神通了 The Statistics Portal:https://www.statista.com/
完美数据库,就是要付费… 大数据导航:https://hao.199it.com/
GitHub整理(38.2k个star):https://github.com/awesomedata/awesome-public-datasets
kaggle里提供的dataset,比如YouTube相关:https://www.kaggle.com/datasnaek/youtube-new(大概六个月的趋势数据,用的YouTube API 有爬虫代码)
Google数据集搜索:https://toolbox.google.com/datasetsearch
票房相关: http://endata.com.cn/ http://www.cbooo.cn
财经python包tushare也可以加载票房数据 百度指数、Google指数
天天基金数据:https://github.com/weibycn/fund
量化交易:https://github.com/shinnytech/tqsdk-python
数据接口:百度、谷歌、头条、微博指数,宏观数据,利率数据,货币汇率,千里马、独角兽公司,新闻联播文字稿,影视票房数据,高校名单,疫情数据…
https://github.com/justinzm/gopup
直播网站数据爬取
NBA数据:https://github.com/vboar/NBA-Deworm
对联数据:https://github.com/wb14123/couplet-dataset
毒鸡汤数据:https://github.com/wwcxjun/soul
新华字典数据:https://github.com/pwxcoo/chinese-xinhua
中文语料库:https://github.com/InsaneLife/ChineseNLPCorpus
Twitter数据:https://github.com/hrwhisper/twitterDataMining
鞋穿不炒-毒APP数据:https://github.com/luo1994/du-app-sign
国家统计局数据:https://github.com/yiyuezhuo/National-Data
电商数据:https://github.com/LiuXingMing/Tmall1212
大众点评商品数据:https://github.com/ppy2790/dianpingshop
大众点评评论数据:https://github.com/py-bin/dianping_textmining
网易云音乐爬虫:https://github.com/GreatV/CloudMusic-Crawler
小红书:https://github.com/SmileSmith/tiny-red-book
省市银行数据:https://github.com/ALawating-Rex/AreaAndBanks
商圈数据:https://github.com/kzgame/china_regions
py2neo:https://github.com/Skyellbin/neo4j-python-pandas-py2neo-v3
量化交易分析:https://github.com/plouto-quants/FBDQA-2019A
天勤量化:https://github.com/shinnytech/tqsdk-python
12306数据:https://github.com/metromancn/Parse12306
财务报表分析:https://github.com/1qweasdzxc/python
马蜂窝旅游数据:https://github.com/DWJWendy/mafengwo_spider
股票数据:https://github.com/DataIntegrationAlliance/data_integration_celery
百度-高德POI数据:https://github.com/liujiao111/poi
金融文本开放数据:https://github.com/smoothnlp/FinancialDatasets
豆瓣电影数据:https://github.com/csuldw/AntSpider
手机号码归属地:https://github.com/ls0f/phone
极客时间数据分析:https://github.com/xiaomiwujiecao/DataAnalysisInAction
中国古典小说:https://github.com/luoxuhai/chinese-novel
拍拍贷风控数据:https://github.com/ttloveyy/PPD-data-mining
微信10w+文章数据:https://github.com/caiyongji/wechat-ranking
药物数据:https://github.com/MenglinLu/Web-crawler
量化数据:https://github.com/JoinQuant/jqdatasdk
量化K线图数据展示:https://github.com/onewaymyway/stockdata
中文-NLP数据搜集:https://www.cluebenchmarks.com/dataSet_search.html
中文-自然语言数据:https://zhuanlan.zhihu.com/p/70355773
