世界银行:https://data.worldbank.org.cn/
    联合国:https://www.un.org/zh/databases/index.html
    中国国家数据: http://data.stats.gov.cn/
    牛津大学项目: https://ourworldindata.org/
    IMF 国际货币基金组织(与世界银行同为世界两大金融机构):https://www.imf.org/en/Data
    IFS:http://www.ifs.du.edu/ifs/frm_MainMenu.aspx
    经济合作与发展组织 OECD:http://oecdchina.org/statistics/index.html
    大学的校园网数据库,这个看各个学校的神通了 The Statistics Portal:https://www.statista.com/
    完美数据库,就是要付费… 大数据导航:https://hao.199it.com/
    GitHub整理(38.2k个star):https://github.com/awesomedata/awesome-public-datasets
    kaggle里提供的dataset,比如YouTube相关:https://www.kaggle.com/datasnaek/youtube-new(大概六个月的趋势数据,用的YouTube API 有爬虫代码)
    Google数据集搜索:https://toolbox.google.com/datasetsearch
    票房相关: http://endata.com.cn/ http://www.cbooo.cn
    财经python包tushare也可以加载票房数据 百度指数、Google指数

    天天基金数据:https://github.com/weibycn/fund
    量化交易:https://github.com/shinnytech/tqsdk-python

    数据接口:百度、谷歌、头条、微博指数,宏观数据,利率数据,货币汇率,千里马、独角兽公司,新闻联播文字稿,影视票房数据,高校名单,疫情数据…
    https://github.com/justinzm/gopup

    直播网站数据爬取

    NBA数据:https://github.com/vboar/NBA-Deworm

    对联数据:https://github.com/wb14123/couplet-dataset

    毒鸡汤数据:https://github.com/wwcxjun/soul

    新华字典数据:https://github.com/pwxcoo/chinese-xinhua
    中文语料库:https://github.com/InsaneLife/ChineseNLPCorpus

    Twitter数据:https://github.com/hrwhisper/twitterDataMining

    鞋穿不炒-毒APP数据:https://github.com/luo1994/du-app-sign

    国家统计局数据:https://github.com/yiyuezhuo/National-Data

    电商数据:https://github.com/LiuXingMing/Tmall1212

    大众点评商品数据:https://github.com/ppy2790/dianpingshop
    大众点评评论数据:https://github.com/py-bin/dianping_textmining

    网易云音乐爬虫:https://github.com/GreatV/CloudMusic-Crawler

    小红书:https://github.com/SmileSmith/tiny-red-book

    省市银行数据:https://github.com/ALawating-Rex/AreaAndBanks
    商圈数据:https://github.com/kzgame/china_regions

    py2neo:https://github.com/Skyellbin/neo4j-python-pandas-py2neo-v3

    量化交易分析:https://github.com/plouto-quants/FBDQA-2019A
    天勤量化:https://github.com/shinnytech/tqsdk-python

    12306数据:https://github.com/metromancn/Parse12306

    财务报表分析:https://github.com/1qweasdzxc/python

    马蜂窝旅游数据:https://github.com/DWJWendy/mafengwo_spider

    股票数据:https://github.com/DataIntegrationAlliance/data_integration_celery

    百度-高德POI数据:https://github.com/liujiao111/poi

    金融文本开放数据:https://github.com/smoothnlp/FinancialDatasets

    豆瓣电影数据:https://github.com/csuldw/AntSpider

    手机号码归属地:https://github.com/ls0f/phone

    极客时间数据分析:https://github.com/xiaomiwujiecao/DataAnalysisInAction

    中国古典小说:https://github.com/luoxuhai/chinese-novel

    拍拍贷风控数据:https://github.com/ttloveyy/PPD-data-mining

    微信10w+文章数据:https://github.com/caiyongji/wechat-ranking

    药物数据:https://github.com/MenglinLu/Web-crawler

    量化数据:https://github.com/JoinQuant/jqdatasdk
    量化K线图数据展示:https://github.com/onewaymyway/stockdata

    中文-NLP数据搜集:https://www.cluebenchmarks.com/dataSet_search.html
    中文-自然语言数据:https://zhuanlan.zhihu.com/p/70355773