萨缪尔https://zhuanlan.zhihu.com/p/77359619

数据搜集与整理是一个非常繁琐的工作,但是确实是咨询行业入门的基本要求,那么一般的咨询机构对数据和信息搜集的要求有哪些呢?首先需要了解信息搜集的目的,搜寻目标的基本情况,以及大致的信息来源和渠道,在质量方面要满足颗粒度和广度的要求,并且要进行交叉验证,经得起推敲,最后是需要和工作进度进行有机结合。

一、明确信息搜集的目的

用来解决什么问题?
用来证明/证伪某个观点?

二、将问题分解为具体维度的数据或信息

这一步应该是最难的,需要采用MECE的原则对问题进行分解,明确到具体的数据或信息,一般数据可以到以下两种形式:
1. 使用直接指标:有直接相关的指标可以利用,例如反映经济发展水平的GDP。
2. 使用替代指标:没有直接相关的指标,但是可以使用替代指标,例如要说明X行业并购市场的活跃度,如果选择最直接相关的“并购资金规模”这个维度/指标,那这些数据是很难获取的,但可以使用“并购案例数目”来代替,也是能达到目的的。

三、选择合适的渠道进行数据搜集

为了便于大家理解和记住数据的来源,我们根据数据的出处和来源信息进行了专门的分类
为此可以分为六个主要的数据来源:
1、政府及监管机构和行业协会
政府机构/事业单位包括通用层次的统计局以及特定领域的管辖机构,比如人行、工商局、教育局、卫计委、食药监局、银保监会、工业与信息化部、上海证券交易所等。行业协会主要是指某些成熟的行业,比如中国保险协会、中国银行业协会等,他们会定期的发布报告。
国家统计局http://www.stats.gov.cn/,可查询经济、文化、人口等各领域的常用宏观数据,如GDP、出口额、CPI、PMI、总人口及人口结构、社会消费品零售总额、线上销售总额、分行业市场规模等数据,非常官方权威
中央人民政府政策相关http://www.gov.cn/zhengce/index.htm,可以查询国家发布的政策、中央有关文件等,PEST分析中很多政策出处都来源于此处
中国人民银行http://www.pbc.gov.cn/,可查询社会总资规模、货币供应量、外汇储备、利率变化、汇率、shibor等金融领域的权威数据。
CNNIChttp://www.cnnic.net.cn/,可查询互联网网络相关的调查报告,如网民数量、分领域用户规模、细分互联网领域调查报告等,互联网从业者必看网站之一
US BFR美联储官网http://www.federalreserve.gov,美联储官方网站,金融市场相关的历史数据都具备,金融行业从业者必看网站之一
CIAhttps://www.cia.gov.html,这个网站不多做介绍,里面有很多好玩的研究报告,供大家自己研究
UN Comtrade联合国商品贸易统计数据库http://comtrade.un.org/data/,这是官方国际贸易统计数据和相关分析表的存储库,功能强大,所有数据均可通过专门的API访问,这是做全球贸易分析的同学常收藏的网站之一。
World Bank世界银行http://databank.worldbank.org/data/home.aspx,可查询免费并公开获取世界各国的发展数据
WTOhttp://stat.wto.org,WTO就不多做介绍了,大家可以去查阅。

2、咨询公司和研究机构的报告
常见有MBB/德勤/罗兰贝格/埃森哲;尼尔森/益普索/艾瑞/易观智库等。平时可以参考咨询公司或市场调查公司的排名、分类及擅长领域
咨询公司:
BCG: http://www.bcg.com.cn
ATK: https://www.atkearney.com/ideas-insights
RolandBerger: https://www.rolandberger.com/
研究机构
Nielsen: http://www.nielsen.com
Ipsos: http://ipsos.com/knowledge/overview
Gartner: http://www.gartner.com
HIS: https://technology.ihs.com/Research-by-Market

3、券商研究报告
通常可以借助券商、萝卜投研、慧博、乐晴智库等获取
萝卜投研: https://robo.datayes.com/v2/home
MorganStanley: http://www.morganstanley.com
JP Morgan:http://www.jpmorganchina.com.cn
GoldmanSachs: http://www.goldmansachs.com

4、专业数据库
例如Wind/同花顺/雪球等,一般特定行业会有专门的数据库,行业的机构会购买

5、公司年报与招股书
重点关注管理层经营分析、财务报表、业务概述等相关内容
巨潮网 http://www.cninfo.com.cn/new/index
美国 https://www.sec.gov
香港 https://sc.hkexnews.hk
证监会 http://www.csrc.gov.cn/pub/newsite/xxpl/yxpl/
新三板 http://www.neeq.com.cn/
上交所 http://www.sse.com.cn/ 伦敦证券交易所 https://www.londonstockexchange.com/home/homepage.htm
非上市公司可以查看证监会的预披露,如果发债券的话,也会有相关的财报信息披露,如华为发债相关信息一般会在下面的渠道披露
非金融企业债务工资工具注册信息系统http://zhuce.nafmii.org.cn/fans/publicQuery/manager上海证券交易所债券披露 http://www.sse.com.cn/market/bonddata/data/eb/

6、一手数据:用户问卷调研、专家访谈、实地探测访谈等都可借助市场调研公司来解决;随着信息技术的发展,现在又多了爬虫获取一手数据的方式。
问卷一般针对的是客户/消费者等个体,目的是探究客户群体中的一些共性,比如客户画像、消费行为、购买偏好等。一般情况下,问卷的作用很难被代替,但投入的资源也比较多。
访谈主要有焦点小组(Focus Group),有陌生电话(Cold Call),也有专家访谈(Expert Interview)。焦点小组的目的与问卷类似,也主要用于收集消费者的反馈信息。
陌生电话是咨询公司最常用的手段之一,基本适用于任何行业的任何访谈对象,缺点是成功率低,耗时间(所以才会招那么多PTA)。
专家访谈也是最为常用手段,主要是通过人脉关系或者第三方的专家平台约访行业专家。这些业内资深人士往往对行业有着非常深刻地认识与了解,同时也具备更为灵敏的行业直觉。

7、此外,还有一些知名公司及其研究院(例如阿里研究院)、特定领域垂直网站(如雪晴网、巨潮资讯等)也会发布一些报告,可以参考
8、补充:行业数据库来源(欢迎大家在下方留言)


四、多方验证数据合理性
1. 为什么要做数据验证?
为了避免某一渠道的数据不准确,从而造成结论的错误,故而需要多方验证数据的合理性。

2. 如何进行数据验证?发现不一致怎么办?
(1)横向对比:差距不大,按需选择;差距很大,检查是否是口径、数据源不同等
(2)纵向时间对比:多找几年的数据对比看趋势是否合理
(3)专家验证:通过专家访谈、cold call等方式验证

最后,建议你们在看第三方材料时,发现数据来源的那里都关注下,并自己去浏览下该来源,看看对你是否有价值,如果有的话就收藏起来,这样,你的数据来源就会越来越丰富,希望你们早日建立起你们自己所在行业的数据来源体系。
如果有数据搜集上的问题,欢迎大家私信交流