目标:使用实践策略形成某个领域的最小全局认识,理解该领域的信息分布规律以及分析框架。
什么是信息?
比特与原子:世界由信息和物质构成。不同历史周期,信息和物质所占权重不一样,信息密度不同。
信息的定义:
- 香农:凡是在一种情况下能减少不确定性的任何事物,都叫信息。
- 钟义信:信息是实物运动的状态及其改变形式。
- Ronaldo Vigo:信息是需要至少两个相关实体进行定量意义上的概念。
最大信息熵原理 MIP
全唐诗的熵值:
信息分布六大原理
- 布拉德福定律:侧重信息的集中与离散分布
如将科学杂志按其刊载某学科主题的论文数量,以递减顺序排列,就可在所有这些杂志中区分出载文率最高的核心部分和包含着与核心部分等数量论文的随后几区,这时核心区和后继各区中所含的杂志数成 1:α:α:⋯⋯的关系(α>1)。
设Bradford常数为5,当核心期刊数量为20时,外围一区和二区期刊数量各是多少? - 洛特卡定律:侧重信息的作者分布
发表1篇论文的作者占作者总数的60.79%,发表2篇论文的作者数量是发表1篇论文的作者数量的1/4……发表n篇论文的作者数量是发表1篇论文的作者数量的
当某领域中写6篇文献的作者数量为1000人时,该领域中写1篇文献的作者数量是多少?估计该领域中作者总量是多少?
发表1篇文献的作者数量X=1000*6=36000
作者总数Y=36000/0.6079=59220 - 齐夫定律:侧重词与其频次之间关系的经验规律
在自然语言的语料库里,一个单词出现的频率和它在频率表里的排名成反比。所以,频率最高的单词出现的频率大约是出现频率第二的单词的2倍,而出现频率第二的单词则是出现频率第四的单词2倍。
人们最容易坚持的信息分析习惯是什么?人类最容易坚持的习惯遵循“最省力法则”。
齐夫定律三个推论:- 开放(Openness)会战胜封闭(Closeness);
- 人们会大量引用熟悉的信息;
- 差异化程度决定核心竞争力。
有三种方法翻过一座山:打隧道;坐飞机;徒步。根据最省力法则,大多数人会采用最简单的第3个方案。但是,如果有人构建另一条省力通道(比如打隧道),就能率先获得差异化优势。也会有越来越多的人沿着这条更省力的通道行进。
- 文献增长率:信息量随着时间而不断增加的经验规律
普莱斯(Price)在《巴比伦以来的科学》一书中,提出以科技文献量为纵轴,以历史年代为横轴,不同年代的科技文献量的变化过程表现为一根光滑的曲线。这条曲线十分近似地表示了科技文献量指数增长的规律。
Price定律:
如果一个领域初始文献是100篇,即Q(0)=100,当常数b=1,十年后,估计文献量Q(10)将达到2202624。在某些领域(比如哲学、艺术学),追根溯源,找到初始100篇文献,先进行阅读会不会更有好处呢? - 文献老化率:信息价值随时间推移不断下降的规律
中国学者邱均平在1988年《文献计量学》中整理了不同学科的“半生期”,比如,物理学的半生期是4.6,而地质学的半生期是11.8。所以不同学科研究的切入点也不同,研究哲学必须要看经典著作,而研究计算机科学重要的是顶会论文。 - 信息计量的大一统模型
科学计量学学者叶鹰和他的合作伙伴Ronarld Rousseau,尝试使用波动-扩散方程组将上述5个模型统一在一起:。
构建信息分析系统
第一步:信息获取OSINT
- 文献信息源:媒体、上市公司年报、广告、公告、行业著作、专业社区。
- 非文献信息源:广播、电视、口头交流、实物、会议、沙龙、演讲、社交网络。
开源信息分析工具箱OSINT(Open-source intelligence),包含以下信息源:
搜索引擎 | 社交媒体 | 工具类搜索 | 特定文件 |
---|---|---|---|
一般搜索 | 主要社交网络 | 电子邮件搜索 | 文档和幻灯搜索 |
主要国家搜索 | 博客检索 | 用户名搜索 | 代码搜索 |
元搜索 | 论坛检索 | 工作搜索 | 信息图表和数据可视化 |
专业搜索 | 社交媒体工具 | 写作和办公工具 | 书籍与阅读 |
视觉搜索和群集搜索引擎 | 推特 | 隐私和加密工具 | 数据和统计 |
第二步:信息整理zotero
第三步:信息分析
通过某个信息源发现某种现象,再和其他信息源交叉验证,快速得出初步印象。
第四步:信息报告
记录并复盘前面的步骤。其中常犯错误:
- 不知道特定领域的数据库,从而错过重要数据
- 对有用的信息视而不见
全局认识
真正的教育
:广义教育下的知识应在学习者未来的生活中更具有生活价值,否则,它就只会裹挟着学习者一同走向灭亡。全局认识
:全局性理解(Big Understandings)由珀金斯提出,指的是那些能够帮助我们理解世界,与生活息息相关的那些业余的专业知识。
全局认识的判断标准
深刻理解 | 行动 | 伦理道德 | 机会 | |
---|---|---|---|---|
二元方程 | 是数学领域内技术性理解的基础部分 | 能为学习者提供解决有限的几类特定问题的工具 | 无甚可言 | 仅仅是一种了解性知识 |
有丝分裂 | 是生物领域内技术性理解的基础部分 | 几乎不能支持学生为任何事做好准备 | 无甚可言 | 仅仅是一种了解性知识 |
全局认识反常识的地方
最小全局认识:时空变量关系
- 年/月/周/日:对时间的最小全局认识
- Google:信息检索入口
- 3C战略三角:快速了解一个领域
- SWOT
生活中存在大量的信息入口,但同时也存在着严重的信息冗余。最小全局认识用尽量少的信息入口,获得全局性的理解。