一 计算机系统漫游

  1. #include <studio.h>
  2. int main(){
  3. printf("Hello World!\n");
  4. return 0;
  5. }

HelloWorld 程序编译过程

image.png

预处理阶段

预处理器(cpp)根据以字符#开头的命令,修改原始的C程序。结果是得到另一个C程序,通常是以 .i 作为扩展名。

编译阶段

编译器(ccl)将文本文件 .i 翻译成文本文件 .s ,包含一个汇编程序。

汇编阶段

汇编器(as)将 .s 文件翻译成语言指令,把这些指令打包成一种叫做可重定位目标程序的格式,并将结果保存在目标文件 .o文件 。 .o 文件包含了main函数的指令编码。

链接阶段

连接器(ld)负责将使用的标准C库的函数合并到 .o 文件中,得到可执行目标文件。可执行目标文件可被加载到内存进行执行。

系统硬件组成

https://www.yuque.com/docs/share/0e166e64-5903-46ff-b179-fd17216cdd3f?# 《计算组成原理》
image.png

总线

总线通常被设计成传送定长的字节块,也就是字。携带信息字节并负责在各个部件间传递。
地址总线、数据总线、控制总线。

I/O设备

每个I/O设备通过一个控制器或适配器与I/O总线相连。控制器和适配器之间的区别主要在于他们的封装方式。控制器是I/O设备本身或者系统的主印制电路板上的芯片组;而适配器则是一块插在主板插槽上的卡。主要功能是在I/O总线和I/O设备之间传递信息。

主存

主存是由一组动态随机存取器(DRAM)芯片组成的。从逻辑上,存储器是一个线性的字节数组,每个字节都有其唯一的地址,这些地址是从零开始的。

处理器

程序计数器PC:处理器的核心是一个大小为一个字的存储设备(或寄存器),称为程序计数器(PC)。任何时刻,PC都指向主存中的某条机器语言指令(含有该条指令的地址)。
算术逻辑单元ALU
image.png

高速缓存

image.png

存储设备层次结构

image.png

操作系统管理硬件

image.png

操作系统的基础功能:(1)防止被失控的应用程序lanyards;(2)向应用程序提供简单一致的机制来控制复杂而又通常大不相同的低级硬件设备。

通常通过几个抽象感念(进程、虚拟内存、文件)来实现以上2个功能。

文件是对I/O设备的抽象,虚拟内存是对程序存储器的抽象,进程是对一个正在运行的程序的抽象,虚拟机是对整个计算机的抽象。

进程

进程是操作系统对一个正在运行的程序的一种抽象。在一个系统同时运行多个进程。
image.png
image.png
进程的上下文切换示例
image.png

线程

一个进程可以由多个线程的执行单元组成,每个线程运行在进程的上下文中,共享同样的代码和全局数据。
线程比进程之间更容易共享数据,线程也比进程更高效。

虚拟内存

image.png

程序代码和数据

对所有进程来讲,代码是从同一固定地址开始,紧接着和全局变量相对应的数据位置。代码和数据区是直接按照可执行目标文件的内容初始化,

代码和数据区紧随着运行时堆。代码和数据区在进程一开始运行时就被指定了大小,但与之不同的是,当调用malloc和free这样的C标准库函数时,堆可以在运行时动态地扩展和收缩。

共享库

大约在地址空间的中间部分是一块用来存放C标准库和数学库这样的共享库的代码和数据的区域。

位于用户虚拟地址空间顶部的是用户栈,编译器用它实现函数的调用。和堆一样,用户栈在程序执行期间可以动态扩展和收缩。

内核虚拟内存

地址空间顶部区域是为内核保留的,不允许应用程序读写这个区域的内容或直接调用内核代码定义函数。相反,它们必须调用内核来执行操作。

文件

系统之间的网络通信

image.png

Amdahl定律

image.png

并发与并行

线程级并发

image.png
image.png
超线程:也称为同时多线程,是一项允许一个CPU执行多个控制流的技术。涉及CPU某些硬件有多个备份,比如程序计数器和寄存器文件,而其他硬件部分只有一件,不如算术逻辑单元。

多处理器可以从2个方面提高系统性能:(1) 减少了多个任务时模拟并发的需要;(2)可以使应用程序运行得更快。

指令级并行

流水线(pipelining),在流水线中,将执行一条指令所需要的活动划分为不同的步骤,将处理器硬件组织成一系列的阶段,每个阶段执行一个步骤。这些阶段可以并行地操作,用来处理不同指令的不同部分。,

单指令、多数据并行

在最低层次上,许多现代处理器拥有特殊的硬件,允许一条指令产生多个可以并行执行的操作,这种操作称为单指令、多数据,即SIMD并行。

二 信息的表示和处理

信息存储

大多数计算机使用8位块,或者字节(byte),作为最小的可寻址的内存单位,而不是内存中的单独的位。机器级程序将内存视为一个非常大的字节数组,称为虚拟内存(virtual memory)。内存的每一个字节都是由唯一的数字来标识,称为地址,所有可能地址的集合称为虚拟地址空间(virtual address space)。
虚拟地址空间只是展现给机器级程序的概念性映像,实际是将动态随机访问存储器(DRAM)、闪存、磁盘存储器、特殊硬件和操作系统软件结合起来,为程序提供一个看上去统一的字节数。

十六进制

image.png
image.png

字数据大小

image.png
image.png

寻址和字节顺序

image.png

表示字符串

C语言中字符串编码为一个以null(其值为0)字符结尾的字符数组。每个字符都有某个标准编码来标识,最常见的是ASCII码。

布尔代数简介

image.png
image.png

布尔环

对于任何值a,有a^a=0,(a^b)^a=b;
布尔环应用:不用额外变量交换两个数

public void swap(int x,int y){
    x = x ^ y;
    y = x ^ y;
    x = x ^ y;
}

移位运算

image.png
image.png

整数表示

整型数据类型

C语言32位和64位机器整型数据类型取值范围
image.png
image.png

无符号数编码

image.png
image.png

补码编码

image.png
image.png

image.png
image.png
image.png