深色模式
第 02 章 计算机通用基础
学习目标
本章目标不是成为计算机专业学生,而是能应对理论题中的基础概念:硬件、操作系统、网络、数据结构、算法和信息安全。
考点地图
常考:CPU、内存、存储层次、进程线程、死锁、TCP/UDP、HTTP/HTTPS、数据结构、排序查找、CIA 安全三要素。
1. 计算机组成
计算机基本组成包括:运算器、控制器、存储器、输入设备、输出设备。
1.1 CPU
CPU 是中央处理器,包括:
- 运算器:执行算术和逻辑运算。
- 控制器:控制指令执行流程。
- 寄存器:CPU 内部高速小容量存储。
AI 训练中还常见 GPU。GPU 擅长并行矩阵运算,所以深度学习训练常用 GPU。
1.2 存储器
存储层次从快到慢:
寄存器 -> Cache -> 内存 RAM -> SSD/HDD -> 网络/云存储。
规律:越快越贵、容量越小;越慢越便宜、容量越大。
1.3 内存与外存
- 内存:速度快,断电数据丢失,存放正在运行的程序和数据。
- 外存:硬盘、SSD,断电不丢失,长期保存数据。
2. 指令集和体系结构
- x86:常见于 PC 和服务器,生态成熟。
- ARM:常见于手机、嵌入式、边缘设备,能效高。
- GPU/CUDA:用于并行计算和深度学习加速。
考试常见点:ARM 不是操作系统,x86 不是编程语言,它们是处理器体系结构/指令集相关概念。
3. 操作系统基础
操作系统负责管理硬件和软件资源。
3.1 进程与线程
| 概念 | 含义 |
|---|---|
| 进程 | 正在运行的程序实例,拥有独立地址空间 |
| 线程 | 进程中的执行单元,同一进程内线程共享资源 |
| 并发 | 多任务交替执行,看起来同时推进 |
| 并行 | 多任务真正同时执行 |
3.2 进程状态
常见状态:
- 就绪:等待 CPU。
- 运行:正在占用 CPU。
- 阻塞:等待 I/O 或资源。
3.3 死锁
死锁是多个进程互相等待资源而无法继续。
四个必要条件:
- 互斥:资源一次只能被一个进程使用。
- 占有并等待:持有资源同时等待新资源。
- 不可剥夺:资源不能被强制抢走。
- 循环等待:形成等待环。
破坏任一条件都可能预防死锁。
3.4 内存管理
- 虚拟内存:让程序看到连续、较大的地址空间。
- 分页:把内存分成页管理。
- 页面置换:内存不足时换出页面,如 LRU。
4. 数据结构
| 数据结构 | 特点 | 高频用途 |
|---|---|---|
| 数组 | 连续存储,随机访问快 | 矩阵、向量 |
| 链表 | 插入删除方便,随机访问慢 | 动态集合 |
| 栈 | 后进先出 LIFO | 函数调用、括号匹配 |
| 队列 | 先进先出 FIFO | 任务排队、消息队列 |
| 哈希表 | 平均 O(1) 查找 | 字典、去重 |
| 树 | 层次结构 | 决策树、索引 |
| 图 | 点和边 | 路径规划、网络关系 |
5. 基础算法
5.1 排序
| 算法 | 平均复杂度 | 特点 |
|---|---|---|
| 冒泡排序 | O(n²) | 简单,效率低 |
| 插入排序 | O(n²) | 小规模或近乎有序时可用 |
| 快速排序 | O(n log n) | 平均快,最坏 O(n²) |
| 归并排序 | O(n log n) | 稳定,需要额外空间 |
| 堆排序 | O(n log n) | 原地,不稳定 |
5.2 查找
- 顺序查找:逐个找,O(n)。
- 二分查找:有序数组中查找,O(log n)。
- 哈希查找:平均 O(1)。
5.3 图算法
- BFS:广度优先,适合最短步数。
- DFS:深度优先,适合连通性、回溯。
- Dijkstra:非负权最短路径。
6. 计算机网络
6.1 网络分层
| 层次 | 常见协议/设备 | 作用 |
|---|---|---|
| 应用层 | HTTP、HTTPS、DNS、FTP | 面向用户应用 |
| 传输层 | TCP、UDP | 端到端传输 |
| 网络层 | IP、ICMP、路由器 | 寻址和路由 |
| 数据链路层 | Ethernet、交换机 | 局域网帧传输 |
| 物理层 | 网线、光纤、无线 | 比特传输 |
6.2 TCP 与 UDP
| 项目 | TCP | UDP |
|---|---|---|
| 连接 | 面向连接 | 无连接 |
| 可靠性 | 可靠、按序 | 不保证可靠 |
| 开销 | 较大 | 较小 |
| 场景 | 网页、文件传输 | 直播、语音、实时游戏 |
6.3 HTTP 与 HTTPS
- HTTP:明文传输。
- HTTPS:HTTP + TLS,提供加密、身份认证、完整性保护。
6.4 DNS
DNS 把域名解析成 IP 地址。比如把 example.com 转成服务器 IP。
7. 信息安全基础
CIA 三要素:
- Confidentiality:机密性,防止未授权读取。
- Integrity:完整性,防止数据被篡改。
- Availability:可用性,服务可访问。
其他概念:
- 身份认证:确认你是谁。
- 授权:确认你能访问什么。
- 审计:记录操作行为。
- 加密:保护数据内容。
- 哈希:生成摘要,常用于完整性校验。
- 数字签名:确认身份、防抵赖、防篡改。
易错点
| 易错点 | 正确理解 |
|---|---|
| 线程拥有完全独立地址空间 | 错。进程有独立地址空间,同一进程线程共享资源 |
| UDP 一定比 TCP 好 | 错。UDP 快但不保证可靠,场景不同 |
| HTTPS 只是 HTTP 换了端口 | 错。HTTPS 使用 TLS 提供安全能力 |
| 哈希是加密 | 不准确。哈希是单向摘要,不是可逆加密 |
| 二分查找可以用于任意数组 | 错。通常要求数组有序 |
例题
例题 1
栈的特点是:
A. 先进先出
B. 后进先出
C. 随机访问
D. 分布式存储
答案:B。
解析:栈是 LIFO,队列是 FIFO。
例题 2
HTTPS 相比 HTTP 主要增加了:
A. 加密、认证和完整性保护
B. 图像识别能力
C. 数据库索引
D. 模型训练能力
答案:A。
例题 3
死锁产生的必要条件包括:
A. 互斥
B. 占有并等待
C. 不可剥夺
D. 循环等待
答案:ABCD。
自测清单
- 能区分进程和线程。
- 能说出 TCP 和 UDP 的差别。
- 能说出 HTTP 和 HTTPS 的差别。
- 能默写 CIA 三要素。
- 能区分栈、队列、哈希表、树、图。