Lecture 10: Concurrency 3

回顾：

互斥方法

软件方法：Peterson的解决方案
硬件方法：test_and_set() ；compare_and_swap（）
互斥锁作为提供二进制锁的抽象

并发原语

互斥锁是一种提供互斥的锁抽象。
通常由操作系统通过API（如pthreads）提供。
它们是二进制的------线程当前要么已经获得互斥锁，要么还没有！

cs 复制代码

pthread_mutex_t lock; // declaration

pthread_mutex_lock(&lock); // acquire
counter++;
pthread_mutex_unlock(&lock); // release

信号量(Semaphores)

操作系统的方法

信号量 是互斥和进程同步 的另一种抽象，通常由操作系统提供

它们有一个容量，要么是正数，要么是无穷大。
我们区分二进制 （2 valued）和计数信号量（N-valued或无界）。

2-valued（二进制）信号量

只能取 0 或 1 两个值，用来实现 互斥锁 （mutex）。

典型用法：

初始值 = 1，表示资源可用。

wait() 获取资源 → 值变为 0。

signal() 释放资源 → 值回到 1。

N-valued（计数）信号量

可以取 0, 1, 2, ..., N （甚至无上限），用来管理 N 个同类资源 。

典型用法：

初始值 = N，表示有 N 个资源可用。

每次 wait() 成功就减 1；减到 0 时，后续线程阻塞等待。

signal() 把值加 1，唤醒一个等待线程。

一句话总结：

2-valued = 互斥（锁一个资源）。

N-valued = 计数（锁多个相同资源）。

有两个函数用于操作信号量（想想counter++的例子）

当获取资源时调用wait() ，容量减少
当资源释放时调用signal（） 或*/post()* ，容量增加。

该信号量只能在其当前容量严格的情况下获取

调用post 的线程不必具有先前调用的wait。

信号量的概念定义：

cs 复制代码

typedef struct {
  int value;
  struct process * list;
} semaphore;

**wait（）的概念实现：

cs 复制代码

void wait(semaphore* S) {
  S->count--;
  if(S->count < 0) {
    //add process to S->list
    block(); // system call
  }
}

**post（）的概念实现：

cs 复制代码

void post(semaphore* S) {
  S->count++;
  if(S->count <= 0) {
    // remove process P from S->list
    wakeup(P);
  }
}

实施

当内部计数器不为正 时，调用wait（） 将阻塞进程

进程加入阻塞在信号量上的队列
进程状态 由running 变为blocked
控制权移交给进程调度程序

调用post（） 从阻塞队列 中移除可用的进程：

进程状态由blocked 变为ready
可以使用不同的排队策略来删除进程-因此避免在代码中进行不合理的假设。

队列长度是等待该信号量的进程数。
block（） 和wakeup（） 是操作系统提供的系统调用 。
post（） 和wait（） 必须是原子的。

cs 复制代码

void post(semaphore* S) {
  lock(&mutex);
  S->count++;
  if(S->count <= 0) {
    // remove process P from queue
    wakeup(P);
  }
  unlock(&mutex);
}

Posix信号量

Counter++

同一进程中的信号量可以声明为sem_t类型的变量：

*sem_init（）*初始化信号量的值
*sem_wait（）*减少信号量的值
*sem_post（）*增加信号量的值

这些函数的解释可以在手册页（man pages ）中找到，例如，在Linux命令行中输入man sem_init

cs 复制代码

sem_t s;
int sum = 0;
void* calc(void* arg) {
  int const iterations = 50000000;
  for(int i = 0; i < iterations;i++) {
    sem_wait(&s);
    sum++;
    sem_post(&s);
  }
  return 0;
}
int main() {
  pthread_t tid1,tid2;
  sem_init(&s,0,1);
  pthread_create(&tid1, NULL, calc, 0);
  pthread_create(&tid2, NULL, calc, 0);
  pthread_join(tid1,NULL);
  pthread_join(tid2,NULL);
  printf("The value of sum is: %d\n", sum);
}

这段代码在Mac上给出正确的答案吗？

答：不幸的是，在Mac上运行代码得到的答案略低于上面的100000000

编译时带有sem_init已弃用的编译器警告。
sem_init总是失败，返回−1！
使用命名信号量也可以------参见实验。
即便如此，使用命名信号量的代码必须在Mac上以root身份运行才能成功调用sem_unlink。

因此：

永远不要忽视编译器警告。
总是检查返回值------幻灯片示例由于空间原因没有这样做。
彻底测试代码-隐含的假设Mac会像Linux一样工作是错误的！
注意特定于平台的问题，例如sem_unlink在Mac的行为。
使用适当的并发原语------示例确实需要一个互斥锁。

效率：如何/何时同步

快速同步求和：

cs 复制代码

void* calc(void* increments) {
  int number_of_iterations = 50000000;
  int total = 0;
  for(int i = 0; i < number_of_iterations; i++) {
    total++; // Pretend this is non-trivial to work out
  }
  sem_wait(&s);
  sum+=total;
  sem_post(&s);
  return 0;
}

潜在问题

饥饿：设计不良的排队方法 （例如后进先出）可能导致违反公平性
死锁：两个或多个进程正在无限期地等待 一个事件，而该事件只能由其中一个等待进程引起

即，一个集合中的每个进程都在等待一个事件 ，该事件只能由同一集合 中的另一个进程引起
例如，考虑以下关于信号量的指令序列

生产者/消费者问题

问题描述

生产者 和消费者 共享一个值的缓冲区-例如，这可能是一个打印机队列。

缓冲区可以是有界的（最大大小为N），也可以是无界的。
可以有任意数量的生产者 或消费者。

如果缓冲区已满 ，生产者 将尝试添加项和块。

如果缓冲区为空 ，消费者将尝试删除项和块。

一个消费者，一个生产者，无限缓冲区

这个问题最简单的版本有一个生产者、一个消费者和一个无限大小 的缓冲区
计数器（索引） 变量跟踪缓冲区中的项数

它使用两个二进制信号量：

sync 同步对缓冲区（计数器） 的访问，初始化为1。
delay_consumer 确保消费者 在没有项目可用时阻塞，初始化为0

显然，对items的任何操作都必须是同步的
竞态条件 仍然存在：当消费者耗尽缓冲区 时，应该阻塞，但生产者 在消费者检查之前增加items

理解

二进制信号量（binary semaphore）和互斥锁（mutex）是同一件事吗？
不是。

• 二进制信号量只有 0/1 两种状态，可以用来做互斥，但 没有"所有权"概念 ：任何线程都可以 signal()，即便它之前没有 wait()。

• 互斥锁额外规定了 "谁加锁，谁解锁" 的所有权语义，并且通常支持可重入（递归锁）、优先级继承等特性。

→ 二进制信号量是"更弱"的同步原语，mutex 是专门针对互斥场景设计的。
什么时候应优先选 mutex 而不是二进制信号量？

• 需要 严格的加锁/解锁配对 （防止别的线程误释放）。

• 需要 可重入 （同一线程可多次获取）。

• 需要 优先级继承 、错误检测 （如 PTHREAD_MUTEX_ERRORCHECK）。

→ 如果目的就是 保护临界区，用 mutex；若只想做"可用/不可用"的通用同步（不限于互斥），可用二进制信号量。
有没有"简单直接"的方法验证并发代码的正确性？
没有。

• 形式化验证 （TLA⁺、Coq、模型检测）理论上可证，但成本高、门槛高。

• 静态分析工具 （Coverity、Clang ThreadSanitizer、go vet、Rust borrow checker）能发现部分竞态，但不能保证"绝对正确"。

• 动态检测/压力测试 （ThreadSanitizer、Helgrind、反复跑单元测试）可以发现很多 bug，但无法穷尽所有线程交错。

→ 实际工程中通常组合使用：编码规范 + 静态分析 + 动态检测 + 代码审查 + 压力测试。