Loading...

单核上的多线程-Python中的 GIL

Created2017-12-01|Updated2026-07-21|工程实践

|Word Count:191|Reading Time:1mins|Post Views:

GIL （Global Interpreter Lock）的存在虽然无法利用多核，但是可以勉强让系统在在单核上，任何一个线程使用过多时间片/主动放弃 CPU 的时候，让其他线程上下文切入进来。算是尽量跑满CPU吧。Python中的对象很多都是默认线程安全的，GIL的这种不可见的特性，让很多旧的程序依赖起 GIL，以至于无法从Python中移除掉它。GIL 的存在，让 Python 特别适合跑 Nodejs 爬虫一样的 IO 密集型（IO-bound）任务，反而不适合跑CPU 密集型任务（CPU-bound）。但实际上这种混蛋多线程的形式，恐怕还不如 EventLoop 的 Nodejs，因为多了很多 Context Switch 的代价。

Author: magicliang

Link: https://magicliang.github.io/2017/12/01/%E5%8D%95%E6%A0%B8%E4%B8%8A%E7%9A%84%E5%A4%9A%E7%BA%BF%E7%A8%8B-Python%E4%B8%AD%E7%9A%84%20GIL/

Copyright Notice: All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.

Related Articles

用 Python 写一台图灵机

上一篇文章已经写出一台最小 DTM：读取当前格，写入一个符号，移动读写头，然后停机。那台机器能展示图灵机的组成，但还不像一段程序。本文复用同一套 Python 结构，把图灵机写成一个更接近算法的例子：对纸带上的二进制数加一。输入是 1011，输出是 1100。机器需要先移动到数字右侧的空白格，再从右向左处理进位。这个过程会经过多个状态和多次纸带改写，适合观察“有限控制 + 可变纸带”怎样形成完整计算。二进制加一的规则二进制加一可以拆成两个阶段。第一阶段从最左侧开始，一直向右移动，直到读到数字后面的空白格 _。第二阶段从空白格左移一格，开始处理进位：当前符号写入符号下一步 1 0 继续向左进位 0 1 进位结束，停机 _ 1 数字整体增长一位，停机以 1011 为例，最右侧两个 1 都会变成 0，左边的 0 变成 1，结果得到 1100。 11011 + 1 = 1100 这里需要两个控制状态：状态含义 seek_right 向右寻找数字末尾 carry 从右向左处理进位 halt 计算完成图灵机的状...

停机问题：为什么某些判断没有通用程序

上一篇文章用寄存器机解释器说明了通用性：程序可以编码成数据，解释器可以读取这份数据并模拟执行。通用性带来强大表达能力，也带来一个边界问题：能不能写一个程序，判断任意程序在任意输入上是否会停机。答案是否定的。停机问题说明，不存在一个对所有程序和输入都正确的通用停机判定器。工程里可以做超时、步数限制、静态分析和资源预算，但这些方法要么不完整，要么会保守拒绝，要么只覆盖有限范围。本文先用一个可运行的有界检查器展示工程近似，再用自引用反证解释为什么通用判定器不存在。问题形式停机问题可以写成一个理想函数： 1halts(program, input_data) -> True / False 它的承诺是：返回值含义 True program(input_data) 最终会停机 False program(input_data) 会一直运行难点在“任意程序”和“任意输入”。判断某个具体程序很容易；判断所有程序则会遇到自引用。工程里常见的近似：有界执行最朴素的方法是只运行有限步。如果步数内停机，就返回 True；如果步数用完还没停，就返回 Fa...

回到工程：计算理论怎样改变写代码的眼光

这个系列从《计算的本质》重新出发，用 Python 重写核心实验，再把每个模型映射到 Java 程序员熟悉的工程结构。一路走下来，主题并不是记住更多术语，而是换一种方式观察程序。程序可以是语法树，执行可以是规约，协议可以是自动机，嵌套可以靠栈，通用计算可以由解释器承载，分析工具也可以承认不精确并保持有用。本文不再引入新模型，只把前面十几篇文章收束成一张工程地图。概念地图先把系列里最重要的模型压成一段可运行的概念地图。 12345678910concept_map = [ ("AST / 语义", "解释器、DSL、规则执行"), ("DFA / NFA / 正则", "协议状态、校验器、词法分析"), ("PDA / 栈", "parser、嵌套结构、调用栈"), ("图灵机 / 通用性", "VM、脚本引擎、程序作为数据"), ("停机问题 / 抽象解释", &...

小步语义：把程序执行拆成一步一步的规约

上一篇写了大步语义。大步语义像一次函数调用：给它程序和环境，它直接返回最终环境。小步语义换了观察角度：程序运行时会经历一串中间配置，每一步只做一个局部变化。这个视角很适合 Java 程序员理解调试器、解释器、状态机和工作流引擎。断点、单步执行、重试、恢复、超时保护，都依赖“当前程序状态可以被保存，下一步可以被明确计算”。本文继续使用上一篇的小语言，补上小步语义（small-step semantics）。核心目标很直接：把一个完整程序改写成一台可推进的机器。程序状态变成机器配置小步语义关心的是配置之间的变化。 1(statement, environment) -> (next_statement, next_environment) statement 是剩余要执行的程序，environment 是当前变量绑定。每执行一步，语句可能变小，环境也可能变化。例如： 12(x = 1 + 2, {}) -> (x = 3, {})(x = 3, {}) -> (do-nothing, &...

非确定性有限自动机：一次保留多个可能世界

DFA 每次只处在一个状态里。读取一个字符，规则表给出唯一的下一个状态。这个约束让 DFA 很容易实现，也让它的执行轨迹很干净：current_state + character -> next_state。非确定性有限自动机（Nondeterministic Finite Automaton，NFA）放宽了这个约束。同一个状态读取同一个字符时，可以走到多个下一状态；机器还可以在不消耗字符的情况下移动到别的状态。NFA 的实现方式并不神秘：把“当前状态”从单个值改成一个集合，一次保留所有可能路径。这篇文章用 Python 写一个 NFA，识别两个字符串：ab 和 ba。这个示例足够小，但能完整覆盖 NFA 的两个核心机制：分支和空转移。非确定性不是随机 “非确定性”容易被误解成机器随机选择一条路。NFA 的更好理解是：同一时刻保留多条候选路径，只要其中一条路径最后进入接受状态，整个输入就被接受。问题 DFA NFA 当前状态一个状态一组状态同一输入的下一状态唯一可以有多个是否允许不读字符就移动不允许允许接受条件当前状态...

确定性有限自动机：状态、输入和接受条件

上一篇用指称语义把程序翻译成 Python 函数。程序语义这一段到这里已经形成闭环：AST 给出结构，大步语义、小步语义和指称语义分别给出不同角度的含义。接下来进入自动机。问题从“程序怎样执行”换成“机器怎样根据输入移动到下一个状态”。确定性有限自动机（Deterministic Finite Automaton，DFA）是自动机部分的起点。它没有变量表，没有栈，没有堆，也没有可写纸带；它只记住一个当前状态，然后逐个读取输入字符。每读一个字符，机器就根据一张规则表换到下一个状态。输入读完后，当前状态如果属于接受状态，字符串就被接受；否则被拒绝。这个模型很小，却足够解释很多工程直觉：订单状态流转、协议解析、词法分析、简单规则匹配，都可以先压成“当前状态 + 输入 -> 下一个状态”的形式。从业务状态机收缩到形式模型 Java 程序员对状态机并不陌生。订单可以从 CREATED 变成 PAID，再变成 SHIPPED；审批单可以从 DRAFT 变成 SUBMITTED，再变成 APPROVED 或 REJECTED。这些状态机通常带着业务动作、数据库事务、权限检查、通知...

Loading Database