Git：从工具到基础设施——演进与现代范式

Git 的核心对象模型——内容寻址的 KV 存储加上 DAG——从 2005 年到现在没有本质改变。但围绕它的使用方式，经历了几次明显的范式迁移：从个人工具到社会化协作平台，从手工管理到自动化工程流水线，再到 AI 时代单线程假设被打破。每一次迁移，都不是 Git 本身变了，而是它所服务的开发方式变了，工具链和工作流跟着进化。

起源：两周内诞生的工具

2005 年 4 月，Linux 内核社区和 BitKeeper 的授权协议破裂。BitKeeper 是当时内核开发使用的版本控制工具，失去它意味着几千名内核贡献者的协作方式需要立刻找到替代品。Linus Torvalds 用两周时间写出了 Git 的第一个可用版本，并在同年 6 月把 Git 本身的代码管理迁移到 Git 上。

Linus 当时的设计目标很明确：速度快、支持真正的分布式工作流、强力支持非线性开发（Linux 内核在高峰期每天接受来自世界各地数百个补丁，需要同时维护数千条并行分支）。这三个目标解释了很多看起来奇怪的设计决策——为什么 Git 的对象模型是不可变的，为什么分支只是一个文本文件，为什么克隆一个仓库得到的是完整副本而不是某种”签出”。

早期的 Git 几乎没有用户友好性可言。最初甚至没有 git merge 这个命令——Linus 用脚本完成合并，把大量操作留给用户自己组合底层命令。易用性是后来一层层叠加上去的。这个起点解释了为什么 Git 学习曲线陡峭：它从一开始就不是为了”用起来方便”而设计的，是为了”设计正确”。正确的设计才有后来二十年的持续演化，便利性是在正确性之上慢慢生长出来的。

几次质变：功能在哪些时刻改变了 Git 的边界

不是每个版本号都值得单独说，但有几个时间节点，Git 的使用方式在那之后发生了明显的转变。

GitHub 出现（2008）：Git 从个人工具变成了社会化协作平台。在 GitHub 之前，Git 是技术门槛较高的专业工具，协作主要靠邮件列表和补丁文件。GitHub 把 Pull Request 变成了协作的标准单元——一个包含代码改动、讨论记录、审查意见的完整容器。代码托管本身变成了社交网络的一种形式。这不是 Git 本身的功能变化，但它改变了数百万人使用 Git 的方式，让 Git 的影响力从内核开发者社区扩散到整个软件行业。

git rebase -i 成熟：交互式 rebase 让历史整理从高级技巧变成了日常工程习惯。能够在提 PR 之前把一批 WIP 提交压缩、重排成几个语义清晰的 commit，这件事从根本上改变了人们对提交粒度的预期——“提交应该是有意义的最小单元”开始成为共识，而不只是保存进度的按钮。

git worktree（2015，Git 2.5）：第一次打破了”一个本地仓库只有一个工作目录”的隐含假设。在此之前，同时处理两个分支意味着要么 stash 再切换，要么 clone 两份仓库。git worktree 允许从同一个 .git/ 目录检出多个工作目录，每个工作目录有自己独立的 HEAD 和 Index，但共享同一份 objects/。这个功能在发布后很长时间内都是冷门命令，直到 AI coding agent 的普及，它才迎来了真正意义上的使用场景。

git switch / git restore（2019，Git 2.23）：git checkout 承担了三种截然不同的职责——切换分支、检出文件、创建分支——这是 Git 早期设计遗留的问题之一。2.23 把这三种职责拆分给了语义明确的专用命令：switch 负责分支切换，restore 负责文件操作。这是 Git 少有的、主动改善人体工程学的时刻，说明即使是设计正确的工具，可用性也可以持续改进。

大仓库支持：随着 Monorepo 在大型公司的普及（Google、Meta、微软内部都维护规模极大的单体仓库），Git 在超大规模场景下的性能成为问题。Microsoft 为了管理 Windows 代码仓库（历史上最大的 Git 仓库之一）贡献了 VFS for Git，后来演化为 git scalar，同时推动了 sparse checkout（只检出仓库的一部分）和 partial clone（只下载需要的对象）这两个特性进入 Git 主线。这批改动让 Git 的适用边界从中小型仓库扩展到了亿级对象的规模。

SHA-256 迁移：Git 默认使用 SHA-1 计算对象哈希。2017 年 Google 证明 SHA-1 碰撞攻击是可行的（SHAttered）。Git 从 2.29 开始支持 SHA-256 仓库格式，这是对象模型层面的安全演进。迁移进展缓慢——截至目前，GitHub 还未提供完整支持——但方向是确定的。对大多数团队来说，这是需要关注但暂时不需要行动的背景信息。

Conventional Commits：提交信息的工业标准

git log 里充斥着 fix bug、update、wip、修了个问题 的仓库，维护起来有一种特定的痛苦：想知道某个版本和上一个版本之间发生了什么，只能逐条翻提交历史，没有任何结构可以利用。Conventional Commits 规范就是为了解决这个问题。

格式是：

type(scope): description

[optional body]

[optional footer, e.g. BREAKING CHANGE: ...]

type 表示这次改动的性质：feat（新功能）、fix（修复问题）、docs（文档）、refactor（重构，不改变行为）、perf（性能优化）、test（测试）、ci（CI 配置）、chore（杂务，不影响生产代码）。scope 是可选的，表示影响的模块或范围。Breaking change 在 footer 里写 BREAKING CHANGE: 前缀，或者在 type 后加感叹号：feat!: redesign auth API。

格式规范本身的意义是次要的，它真正解锁的是自动化。

自动生成 CHANGELOG：release-please、semantic-release 这类工具扫描两个 tag 之间的所有 commit message，按 type 分类，自动生成格式化的变更日志。feat 进 “Features” 节，fix 进 “Bug Fixes” 节，breaking change 单独高亮。人工维护的 CHANGELOG 往往滞后且不完整，自动生成的更可靠。

语义化版本号的自动推导：feat 对应 minor 版本号递增，fix 对应 patch，BREAKING CHANGE 对应 major。工具可以根据提交历史自动计算下一个版本号，不需要人工判断。

CI/CD 的精细触发：流水线可以读取提交类型决定执行什么。docs 类型的提交不触发完整测试套件，只重新部署文档站；feat 和 fix 触发完整 CI；chore 只触发 lint。减少不必要的资源消耗，也加快了反馈速度。

工具链上，commitizen 提供交互式命令行引导填写符合规范的提交信息，commitlint 在 pre-commit hook 里校验格式（和 Husky 或 Lefthook 配合使用），release-please 在 CI 里自动管理版本和发布 PR。这套工具链在 GitHub Actions 生态里已经相当成熟，配置成本不高。

AI 时代：单线程假设被打破

传统 Git 工作流有一个隐含假设：一个人同时只专注一件事，一个本地仓库对应一条当前正在推进的工作线。这个假设从未被明确说出来，因为它是显然的。

AI coding agent 的普及打破了这个假设。一个人可以同时驱动多个 agent 并行工作——agent A 在重构认证模块，agent B 在实现新的 API 端点，你自己在修一个紧急 bug。每个 agent 需要独立的代码库视图：独立的工作目录、独立的分支、独立的 Index，改动之间互不干扰。

这正是 git worktree 的使用场景。

# 为 agent 创建独立的工作目录
git worktree add ../eden-feature-auth feature/auth-refactor
git worktree add ../eden-feature-api feature/new-api
 
# 查看当前所有 worktree
git worktree list
 
# agent 完成后清理
git worktree remove ../eden-feature-auth

每个 worktree 是一个独立的目录，有自己的 HEAD、Index 和 Working Directory，但所有 worktree 共享同一个 .git/objects/——不重复下载，不占用额外磁盘。这和 clone 两份仓库的区别是本质的：clone 得到的是两个完全独立的仓库，objects 各存一份；worktree 是同一个仓库的多个视图，objects 只有一份。

在 AI 辅助开发的工作流里，有几个工程习惯值得主动建立：

微粒度 commit：agent 生成的改动应该鼓励更小、更原子的提交，而不是一个大 commit 包含几十个文件的修改。小 commit 更容易 code review，git bisect 定位问题时精度更高，cherry-pick 的灵活性也更强。

明确的授权边界：CLAUDE.md（或类似的 agent 配置文件）定义了 agent 可以操作的范围——哪些目录可以修改、哪些分支可以推送、哪些命令是禁止的。这不是给 agent 贴标签，是为了让 agent 在边界内自主工作，同时人类保留对关键路径的控制权。

人工审查节点：agent 的输出不应该直接合并进主干，而是通过 PR 经过人工审查。Merge Queue（见下一篇）提供了一个自动化的守门机制，确保每个 PR 在合并时依然经过 CI 验证。

现在大家在拥护什么

几个在当下被越来越多团队认可的方向：

Trunk-Based Development + Feature Flag 正在成为高频发布团队的主流选择。与其维护复杂的分支结构，不如让所有开发在主干上持续集成，用 Feature Flag 控制功能对用户的可见性。未完成的功能默认关闭，发布时打开开关，出问题立刻关闭——这比回滚代码要快得多。

Merge Queue 解决了多 PR 同时通过 CI 但合并后互相冲突的问题。传统流程是：PR 单独跑 CI、绿了合并，但两个 PR 合并后的组合状态没有被测试过。Merge Queue 把待合并的 PR 排队，依次用”合并后的状态”跑 CI，只有真正安全的才进主干。GitHub 和 GitLab 都提供了原生的 Merge Queue 支持。

工具层的变化：lazygit 把 Git 操作从命令行带进了终端 TUI，gh CLI 把 GitHub 的大多数操作变成了本地命令，IDE 的 Git 集成越来越深（VS Code 的 Source Control、JetBrains 的 Git 工具都已经能处理绝大多数日常操作）。命令行 Git 依然是理解底层的必要工具，但日常工作里选择顺手的界面没有什么问题。

Git 的核心没变，变的是它所服务的开发范式。从个人工具，到社会化协作，到自动化流水线，再到 AI 时代的多 agent 并行——每一层进化都是在”设计正确”的基础上，往”用起来更好”的方向靠近。这个趋势没有终点。

关联

05-Merge、Rebase 与分支策略 — Trunk-Based Development 和 Merge Queue 是分支策略在工程层面的延伸
07-安全实践、协作规范与工具生态 — Conventional Commits 的 hook 校验、Merge Queue 的配置、lazygit 等工具的使用在这篇详细覆盖
03-三棵树、引用系统与本地时间机器 — Worktree 的每个目录有独立的三棵树，理解三棵树模型有助于理解 worktree 的隔离边界

知识花园

目录

最近更新

论第一性原理

知识花园：构建你的第二大脑

基于万形做的一些小玩意儿

从工具到基础设施：演进与现代范式