钩子定义

钩子是 Git 在特定动作发生时触发的自定义脚本。它适合把低成本、确定性的检查前移,例如格式化、提交信息校验、密钥扫描和轻量测试。钩子不是万能门禁;真正关键的检查仍然应该在 CI 和服务端权限里执行。

  • 客户端:客户端钩子由提交、合并、推送等本地操作调用,适合提前反馈。
  • 服务器端:服务器端钩子作用于接收推送等联网操作,适合保护共享历史。

示例

钩子默认存储在 Git 目录下的 hooks 子目录中。当你用 git init 初始化一个新版本库时,Git 默认会在这个目录中放置一些示例脚本。这些示例脚本的名字都是以 .sample 结尾,如果想启用它们,得先移除这个后缀。

$ tree .git/hooks
.git/hooks
├── applypatch-msg.sample
├── commit-msg.sample
├── fsmonitor-watchman.sample
├── post-update.sample
├── pre-applypatch.sample
├── pre-commit.sample
├── pre-merge-commit.sample
├── pre-push.sample
├── pre-rebase.sample
├── pre-receive.sample
├── prepare-commit-msg.sample
└── update.sample
 
0 directories, 12 files

这些脚本除了本身可以被调用外,它们还透露了被触发时所传入的参数。所有的示例都是 shell 脚本,其中一些还混杂了 Perl 代码,任何正确命名的可执行脚本都可以正常使用 —— 你可以用 Ruby 或 Python,或任何你熟悉的语言编写它们。

生命周期

Git 钩子生命周期:在本地操作(checkout、commit、merge 等)和远程操作(push、receive 等)的不同阶段,Git 会依次触发对应的钩子脚本。客户端钩子在提交工作流中按 pre-commit → prepare-commit-msg → commit-msg → post-commit 顺序执行;服务端钩子在接收推送时按 pre-receive → update → post-receive 顺序执行。

客户端钩子

提交工作流钩子

hook触发点说明
pre-commit提交信息前运行它用于检查即将提交的快照,如果该钩子以非零值退出,Git 将放弃此次提交,不过你可以用 git commit --no-verify 来绕过这个环节。
prepare-commit-msg在启动提交信息编辑器之前,默认信息被创建之后运行它允许你编辑提交者所看到的默认信息。该钩子接收一些选项:存有当前提交信息的文件的路径、提交类型和修补提交的提交的 SHA-1 校验。它对一般的提交来说并没有什么用;然而对那些会自动产生默认信息的提交,如提交信息模板、合并提交、压缩提交和修订提交等非常实用。你可以结合提交模板来使用它,动态地插入信息。
commit-msg提交信息时运行钩子接收一个参数,此参数即上文提到的,存有当前提交信息的临时文件的路径。如果该钩子脚本以非零值退出,Git 将放弃提交,因此,可以用来在提交通过前验证项目状态或提交信息。在本章的最后一节,我们将展示如何使用该钩子来核对提交信息是否遵循指定的模板。
post-commit整个提交过程完成后运行它不接收任何参数,但你可以很容易地通过运行 git log -1 HEAD 来获得最后一次的提交信息。该钩子一般用于通知之类的事情。

电子邮件工作流钩子

hook触发点说明
applypatch-msg应用补丁前运行它接收单个参数:包含请求合并信息的临时文件的名字。如果脚本返回非零值,Git 将放弃该补丁。你可以用该脚本来确保提交信息符合格式,或直接用脚本修正格式错误。
pre-applypatch应用补丁后、产生提交之前运你可以用这个脚本运行测试或检查工作区。如果有什么遗漏,或测试未能通过,脚本会以非零值退出,中断 git am 的运行,这样补丁就不会被提交。
post-applypatch提交产生后运行git am 运行期间最后被调用的钩子。你可以用它把结果通知给一个小组或所拉取的补丁的作者。但你没办法用它停止打补丁的过程。

其他钩子

hook触发点说明
pre-rebaserebase 前以非零值退出可以中止变基的过程。你可以使用这个钩子来禁止对已经推送的提交变基。
post-rewrite运行会替换提交记录的命令时调用比如:git commit --amendgit rebase。它唯一的参数是触发重写的命令名,同时从标准输入中接受一系列重写的提交记录。这个钩子的用途很大程度上跟 post-checkoutpost-merge 差不多。
post-checkoutgit checkout 成功运行后你可以根据你的项目环境用它调整你的工作目录。其中包括放入大的二进制文件、自动生成文档或进行其他类似这样的操作。
post-mergegit merge 成功运行后你可以用它恢复 Git 无法跟踪的工作区数据,比如权限数据。这个钩子也可以用来验证某些在 Git 控制之外的文件是否存在,这样你就能在工作区改变时,把这些文件复制进来。
pre-pushgit push 运行期间,更新了远程引用但尚未传送对象时被调用它接受远程分支的名字和位置作为参数,同时从标准输入中读取一系列待更新的引用。你可以在推送开始之前,用它验证对引用的更新操作(一个非零的退出码将终止推送过程)。
pre-auto-gc在垃圾回收(git gc --auto)开始之前被调用可以用它来提醒你现在要回收垃圾了,或者依情形判断是否要中断回收。

服务端钩子

hook触发点说明
pre-receive来自客户端的推送操作时它从标准输入获取一系列被推送的引用。如果它以非零值退出,所有的推送内容都不会被接受。你可以用这个钩子阻止对引用进行非快进(non-fast-forward)的更新,或者对该推送所修改的所有引用和文件进行访问控制。
updateupdate 脚本和 pre-receive 脚本十分类似,不同之处在于它会为每一个准备更新的分支各运行一次。假如推送者同时向多个分支推送内容,pre-receive 只运行一次,相比之下 update 则会为每一个被推送的分支各运行一次。它不会从标准输入读取内容,而是接受三个参数:引用的名字(分支),推送前的引用指向的内容的 SHA-1 值,以及用户准备推送的内容的 SHA-1 值。如果 update 脚本以非零值退出,只有相应的那一个引用会被拒绝;其余的依然会被更新。
post-receive整个接收过程完结以后运行可以用来更新其他系统服务或者通知用户。它接受与 pre-receive 相同的标准输入数据。它的用途包括给某个邮件列表发信,通知持续集成(continous integration)的服务器,或者更新问题追踪系统(ticket-tracking system) —— 甚至可以通过分析提交信息来决定某个问题(ticket)是否应该被开启,修改或者关闭。该脚本无法终止推送进程,不过客户端在它结束运行之前将保持连接状态,所以如果你想做其他操作需谨慎使用它,因为它将耗费你很长的一段时间

除了钩子,Git 还能通过 LFS 高效管理大文件。

Git LFS

在 Git 仓库中,对于非文本文件,如各种多媒体文件,软件制品文件,二进制文件等等,这些文件往往体积比较大,使用 Git 直接管理会导致仓库的体积迅速膨胀,进而导致 Git 的许多操作变慢,同时也影响仓库上传到远程端。

Git LFS(Large File Storage)相当于 Git 的一种插件式增强工具,简单讲,它是在 Git 仓库使用这些文件的指针代替实际文件,而把实际文件存储在远程端 LFS 服务器,同时在本地仓库中实时追踪这些文件的变动。

LFS 环境入口

Linux

curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
sudo apt-get install git-lfs

Mac

/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
brew install git-lfs

Windows

  1. 下载安装 windows installer
  2. 运行 windows installer。

使用

配置 LFS

git lfs install

追踪文件

# 追踪单个文件
$ git lfs track "coding.png"
# 追踪同一后缀的所有文件
$ git lfs track "*.png"
# 查看正在追踪的文件模式(patterns)
$ git lfs track

提交代码时需要将 .gitattributes 文件也提交到仓库。它是团队共享的 LFS 跟踪规则,不是个人本地设置。提交完成后,执行 git lfs ls-files 可以查看 LFS 跟踪的文件列表。

推送仓库

git push origin main

克隆 LFS 仓库

$ git lfs clone https://e.coding.net/coding/coding-manual.git
Cloning into 'coding-manual'
remote: Counting objects: 16,done.
remote: Compressing objects: 100% (12/12),done.
remote: Total 16 (delta 3), reused 9 (delta 1)
Receiving objects: 100% (16/16),done.
Resolving deltas: 100% (3/3),done.
Checking connectively...done.
Git LFS: (4 of 4 files) 0 B / 100 B

常用命令

$ git lfs track
# 将一个或者一类文件以 git lfs 的方式加入到版本控制中 (实质是修改 .gitattributes 文件)
 
$ git lfs untrack
# 将一个或者一类文件从 仓库中移除
 
$ git lfs status
# 类似于 git status , 显示 git lfs 方式的文件在 暂存区的状态
 
$ git lfs lock
# 锁定一个或者一些文件,只允许当前的用户对这些文件进行修改,防止在多人协作的场景下冲突 (如果是仓库管理员可以带 --force 参数强制 unlock)
 
$ git lfs unlock
# 同上,解锁一个或者一些文件
 
$ git lfs migrate
# 用来将当前已经被 git 储存库保存的文件以 git lfs 的保存 (将 git 对象转为 lfs 对象)
 
# 例如如果将当前远程不存在的的所有 pdf 文件清除
 
# git lfs migrate import --include="*.pdf"
 
#
# 如果是已经上传到中心服务器的内容,则需要指定分支 (可能需要 push --force)
 
# git lfs migrate import --include="*.mp4" --include-ref=refs/origin/master --include-ref=refs/origin/dev --include-ref=refs/origin/test
 
#
# 然后使用如下命令清理 .git 目录
 
# git reflog expire --expire-unreachable=now --all && git gc --prune=now
 
$ git lfs ls-files
# 展示全部使用 git lfs 方式加入版本控制的文件
 
$ git lfs prune
# 删除全部旧的 Git LFS 文件
 
$ git lfs fetch
$ git lfs pull
$ git lfs push
$ git lfs checkout
# 正常情况下会随着 git pull/push 一起执行
 
# 如果在 git pull/push 的过程中断了,导致二进制文件没有被拉取的时候,可以使用这些命令 (支持断点续传,速度不慢)

使用原则

钩子负责提前提醒,CI 负责最终裁决:客户端钩子可以被 --no-verify 绕过,所以不能把唯一安全边界放在本地。

钩子脚本要快而确定:pre-commit 适合 lint、format、密钥扫描;耗时测试更适合 pre-push 或 CI。

LFS 只放真正的大文件:图片、视频、模型、二进制制品适合 LFS;普通 Markdown、源码、配置不应该进入 LFS。

历史迁移要谨慎git lfs migrate 会改写历史,通常需要强推和团队同步。已发布或多人协作仓库必须先做计划。

.gitattributes 是契约:它决定哪些文件走 LFS。规则变更应像代码变更一样审查,避免把大文件漏进普通 Git 对象库。