关于git删除仓库中原本应该忽略的文件的研究

发布时间:2024年01月15日

开门见山,先抛出一个结论:

任何被提交到远程仓库中的数据,都不能被彻底删除,只要提交上去了,就会永远留存。

任何被提交到远程仓库中的数据,都不能被彻底删除,只要提交上去了,就会永远留存。

任何被提交到远程仓库中的数据,都不能被彻底删除,只要提交上去了,就会永远留存。

有些朋友可能会说:不对啊,有个命令[git rm -r --cached xxx],可以删除不小心提交的应该忽略的文件,只要执行了上面的命令之后,commit,然后push到远程仓库,远程仓库中的相关文件就会被删除了。

那我只能告诉你,你删除的只是一个指向文件blob的指针而已,blob本身会永远留在仓库里,除非你把所有指向这个blob的引用都删除,然后再执行git gc利用git的空引用回收机制将blob删除(这将是一个非常非常非常麻烦的活,相信我,你绝对不想干的。)

那么我们提交了应该忽略的文件,一般都是因为前期设置的.gitignore有漏洞,让原本应该忽略的文件钻了空子,所以一开始进行.gitignore文件设置时一定要本着能多不少,覆盖面能多大有多大的原则,因为如果发现有些文件可以提交但却被设置忽略,大不了改下.gitignore给这样的文件开个绿灯,让其能够正常提交上去就行,但如果是一开始时.gitignore设置的太少,导致了一大堆文件钻。空子,那就是一件很悲催的事情了,虽然你能够在下次提交时删除对于这些文件的引用,然后修改gitignore文件让其不再追踪那些应该忽略的文件,但你之前错误提交的那批文件的blob,是注定要永远留在仓库里面了。

这里我想给这些的文件取一个形象的名字——疤痕文件。

好了,下面我们讲一下如果我们确实不小心提交了应该忽略的文件的情况,应该如何处理:

说白了就是以下几个命令:

git rm -r --cached fileName (强烈建议在执行这个命令之前,先带上参数-n,也就是git rm -r -n --cached fileName,-n是参数--dry-run的短命令形式,意思是只预览当前命令将删除的文件,而非实际删除,要养成先预览再删除的习惯,防止误删。)

git commit -m "delete ignore file"(提交删除,写好备注)

git push(将本次提交推送到远程仓库)

然后只要记住赶紧修改.gitignore文件将这个文件加入到忽略列表,然后提交.gitignore文件就行了。

接下来我们验证下经过删除之后,远程仓库中的数据发生了什么变化:

使用git log命令查看近期提交:

可以看见倒数第二次提交为提交了一个原本应该忽略的文件,最后的提交为删除了这个应忽略的文件,我们先看一下最后一次提交指向的内容:

通过git cat-file -p [commit哈希前4位]命令查看最后一次commit指向的tree,再顺藤摸瓜查看tree所指向的blob,发现TestShoudIgnore.dll这个应该忽略的文件确实被删除了:

我们再查看倒数第二次的commit:

所以最后总结一下,在项目的前期对于.gitignore文件的编辑一定要秉承着能多不少的原则,不然就很容易给仓库留下疤痕文件了。

文章来源:https://blog.csdn.net/Learn_change_myself/article/details/135594570
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。