小猿圈学习Linux之识别同样内容的文件详解
对于学习linux的学生是不是很多都没有找到的资料过,有些在网上找的资料不是补全就是不正确,对于互联网发展的今天,网络发达了,也造成了信息化的泛滥,今天小猿圈Linux讲师为大家总结一下学习Linux中的识别同样内容的文件详解https://upload-images.jianshu.io/upload_images/15397392-963c83da8e096267.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240首先比如有时文件副本相当于对硬盘空间的巨大浪费,并会在你想要更新文件时造成困扰。以下是用来识别这些文件的六个命令。在最近的帖子中,我们看了如何识别并定位硬链接的文件(即,指向同一硬盘内容并共享inode)。在本文中,我们将查看能找到具有相同内容,却不相链接的文件的命令。硬链接很有用是因为它们能够使文件存放在文件系统内的多个地方却不会占用额外的硬盘空间。另一方面,有时文件副本相当于对硬盘空间的巨大浪费,在你想要更新文件时也会有造成困扰之虞。在本文中,我们将看一下多种识别这些文件的方式。用diff命令比较文件可能比较两个文件最简单的方法是使用diff命令。输出会显示你文件的不同之处。<和>符号代表在当参数传过来的第一个(<)或第二个(>)文件中是否有额外的文字行。在这个例子中,在backup.html中有额外的文字行。$ diff index.html backup.html2438a2439,2441> <pre>> That's all there is to report.> </pre>如果diff没有输出那代表两个文件相同。$ diff home.html index.html$diff的唯一缺点是它一次只能比较两个文件并且你必须指定用来比较的文件,这篇帖子中的一些命令可以为你找到多个重复文件。使用校验和cksum(checksum)命令计算文件的校验和。校验和是一种将文字内容转化成一个长数字(例如2819078353228029)的数学简化。虽然校验和并不是完全独有的,但是文件内容不同校验和却相同的概率微乎其微。$ cksum *.html2819078353 228029 backup.html4073570409 227985 home.html4073570409 227985 index.html在上述示例中,你可以看到产生同样校验和的第二个和第三个文件是如何可以被默认为相同的。使用find命令虽然find命令并没有寻找重复文件的选项,它依然可以被用来通过名字或类型寻找文件并运行cksum命令。例如:$ find . -name "*.html" -exec cksum {} \;4073570409 227985 ./home.html2819078353 228029 ./backup.html4073570409 227985 ./index.html使用fslint命令fslint命令可以被特地用来寻找重复文件。注意我们给了它一个起始位置。如果它需要遍历相当多的文件,这就需要花点时间来完成。注意它是如何列出重复文件并寻找其它问题的,比如空目录和坏ID。$ fslint .-----------------------------------file name lint-------------------------------Invalid utf8 names-----------------------------------file case lint----------------------------------DUPlicate files<==home.htmlindex.html-----------------------------------Dangling links--------------------redundant characters in links------------------------------------suspect links--------------------------------Empty Directories./.gnupg----------------------------------Temporary Files----------------------duplicate/conflicting Names------------------------------------------Bad ids-------------------------Non Stripped executables你可能需要在你的系统上安装fslint。你可能也需要将它加入你的命令搜索路径:$ export PATH=$PATH:/usr/share/fslint/fslint使用rdfind命令rdfind命令也会寻找重复(相同内容的)文件。它的名字意即“重复数据搜寻”,并且它能够基于文件日期判断哪个文件是原件——这在你选择删除副本时很有用因为它会移除较新的文件。fdupes命令是另一个你可能需要安装并使用一段时间才能熟悉其众多选项的命令。Linux系统提供能够定位并(潜在地)能移除重复文件的一系列的好工具,以及能让你指定搜索区域及当对你所发现的重复文件时的处理方式的选项。以上就是小猿圈Linux讲师总结的linux识别同样内容的文件详解,希望对你有所帮助,想了解更多学习linux内容的小伙伴可以到小猿圈上寻找答案linux自学交流1群:819805410,也可以在下方留言、转发、评论分享给有用的人。不仅不帮了你更是解决大他人的问题,小猿圈网站所有视频都是可以免费学习的。
页:
[1]