您的当前位置:首页 > 数据恢复 > 从电脑硬盘的数据结构谈起

从电脑硬盘的数据结构谈起data restoration

  说到数据恢复,就不能不提到硬盘的数据结构、文件的存储原理,甚至操作系统的启动流程,这些是你在恢复硬盘数据时不得不利用的基本知识。即使你不需要恢复数据,理解了这些知识(即使只是稍微多知道一些),对于你平时的电脑操作和应用也是很有帮助的。
  就从硬盘的数据结构谈起吧……

硬盘数据结构

  初买来一块硬盘,是没有办法使用的,你需要将它分区、格式化,然后再安装上操作系统才可以使用。就拿一直沿用到现在的win9x/me系列来说,一般要将硬盘分成主引导扇区、操作系统引导扇区、fat、dir和data等五部分(其中只有主引导扇区是唯一的,其它的随你的分区数的增加而增加)。

主引导扇区

  主引导扇区位于整个硬盘的0磁道0柱面1扇区,包括硬盘主引导记录mbr(main boot record)和分区表dpt(disk partition table)。其中主引导记录的作用就是检查分区表是否正确以及确定哪个分区为引导分区,并在程序结束时把该分区的启动程序(也就是操作系统引导扇区)调入内存加以执行。至于分区表,很多人都知道,以80h或00h为开始标志,以55aah为结束标志,共64字节,位于本扇区的最末端。值得一提的是,mbr是由分区程序(例如dos 的fdisk.exe)产生的,不同的操作系统可能这个扇区是不尽相同。如果你有这个意向也可以自己去编写一个,只要它能完成前述的任务即可,这也是为什么能实现多系统启动的原因(说句题外话:正因为这个主引导记录容易编写,所以才出现了很多的引导区病毒)。

操作系统引导扇区

  obr(os boot record)即操作系统引导扇区,通常位于硬盘的0磁道1柱面1扇区(这是对于dos来说的,对于那些以多重引导方式启动的系统则位于相应的主分区/扩展分区的第一个扇区),是操作系统可直接访问的第一个扇区,它也包括一个引导程序和一个被称为bpb(bioses parameter block)的本分区参数记录表。其实每个逻辑分区都有一个obr,其参数视分区的大小、操作系统的类别而有所不同。引导程序的主要任务是判断本分区根目录前两个文件是否为操作系统的引导文件(例如msdos或者起源于msdos的win9x/me的io.sys和msdos.sys)。如是,就把第一个文件读入内存,并把控制权交予该文件。bpb参数块记录着本分区的起始扇区、结束扇区、文件存储格式、硬盘介质描述符、根目录大小、fat个数、分配单元(allocations unit,以前也称之为簇)的大小等重要参数。obr由高级格式化程序产生(例如dos 的format.com)。

文件分配表

  fat(file allocations table)即文件分配表,是dos/win9x系统的文件寻址系统,为了数据安全起见,fat一般做两个,第二fat为第一fat的备份, fat区紧接在obr之后,其大小由本分区的大小及文件分配单元的大小决定。关于fat的格式历来有很多选择,microsoft 的dos及windows采用所熟悉的fat12、fat16和fat32格式,但除此以外并非没有其它格式的fat,像windows nt、os/2、unix/linux、novell等都有自己的文件管理方式。

目录区

  dir是directory即根目录区的简写,dir紧接在第二fat表之后,只有fat还不能定位文件在磁盘中的位置,fat还必须和dir配合才能准确定位文件的位置。dir记录着每个文件(目录)的起始单元(这是最重要的)、文件的属性等。定位文件位置时,操作系统根据dir中的起始单元,结合fat表就可以知道文件在磁盘的具体位置及大小了。在dir区之后,才是真正意义上的数据存储区,即data区。

数据区

  data虽然占据了硬盘的绝大部分空间,但没有了前面的各部分,它对于来说,也只能是一些枯燥的二进制代码,没有任何意义。在这里有一点要说明的是,通常所说的格式化程序(指高级格式化,例如dos下的format程序),并没有把data区的数据清除,只是重写了fat表而已,至于分区硬盘,也只是修改了mbr和obr,绝大部分的data区的数据并没有被改变,这也是许多硬盘数据能够得以修复的原因。但即便如此,如mbr/obr/fat/dir之一被破坏的话,也足够咱们那些所谓的diy老鸟们忙乎半天了……需要提醒大家的是,如果你经常整理磁盘,那么你的数据区的数据可能是连续的,这样即使mbr/fat/dir全部坏了,也可以使用磁盘编辑软件(比如dos下的diskedit),只要找到一个文件的起始保存位置,那么这个文件就有可能被恢复(当然了,这需要一个前提,那就是你没有覆盖这个文件……)。

硬盘分区方式

  平时说到的分区概念,不外乎三种:主分区、扩展分区和逻辑分区。

主分区是一个比较单纯的分区,通常位于硬盘的最前面一块区域中,构成逻辑c磁盘。在主分区中,不允许再建立其它逻辑磁盘。

  扩展分区的概念则比较复杂,也是造成分区和逻辑磁盘混淆的主要原因。由于硬盘仅仅为分区表保留了64个字节的存储空间,而每个分区的参数占据16个字节,故主引导扇区中总计可以存储4个分区的数据。操作系统只允许存储4个分区的数据,如果说逻辑磁盘就是分区,则系统最多只允许4个逻辑磁盘。对于具体的应用,4个逻辑磁盘往往不能满足实际需求。为了建立更多的逻辑磁盘供操作系统使用,系统引入了扩展分区的概念。

所谓扩展分区,严格地讲它不是一个实际意义的分区,它仅仅是一个指向下一个分区的指针,这种指针结构将形成一个单向链表。这样在主引导扇区中除了主分区外,仅需要存储一个被称为扩展分区的分区数据,通过这个扩展分区的数据可以找到下一个分区(实际上也就是下一个逻辑磁盘)的起始位置,以此起始位置类推可以找到所有的分区。无论系统中建立多少个逻辑磁盘,在主引导扇区中通过一个扩展分区的参数就可以逐个找到每一个逻辑磁盘。

需要特别注意的是,由于主分区之后的各个分区是通过一种单向链表的结构来实现链接的,因此,若单向链表发生问题,将导致逻辑磁盘的丢失。

数据存储原理

  既然要进行数据的恢复,当然数据的存储原理不能不提,在这之中,还要介绍一下数据的删除和硬盘的格式化相关问题……

文件的读取

  操作系统从目录区中读取文件信息(包括文件名、后缀名、文件大小、修改日期和文件在数据区保存的第一个簇的簇号),这里假设第一个簇号是0023。

操作系统从0023簇读取相应的数据,然后再找到fat的0023单元,如果内容是文件结束标志(ff),则表示文件结束,否则内容保存数据的下一个簇的簇号,这样重复下去直到遇到文件结束标志。

文件的写入

  当要保存文件时,操作系统首先在dir区中找到空区写入文件名、大小和创建时间等相应信息,然后在data区找到闲置空间将文件保存,并将data区的第一个簇写入dir区,其余的动作和上边的读取动作差不多。

文件的删除

  看了前面的文件的读取和写入,你可能没有往下边继续看的信心了,不过放心,win9x的文件删除工作却是很简单的,简单到只在目录区做了一点小改动――将目录区的文件的第一个字符改成了e5就表示将改文件删除了。

fdisk和format的一点小说明

和文件的删除类似,利用fdisk删除再建立分区和利用format格式化逻辑磁盘(假设你格式化的时候并没有使用/u这个无条件格式化参数)都没有将数据从data区直接删除,前者只是改变了分区表,后者只是修改了fat表,因此被误删除的分区和误格式化的硬盘完全有可能恢复……