北京最好的治疗白癜风的医院 http://www.txbyjgh.com/m/操作系统的目标之一是向用户掩盖系统硬件设备的特殊性。例如,虚拟文件系统呈现给用户一个统一的文件系统视图,而和底层的物理设备无关。本章描述Linux内核是如何管理系统中的物理设备的。
CPU不是系统中唯一的智能设备,每一个物理设备都由它自己的硬件控制器。键盘、鼠标和串行口由SuperIO芯片控制,IDE磁盘由IDE控制器控制,SCSI磁盘由SCSI控制器控制,等等。每一个硬件控制器都由自己的控制和状态寄存器(CSR),而且不同的设备有不同的寄存器。一个AdaptecSCSI控制器的CSR和NCRSCSI控制器的CSR完全不同。CSR用于启动和停止设备,初始化设备和诊断它的问题。管理这些硬件控制器的代码不是放在每一个应用程序里边,而是放在Linux内核。这些处理或者管理硬件控制器的软件叫做设备驱动程序。本质上,Linux内核的设备驱动程序是特权的、驻留在内存的、低级硬件控制例程的共享库。正是Linux的设备驱动程序处理它们所管理的设备的特性。
UNIX的一个基本特点是它抽象了对设备的处理。所有的硬件设备都象常规文件一样看待:它们可以使用和操作文件相同的、标准的系统调用来打开、关闭和读写。系统中的每一个设备都用一个设备特殊文件代表。例如系统中第一个IDE硬盘用/dev/had表示。对于块(磁盘)和字符设备,这些设备特殊文件用mknod命令创建,并使用主(major)和次(minor)设备编号来描述设备。网络设备也用设备特殊文件表达,但是它们由Linux在找到并初始化系统中的网络控制器的时候创建。同一个设备驱动程序控制的所有设备都有一个共同的major设备编号。次设备编号用于区分不同的设备以及它们的控制器。例如,主IDE磁盘的不同分区都有一个不同的次设备编号。所以,/dev/hda2,主IDE磁盘的第2个分区,其主设备号是3,而次设备号是2。Linux使用主设备号表和一些系统表(例如字符设备表chrdevs)把系统调用中传递的设备特殊文件(比如在一个块设备上安装一个文件系统)映射到这个设备的设备驱动程序中。参见fs/devices.c
1.Linux支持三种类型的硬件设备:字符、块和网络。字符设备是没有缓冲直接读写的设备,例如系统的串行端口/dev/cua0和/dev/cua1。块设备是只能按照一个块(一般是字节或者字节)的倍数进行读写的设备。块设备通过buffercache访问,可以随机存取,就是说,任何块都可以读写,不必考虑它在设备的什么地方。块设备可以通过它们的设备特殊文件访问,但是更常见的是通过文件系统进行访问。只有一个块设备可以支持一个安装的文件系统。网络设备是通过BSDsocket接口访问的设备,网络子系统在网络章(第10章)描述。
Linux有许多不同的设备驱动程序(这也是Linux的力量之一),它们都具有一些一般的属性:
Kernelcode
设备驱动程序和内核中的其它代码相似,是kenel的一部分,如果发生错误,可能严重损害系统。一个粗劣的驱动程序甚至可能摧毁系统,可能破坏文件系统,丢失数据。
Kenelinterfaces
设备驱动程序必须向Linux内核或者它所在的子系统提供一个标准的接口。例如,终端驱动程序向Linux内核提供了一个文件I/O接口,而SCSI设备驱动程序向SCSI子系统提供了SCSI设备接口,接着,向内核提供了文件I/O和buffercache的接口。
Kernelmechanismsandservices
设备驱动程序使用标准的内核服务,例如内存分配、中断转发和等待队列来完成工作。
Loadable
大多数的Linux设备驱动程序,可以在需要的时候作为内核模块加载,在不再需要的时候卸载。这使得内核对于系统资源非常具有适应性和效率。
Configurable
Linux设备驱动程序可以建立在内核。至于哪些设备建立到内核,可以在内核编译的时候配置。
Dynamic
在系统启动,每一个设备启动程序初始化的时候,它会查找它管理的硬件设备。如果一个设备驱动程序所控制的设备不存在并没有关系。这时这个设备驱动程序只是多余的,占用很少的系统内存,而不会产生危害。
PolingandInterrupts(轮询和中断)
每一次给设备命令(例如“把读磁头移到软盘的第42扇区“)的时候,设备驱动程序都可以选择采用什么手段来判断命令是否已经执行结束。设备驱动程序可以轮询设备或者使用中断。
轮询设备通常意味着不断读取它的状态寄存器,直到设备的状态改变指示它已经完成了请求。因为设备驱动程序是内核的一部分,如果驱动程序一直在轮询,内核在设备完成请求之前不能运行其它任何东西,会是惨重的损失。所以轮询的设备驱动程序使用一个系统计时器,让内核在晚些时候调用设备驱动程序中的一个例程。这个定时器例程会检查命令的状态,Linux的软盘驱动程序就是这样工作的。使用计时器进行轮询是一种最好的近似,而更加有效的方法是使用中断。
中断驱动的设备驱动程序在它控制的硬件设备需要服务时,会发出一个硬件中断。例如:当在网络上接收到一个以太网报文时,以太网设备驱动程序会被设备中断。Linux内核要有能力把从硬件设备来的中断转发到正确的设备驱动程序。这通过设备驱动程序向内核登记它所使用的中断来实现。它登记中断处理程序例程的地址和它希望拥有的中断编号。你通过/proc/interrupts可以看到设备驱动使用了哪些中断和每一类型的中断使用了多少次:
0:timer
1:keyboard
2:0cascade
3
serial
4
serial
5:1soundblaster
11
aic7xxx
13:1matherror
14
ide0
15
ide1
对于中断资源的请求发生在驱动程序初始化时。系统中有些中断是固定的,这是IBMPC体系结构的遗留物。例如,软驱控制器总是用中断6。其它中断,例如PCI设备的中断,在启动的时候动态分配。这时设备驱动程序必须首先找出它所控制的设备的中断号,然后才能请求拥有这个中断的处理权。对于PCI中断,Linux支持标准的PCIBIOS回调(callback)来确定系统中设备的信息,包括它们的IRQ。
一个中断本身如何被转发到CPU,依赖于体系结构。但是在大多数的体系结构上,中断都用一种特殊的模式传递,在这种模式下,系统中其它的中断将被停止。设备驱动程序在它的中断处理例程中应该做尽可能少的工作,以便Linux内核可以结束中断,返回到它被中断以前的地方。收到中断后需要做大量工作的设备驱动程序可以使用内核的bottomhalfhandler或者任务队列把例程排在后面,以便在以后调用。
2.DirectMemoryAccess(DMA)
当数据量比较少的时候,用中断驱动的设备驱动程序向设备传输数据或者从设备接收,会工作得相当好。例如,一个波特率的modem每一毫秒(1/秒)大约可以传输一个字符。如果中断延迟,就是从硬件设备发出中断到设备驱动程序中的中断处理程序被调用之间所花的时间比较少(比如2毫秒),那么数据传输对系统整体性能的影响就非常小。波特率的modem的数据传输只会占用0.%的CPU处理时间。但是对于高速设备,比如硬盘控制器或者以太网设备,数据传输速率就相当高。一个SCSI设备每秒可以传输高达40M字节的信息。
直接内存存取,或者说DMA,就是发明来解决这个问题的。一个DMA控制器,在不需要处理器干预的情况下,允许在设备和系统内存之间传输数据。PC的ISADMA控制器有8个DMA通道,设备驱动程序可使用其中的7个。每一个DMA通道都关联一个16位的地址寄存器和一个16位的计数寄存器(countregister)。为了初始化一次数据传输,设备驱动程序需要设置DMA通道的地址和计数寄存器,加上数据传输的方向:读或写。然后,设备驱动程序就可以告诉设备:它可以在需要的时候启动DMA。当传输结束时,设备中断PC。这样,在CPU作其它事情的时候(不需要CPU的参与),可以发生传输。
使用DMA时,设备驱动程序要非常小心。首先,所有的DMA控制器都不了解虚拟内存,它只能访问系统中的物理内存。因此,需要进行DMA传输的内存必须是连续的物理内存块。这意味着你不能直接对一个进程的虚拟地址空间进行DMA访问。但是,你可以在执行DMA操作时把进程的物理页锁定到内存中,从而防止在做DMA操作时,物理页被交换出去。第二:DMA控制器无法访问全部的物理内存。DMA通道的地址寄存器表示DMA地址的前16位,跟着的8位来自于页寄存器(pageregister)。这意味着DMA请求限制在底部的16M内存中。
DMA通道是稀少的资源,只有7个,又不能在设备驱动程序之间共享。象中断一样,设备驱动程序必须有能力发现它可以使用哪一个DMA通道。象中断一样,一些设备有固定的DMA通道,比如软驱设备,总是用DMA通道2。有时,设备的DMA通道可以用跳线设置:一些以太网设备用这种技术。对一些更灵活的设备,你可以告诉它(通过它们的CSR)使用哪一个DMA通道,这时,设备驱动程序可以简单地选出一个可用的DMA通道。
Linux使用dma_chan数据结构向量表(每一个DMA通道一个)跟踪DMA通道的使用情况。dma_chan数据结构只有两个域:一个字符串指针,描述这个DMA通道的属主;一个标志,显示这个DMA通道是否已被分配。当你cat/proc/dma的时候,显示出的就是dma_chan向量表。
3.Memory(内存)
设备驱动程序必须小心使用内存。因为它们是Linux内核的一部分,所以它们不能使用虚拟内存。每一次当设备驱动程序运行时(可能是接收到了中断、调度了一个buttomhalfhandler或处理程序任务队列),当前的进程都可能改变。设备驱动程序不能依赖于一个正在运行的特殊进程,哪怕驱动程序正在为当前进程工作。象内核中其它部分一样,设备驱动程序使用数据结构跟踪它所控制的设备。这些数据结构可以在设备驱动程序的代码部分静态分配,但是这会让内核不必要地增大从而造成浪费。多数设备驱动程序分配内核的、不分页的内存来存放它们的数据。
Linux内核提供了内核的内存分配和释放例程,设备驱动程序正是使用了这些例程。内核内存按块分配,块的大小为2的幂数。例如或字节,即使设备驱动程序请求的数量没有这么多。设备驱动程序请求的字节数,按照块的大小被规约(大于等于它的最小块的大小)。这使得内核的内存回收更容易,因为较小的空闲块可以组合成更大的块。
请求内核内存的时候,Linux还需要做更多的附加工作。如果空闲内存的总数太少,物理页需要废弃或者写到交换设备上。通常,Linux会挂起请求者,把这个进程放到一个等待队列,直到有了足够的物理内存。不是所有的设备驱动程序(或者实际是Linux的内核代码)都希望发生这样的事情,可以要求内核内存分配例程在不能立刻分配内存时就失败。如果设备驱动程序希望为DMA访问分配内存,它也需要指出这块内存是可以进行DMA的。因为需要让Linux内核明白系统中哪些是连续、的可以进行DMA的内存,而不是让设备驱动程序决定。
4.InterfacingDeviceDriverswiththeKernel(设备驱动程序和内核接口)
Linux内核必须能够用标准的方式和设备驱动程序交互。每一类的设备驱动程序:字符、块和网络,都提供了通用的接口供内核在需要请求它们的服务的时候使用。这些通用的接口意味着内核可以完全相同地看待通常是非常不同的设备和它们的设备驱动程序。例如,SCSI和IDE磁盘的行为非常不同,但是Linux内核对它们使用相同的接口。
Linux非常地动态,每一次Linux内核启动,它都可能遇到不同的物理设备从而需要不同的设备驱动程序。Linux允许你在建立内核时通过配置脚本,将设备驱动程序包含在内核中。在系统启动时,这些设备驱动程序初始化,此时它们可能没有发现自己可以控制的任何硬件。其它驱动程序可以在需要的时候作为内核模块加载。为了处理设备驱动程序的这种动态特性,设备驱动程序要在它们初始化时向内核登记。Linux维护已经登记的设备驱动程序列表,作为和它们接口的一部分。这些列表包括了例程指针和支持这一类设备的接口信息。
5.CharacterDevices(字符设备)
字符设备,Linux中最简单的设备,可以象文件一样访问。应用程序使用标准系统调用打开、读、写和关闭字符设备,完全把它们作为普通文件一样对待。甚至正在被PPP守护进程使用,用于将一个Linux系统连接到网上的modem,也被看作一个普通文件。当字符设备初始化时,它的设备驱动程序向Linux内核登记,在chrdevs向量表增加一个device_struct数据结构条目。这个设备的主设备标识符(例如对于tty设备是4),用作这个向量表的索引。一个设备的主设备标识符是固定的。Chrdevs向量表中的每一个条目,即一个device_struct数据结构,包括两个元素:一个是指向登记的设备驱动程序名字的指针;另一个是指向一组文件操作的指针。这组文件操作本身位于这个设备的字符设备驱动程序中,每一个都处理一个特定的文件操作,比如打开、读、写和关闭。/proc/devices中字符设备的内容来自chrdevs向量表,参见include/linux/major.h
当代表一个字符设备(例如/dev/cua0)的字符特殊文件打开时,内核必须做一些事情,从而去调用正确的字符设备驱动程序的文件操作例程。和普通文件或目录一样,每一个设备特殊文件都用VFSI节点表达。这个字符特殊文件的VFSinode(实际上所有的设备特殊文件)包含有设备的major和minor标识符。这个VFSI节点由底层的文件系统(例如EXT2)创建,其信息是在查找这个设备特殊文件时,由实际的文件系统提供的。参见fs/ext2/inode.cext2_read_inode()
每一个VFSI节点都关联着一组文件操作,它们依赖于I节点所代表的文件系统对象的不同而不同。不管代表一个字符特殊文件的VFSI节点什么时候创建,它的文件操作都被设置成字符设备的缺省操作。实际上只有一种文件操作:open操作。当一个应用程序打开这个字符特殊文件时,通用的open文件操作使用设备的主设备标识符作为chrdevs向量表中的索引,取出这种特殊设备的文件操作块。它也建立描述这个字符特殊文件的file数据结构,让它的文件操作指针指向设备驱动程序中的相应操作。然后应用程序所有的文件系统操作都被映射到字符设备的文件操作。参见fs/devices.cchrdev_open()def_chr_fops
6.BlockDevices(块设备)
块设备也支持象文件一样被访问。为打开块特殊文件提供了一组正确的文件操作集,这种机制与字符设备的十分相似。Linux用blkdevs向量表维护已经登记的块设备文件。与chrdevs向量表一样,使用块设备的主设备号作为该向量表的索引。它的条目也是device_struct数据结构。和字符设备不同,块设备进行了分类。SCSI设备是其中的一类,而IDE设备是另一类。类向Linux内核登记自身,并向内核提供文件操作。属于一个块设备类的设备驱动程序,向这个类提供与类相关的接口。例如,SCSI设备驱动程序必须向SCSI子系统提供接口,SCSI子系统使用这些接口向内核提供有关这种设备的文件操作。参见fs/devices.c
每一个块设备驱动程序都必须提供普通的文件操作接口,同时提供对buffercache的接口。每一个块设备驱动程序必须填充它在blk_dev向量表中的blk_dev_struct数据结构。同样,这个向量表的索引还是设备的主设备号。这个blk_dev_struct数据结构包括一个请求例程地址和一个指针,该指针指向一个request数据结构列表,每一个request数据结构都表示一个来自buffercache的、要求设备驱动程序读写一块数据的请求。参见drivers/block/ll_rw_blk.c,include/linux/blkdev.h
每当buffercache希望从一个登记的设备读一块数据,或希望向一个登记的设备写一块数据时,它就在它的blk_dev_struc中增加一个request数据结构。图8.2显示了每一个request都是一个读写一块数据的请求,而且每一个request都有一个指针指向一个或多个buffer_head数据结构。这个buffer_head数据结构被buffercache锁定,可能会有一个进程在该阻塞(block)操作上等待这个缓冲区完成。每一个request结构都是从一个静态表:all_request表中分配的。如果这个request增加到一个空的request列表,驱动程序的request函数就被调用,开始最这个request队列的处理。否则,驱动程序只是简单地处理request队列中的每一个请求。
一旦设备驱动程序完成了一个请求,该请求的每一个buffer_head结构都必须从request结构中删除,并被标记为最新的,然后解锁。对于buffer_head的解锁会唤醒任何正在等待这个阻塞操作完成的进程。这样的例子包括文件解析的时候:EXT2文件系统必须从包括这个文件系统的块设备上,读取包括下一个EXT2目录条目的数据块,这个进程会在buff_head(将要包括下一个EXT2目录条目)上睡眠,直到设备驱动程序唤醒它。这个request数据结构会被标记为空闲,从而可以被另一个块请求使用。
7.HardDisks(硬盘)
硬盘把数据存放在转动的磁碟上,提供了一个更永久地存储数据的方式。为了写入数据,微小的磁头把磁碟表面的微型颗粒磁化。通过磁头也可以探测指定的微粒是否被磁化,从而读出数据。
一个磁盘驱动器由一个或多个磁碟组成,每一个磁碟都用相当光滑的玻璃或者陶瓷制成,并覆盖上一层精细的金属氧化物。磁碟放在一个中心轴上面,并按照稳定的速度转动。转动速度根据型号不同从到RPM(转/每分钟)。与之相比,软盘的转动速度仅为RPM。磁盘的读/写磁头负责读写数据,每一个磁碟有一对,每一面一个。读/写磁头和磁碟表面并没有物理的接触,而是在一个很薄的空气垫(十万分之一英寸)上面漂浮。读写磁头通过一个驱动器在磁碟表面移动。所有的磁头都粘在一起,同时在磁碟表面移动。
每一个磁碟的表面都被分成多个狭窄的同心环,叫做磁道(track)。磁道0是最外面的磁道,编号最高的磁道是最接近中心轴的磁道。一个柱面(cylinder)是一组具有相同编号的磁道。所以磁盘上所有磁碟的第5磁道(每一面)就是磁盘的第5柱面。因为柱面数和磁道数相同,所以磁盘的尺寸常用柱面来描述。每一个磁道又进一步分为扇区(sector)。一个扇区是可以从硬盘读写的最小数据单元,也就是磁盘的块(block)大小。通常的扇区大小是字节。磁盘扇区的大小通常是在磁盘制造过程中,对其格式化时设定的。
磁盘通常用它的尺寸(geometry)描述:柱面(cylinders)数、磁头(heads)数和扇区(sectors)数。例如,启动的时候Linux这样描述我的IDE磁盘:
hdb:ConnerPeripheralsMB-CFSA,MBw/64kBCache,CHS=/16/63
这意味着它有个柱面(磁道),16个磁头(8个磁碟)和63个扇区/磁道。对于字节的扇区或块大小,磁盘的容量是K字节。这和磁盘声明的M的存储能力不符合,因为一些扇区用作存储磁盘的分区信息。一些磁盘可以自动找出坏的扇区,并对其进行重新索引。
硬盘可以再分为分区(partitions)。一个分区是为某一特定目的而分配的一大组扇区。对磁盘进行分区,使得一个磁盘可用于几个操作系统或多个目的。大多数单个磁盘的Linux系统都有3个分区:一个包含DOS文件系统,另一个是EXT2文件系统,第三个是交换分区。用分区表描述硬盘的分区,其中的每一个条目又用磁头、扇区和柱面号描述分区的起止位置。对于用fdisk格式化的DOS磁盘,可以有4个主磁盘分区。但不是分区表中的所有4个条目都必须用到。Fdisk支持三种类型的分区:主分区、扩展分区和逻辑分区。扩展分区不是真正的分区,它可以包括任意数目的逻辑分区。发明扩展分区和逻辑分区是为了突破4个主分区的限制。下面是一个包括2个主分区的磁盘的fdisk输出:
Disk/dev/sda:64heads,32sectors,cylinders
Units=cylindersof*bytes
DeviceBootBeginStartEndBlocksIdSystem
/dev/sda83Linuxnative
/dev/sda947932Linuxswap
Expert