随着人们对智能化产品需求的增加,未来的嵌入式产品,包括各种家电、通信、PDA、仪器仪表等设备正逐渐走向网络化,以共享互联网中庞大的信息资源,因此使嵌入式设备的网络化开发有广阔市场前景,由于嵌入式硬件资源有限,而传统的TCP/IP等网络通信协议对计算机存储器、运算速度的要求较高,所以不能直接应用,为此,必须开发一套适合嵌入式系统的、高度优化的、最为精简的TCP/IP协议栈。
开放式多媒体应用平台OMAP (Open Multimedia Application Platform)是美国德州仪器公司推出的高度集成的软硬件平台。OMAP具有独特的双芯结构,结合了DSP与RISC内核,可为无线多媒体设备提供独一无二的性能和功耗优势,OMAP可连接十分丰富的外围设备,包括USB、摄像头、声音设备、视频设备、网络设备等,OMAP拥有开放式体系结构,其应用环境完全可编程。
软件协议的设计与实现在很大深度上决定了通信终端的质量,基于OMAP的3G移动终端软件协议结构由信令协议栈和应用业务协议栈组成,如图1所示,TCP/IP协议栈位于应用业务协议栈的底层,为上层的H.323协议栈提
1 开发方案
PC上有功能强大的VC平台和网络分析工具(如Sniffer)便于调试,其设计不针对任何一个嵌入式芯片,具有较好的通用性和可移植性,在PC机上实现的TCP/IP协议,除了以太网层要结合OMAP平台的网卡硬件重写外,基本上可以直接移植到OMAP平台上,不需要再做大的改动,作为一个通信程序,必须需要两端程序同时调试,在PC机上编好的程序能度OMAP平台上程序的调试提供可靠的帮助,因此,协议开发采用先模拟再移植、先整体再部分的设计思路,而协议各层实现的顺序为自下而上。具体步骤是:
(1)在PC机上的Windows操作系统及 VC6.0开发平台上,实现嵌入式系统TCP/IP协议族的模拟器,该模拟器应该能实现TCP/IP协议的基本功能,包括以太网驱动程序、ARP、IP、 UDP、TCP等,并且实现的ARP、IP、UDP、TCP层的程序应该通用于各嵌入式系统并可移植。
(2)将该模拟器移植到OMAP开发平台,用其以太网卡的驱动程序替换原模拟器的链路层程序,在TI提供的CCS平台上最终实现基于OMAP的TCP/IP协议。
2 开发平台
OMAP 的多媒体开发平台Innovator主要由4个模块组成:PM(处理器模块)、IM(接口模块)、M(扩展模块)、BOB(主连接板)。OMAP处理器在 PM上,以太网卡在BOB上,可以通过Innovator上的OMAP1510芯片的ARM微处理器对单片以太网控制器LAN91C96的工作进行控制,实现以太网帧的收发,并通过CCS对程序调试,图2为OMAP平台调试环境。
3 在PC上实现协议的基本模块
3.1 主要模块介绍
(1)主流程:首先对TCP/IP协议族的各层初始化,成功则进入主循环,主循环采用"中断+循环)"结构,简单且分层清晰,中断作为应用层发出命令,调用下层的入口。对于接收到的以太网帧,则由下到上分别进入各层进行处理。协议实现主流程如图3所示。
(2)PC上的以太网层:在内存中开辟接收和发送两个相同的循环缓冲区,用于存放接收和发送的以太网帧。Winpcap软件是基于Windows平台的一个网络包工具,它提供一个系统内核级的动态链接库Packet.dll作为标准的API,具有独立于操作系统的编程接口。利用其提供的API可直接联系网卡驱动与已定义的循环缓冲区,将缓冲区中的数据发出,并将网卡接收的数据存入缓冲区。
(3)ARP层,在内存中开辟一块循环存储区域用于存放已知的IP-MAC对应表,该表可以由上层添加,在接收到ARP应答时会自动添加,也可以上层清空。处理ARP层函数的过程中:根据以太网首部协议字段过滤出ARP包,针对ARP请求与ARP应答进行不同的处理,应答对方的请求,记录对方的应答。
(4)IP层:根据以太网首部的帧类型标注判断接收到的是不是IP包来处理IP层函数,如果是:则调用IP包的接收函数,对给收到的IP包用各种条件进行过滤,对于满足条件的包获取其长度与指针信息供上层使用。本层另一个主要函数是IP包发送函数,由上层调用进行IP封装。
IP的检验和仅包括IP首部,长度一般为20字节(如果没有选项
)。在接收端,丢弃检验和不为OxFFFF的包,在发送端,将计算所得值的反码填入检验和字节,由于主机和网络对数据中高低字节默认的顺序不同,在读写包中的16、32数据时,应该先进行高低字节的交换。(5) UDP层,处理UDP层函数应根据IP首部的协议字段判断是否UDP包。如果是:则调用UDP包接收函数,用各种条件对其进行过滤,提出UDP数据及各种有用信息,根据端口号提交给应用进程处理,本层的另一个主要函数是UDP发送函数,实现封装UDP包(包括载入UDP数据,计算并填入UDP首部信息),最后调用IP发送函数,较由IP层处理。
(6)TCP层:与UDP不同,TCP主机要进行数据通信之前,必须与对方建立连。与几个主机通信,就要建立几个连接。然而,若要知道接收到的TCP包属于哪个连接且使得几个不同的连接之间独立工作、互不干扰,则需要定义TCP的控制模块,这里用一个结构体数组实现,存放所有关于连接的信息。
处理TCP层函数,判断接收包的类型,如果是TCP包,则调用TCP接收函数,TCP接收函数用指定条件进行过滤,找到该包
TCP的发送函数包括主动打开、主动关闭(由上层调用完成新连接的主动打开,或主动关闭一个已建立的连接)和发送控制包(用于TCP连接的建立与终止,会在TCP接收函数中调用,从而实现TCP的转换)三个函数。
TCP层还实现了两个定时器,TCP重传定时器函数可提供服务可靠性的有效保障;TCP保活定时器能够避免资源的浪费。
3.2 程序特点分析
(1)简单性:4.4BSD-Lite版的完整TCP/IP内核实现大约有15 000行,而本程序源代码约有1 400行,更适合嵌入式系统的应用。
(2)可重用性:本程序分层清晰。对于不同的嵌入式系统,可能使用的CPU和以太网卡不同,这就需要针对其特点的以太网层设计,而ARP、IP、UDP、TCP则不需要改动。
(3)可拓展性:TCP/IP协议是底层网络协议,本程序留有很好的接口,可在其上构件更高层的网络协议,包括H.323协议、ftp、telnet。
4 在OMAP平台上的移植
4.1 单片以太网控制器LAN91C96
LAN91C96是SMSC公司生产的专门用于嵌入式产品的10Mbps以太网控制器,具有性能优良,功耗低及尺寸小的特点,如图4所示。
6KB的RAM:用来存放数据包。
MMU:对RAM进行有效管理,为接收和发送包在RAM中分配存储空间。
ARBITE:使MMU和RAM与CPU、CSMA很好地连接。
CSMA/CD模块:集成了IEEE 802.3 MAC层协议,负责监听网络情况和地址过滤。若目的地址是 LAN91C96的地址、广播地址或多播地址,则接收此数据包,否则抛弃。
ENDEC:负责与10Mbps为以太网物理媒体的连接。
LAN91C96 采用地址映射方式,通过访问Innovator为的指定地址对其存储器访问。LAN91C96的寄存器在Innovator内存中的地址分配为: 0x08000300-0x0800030F。寄存器共有4组(BANK0-BANK3),使用相同的地址,通过BANK_SELECT寄存器选择。
4.2 移植过程
先实现该网卡芯片的驱动程序,再用它替换PC模拟器的以太网层,程序驱动主要包括以下三个部分:
(1)初始化:主要为Lan91C96的各寄存器填入正确的初始值使其正常工作。
(2)接收:如图5所示,由CSMA(载波侦听模块)接收到符合地址要求的后,MMU(存储器管理单元)为其请求在RAM中分配存储空间并分配一个编号,DMA 将其存入RAM。接着在接收数据的前面封装STATUS的化COUNT字节信息,如果CRC检测正确,则将其编号放入接收FIFO,如果接收FIFO不为空,则RCV_INT(接收中断标识)被设置。检查接收中断寄存器状态,如果就接收中断,对应其编号,上层协议便可以取出数据了,取出后,将该数据编号从 FIFO中清除。
状态字可以从RCR寄存器中读取,它反应了接收过程出现的各种措施,如CRC错误、接收帧过长等,数据包的编号从FIFO_PORTS寄存器中获得,而数据指针可从POINTER寄存器中获得,数据信息从DATA寄存器中得到,根据这些信息将接收数据包复制
(3)发送:图7描述了发送数据包FIFO中的排队过程,首先MMU在RAM中分配一定字节的存储空间,然后,将分配结果寄存器中的编号放入PNR 寄存器,写数据指针寄存器POINTER并将上层数据封装后拷入DATA寄存器,根据其编号放入发送FIFO,排队的包将自动发出,发出包的编号接着进入发送完成FIFO。如果发送成功,则存储空间自动释放;否则释放存储空间并将其重新排队。
5 实验结果
5.1 内存资源占用量
运行该TCP/IP协议栈需要3MB内存,而Innovator体32MB SDRAM 和32MB Flash,内存占用率为:3M/64M=4.7%,完全适用于嵌入式系统。
5.2 数据传输可靠性
TCP 利用以下机制纠错。数据的传输过程中的误码:检验和机制与重传机制,数据的重复,在接收端会自动舍弃已经接收过的数据包,并且不发ACK,故不会发生一个数据包接收多次的情况,数据包的丢失,接收端在接收完一段数据后,会计算下一个预期数据的序号,
5.3文件最大平均传输速率
下面就本程序所实现的利用TCP进行文件传输功能,给出不同情况下的最大传输速率,实验环境为10Mbps以太网。
理想状态下的理论最大吞吐量:假定发送方传输两个背对背、满长度的TCP数据,接收方为其发出两个ACK,每包中用户数据量为1460位,总数据量为1538位,故最大的用户数据吞吐量为:
本实验测得文件的平均传输速率随着TCP连接数的增多有如图8所示的曲线变化,前半段随着连接数的增加成线性增长,后半段由于出现了网络拥塞,整体的平均速率反而有所下降。
实验结果与理论最大吞吐量有所差距,原因在于:
(1)理论上只是一种理想的状态,现实中难以达到。
(2)受CPU处理速度及文件传输过程的读、写文件操作的限制。
(3)本程序采用的数据传输机制是当收到上一个包的ACK之后再发送下一个数据包,这样避免了对接收数据的排序,提高了可靠性,但数据的传输速度会受到制约。