前沿 在FPGA设计中,配置PROM(如18V00系列)/FLASH(XCF00系列)主要的功能是存储FPGA设计,然后在上电之后,自动将设计装载到FPGA当中。在有些时候,FPGA设计并未全部将配置PROM/FLASH的存储单元全部占用,因此,未被占用的单元就被浪费掉了。 在某些应用中,用户需要在片外(FPGA外)存储自己定义的数据,这个时候就要单独挂PROM/FLASH芯片到FPGA上,这样不仅增加了设计难度(用户需要专门编写存储控制接口)、增加成本、增加布板难度、增加FPGA管脚使用数量等,从而给设计者带来很多不便。如果用户自定义的数据量不是很大,而且正好可以放到PROM/FLASH的未被占用的存储单元中,那么将极大减轻设计者的负担,减少成本,增加系统可靠性。 下面将详细介绍如何将用户自定义数据存储到PROM/FLASH中,以及如何读取这些数据。 具体实现 原理 要想实现将用户自定义数据写入PROM/FLASH以及从它们当中读出来,首先要明确以下几个问题: - FPGA设计数据如何被写入到PROM/FLASH当中
- PROM/FLASH中的数据如何被读到FPGA当中(配置FPGA过程)
理解了以上两个问题,我们就能从总体上知道是什么原理使用户数据能写入到PROM/FLASH当中,并被读出来。看FIG1:(注:以下所有的讨论都是认为FPGA的配置模式是主-串模式) 在FIG1中,有几个关键信号:CCLK,CE/,OE_RESET/,INIT/(INIT/在FPGA上)。在主-串模式配置过程中,上电之后,由FPGA的CCLK引脚发出时钟,驱动PROM/FLASH的CLK,而PROM/FLASH根据CE/、OE_RESET/的状态来确定是否地址增加(此“地址”是PROM/FLASH内部数据存储单元的地址)。如果FPGA将所有的设计数据读取完毕,则停止产生CCLK时钟。而CE/、OE_RESET/的状态可能在FPGA配置完毕之后变化,使地址复位。注意,当CCLK产生且PROM/FLASH有数据输出时,要判断这些数据是否是设计数据。判断的方法是通过一个同步字段来实现的。不同系列的FPGA同步字段会有不同,比如Virtex系列FPGA同步字段是AA995566h。在对应FPGA的配置手册中会找到其同步字段。 上述所述过程大概描述了一个FPGA的配置过程。因此,如果要想在FPGA配置成功之后,继续读取用户自定义在PROM/FLASH中的数据,就要在上述过程中做一下变动,而且不影响正常的FPGA配置。 通过研究PROM/FLASH的手册,可以知道,当CE/变高后,PROM/FLASH的地址计数器就会复位,而不再因为CLK有脉冲而地址增加。所以,当FPGA配置完毕后,设计者要阻值CE/变高。 在配置过程中,INIT/变低,表示FPGA接收的数据有CRC校验错误,这时PROM/FLASH的地址计数器会清零。 当OE_RESET/为低,PROM/FLASH的地址计数器复位。 Tab1为OE_RESET/和CE/与PROM/FLASH地址的真值表: 通过前面分析几个信号对PROM/FLASH地址的影响以及FPGA配置过程,可以有如下的方法来实现在成功配置FPGA之后,正确读取PROM/FLASH中的用户自定义数据: - CE/信号脚在FPGA成功配置后,不能为高,因此将该引脚连接到一USER IO上,这样当FPGA配置成功后,该USER IO输出低,这样CE/就不会变高,从而PROM/FLASH地址就不会复位。在我们一般的应用中,是将FPGA的DONE引脚连接到CE/上,这样的目的是当FPGA成功配置后,DONE变高,从而CE/变高,这样PROM/FLASH的地址就复位了。如果我们采用一USER IO连接到CE/上,那么这个时候,DONE脚就不能在连接到CE/上。DONE脚此时可以只驱动LED就可以了。注意DONE脚的上拉电阻要保留。其实CE/也可以直接接到GND上,但是这样PROM/FLASH一直在使能,对芯片不好,也增加了功耗。
- OE_RESET/直接连接到INIT/上,同时INIT/在FPGA成功配置后,要作为一个USER IO使用。这样一方面保证在FPGA配置过程中如果出现CRC错误,可以再重新发起一次配置动作;另一方面当FPGA成功配置后,INIT/成为一个USER IO,可以使该USER IO输出为高,这样OE_RESET/为高,PROM/FLASH内部地址不会复位,PROM/FLASH处在输出使能状态。
以上两个措施保证了在FPGA成功配置后,PROM/FLASH的地址不会清零。但是由于FPGA成功配置后,CCLK就停止产生,所以,尽管PROM/FLASH地址没有被复位,但是也不会增加。还要想办法使地址增加。 在上述条件满足时,地址增加就要有时钟输入到PROM/FLASH的CLK引脚上。由于CCLK的不可控性(尽管BitGen中有一些选项可以影响CCLK的变化。我没有仔细去研究过),因此需要有一个设计者可控的时钟信号输入到PROM/FLASH的CLK引脚上。当FPGA成功配置后,CCLK为3态且有一个弱的到VCCO的上拉,因此将一个USER IO连接到PROM/FLASH的CLK引脚上是可行的。也就是说FPGA的CCLK和一个USER IO同时都连接到PROM/FLASH的CLK引脚上。这样,设计者就可以在FPGA成功配置后,通过控制USER IO来产生时钟脉冲,来读取自定义在PROM/FLASH中的数据。因为数据是串行的,而且PROM/FLASH的地址对设计者来说不可见,因此借鉴FPGA在配置时是如何确定从PROM/FLASH读出的数据是设计数据的方法:识别同步头。因此,在生成用户自定义数据的时候,也要考虑一个有意义的同步头数据。 如数据可以按照FIG2来分布: 如何生成用户数据并加入到mcs文件中,在后面有描述。 Read宏单元实现 从前面描述,清楚了在硬件上如何改动,使之适合在FPGA配置成功后,能读取PROM/FLASH中的用户自定义数据。但是,如何读取、读取这个动作如何实现,还是需要专门设计一个模块才可以。 FIG3是一个标准的读PROM/FLASH数据的宏单元框图: 该宏单元实现了在FPGA成功配置后,从PROM/FLASH中读取用户自定义数据。各引脚信号说明,见Tab2:
Table2:Read PROM/FLASH宏单元信号描述与功能 信号名 | IO 方向 | 描述 | clock | 输入 | 所有信号的寄存都是在clock的上升沿 | reset | 输入 | 异步低有效复位信号。该信号将所有逻辑复位到初始状态。 | din/d0 | 输入 | 连接到PROM/FLASH的数据输出引脚。用户数据出现在该引脚上。 | read | 输入 | 该信号低有效。该信号指示该宏单元从PROM/FLASH中读取下一个8bit数据。 | next_sync | 输入 | 该信号低有效。该信号指示该宏单元搜索存储在PROM/FLASH中的下一个同步字段。 | dout[7:0] | 输出 | 用户自定义数据会出现在该总线上。该总线上是否是有效的用户数据,由data_ready来指示。当data_ready保持一个时钟周期的低电平时,表明该总线上的数据是有效的。 | data_ready | 输出 | 该信号低有效。当该信号持续一个时钟周期为低时,就表明dout[7:0]上的数据是有效的用户自定义数据。 | sync | 输出 | 该信号低有效。当从检测到从PROM/FLASH中读出的数据有同步字段时,该信号变低。 | reset_prom | 输出 | 该信号低有效。当该宏单元被复位时,该信号就会变低。该信号连接到PROM/FLASH的CE/或OE_RESET/上。当该信号为低时,使PROM/FLASH的地址计数器复位。 | cclk | 输出 | 该信号非FPGA引脚上那个CCLK。该信号只是模拟CCLK。 | 下面详细介绍该宏单元是如何被设计以及如何工作的。
- 时钟管理
在这里主要目的是产生正确的模仿CCLK的cclk。因此,需要有一个时钟使能,当该时钟使能有效时,cclk就会产生。而这个时候还要确保从PROM/FLASH中读出的数据能正确被FPGA所捕获到。 在cclk的上升沿,都会有新的数据出现的din/d0上,在cclk的下降沿,一个din数据读使能信号有效,使数据在系统时钟clock的上升沿进入移位寄存器和比较模块。这样对于FPGA内部的寄存器来说就有足够的建立和保持时间。 cclk的产生是通过对clock的分频来产生的。因为PROM/FLASH有一个对时钟频率的要求,因此该cclk最终是多少Hz有PROM/FLASH决定。一般是10MHz。采用SRL16移位的方法,可以产生这个cclk。SRL16移位的长度视clock的频率而定。通过这种方法产生的cclk,避免了使用DLL和DCM就可以达到产生同步时钟的目的。FIG4是时钟管理单元的时序图: - 移位寄存器和比较器
时钟管理的目的是产生合适频率且与系统时钟同步的cclk,而移位寄存器和比较器的目的就是判断从PROM/FLASH过来的数据,是否有同步字段,如果发现同步字段,则sync变低。如果考虑设计更灵活,则可以有几个同步字段。如果用户自定义数据中含有与同步字段匹配的数据,则仍然会有sync产生,但是,只有data_ready来指示是否是有效的用户数据。 该部分的时序图如FIG5: - 控制状态机
cclk产生了,同步字段的判断也实现了,如何控制整个模块的具体动作就由控制状态机来实现。控制状决定有多少数据需要读取、何时搜索下一个同步字段、何时读取下一字节用户数据、何时复位PROM/FLASH地址等。图FIG6为控制状态机的状态转换图。 FIG7为控制状态机的时序图: 通过前面原理性的描述再结合状态机状态转换图,可以很明确的知道状态机是如何工作的。在FPGA配置完成以后,状态机由复位状态(RESET)进入寻找同步字段状态(S1),这个时候cclk是有输出的,如果没有发现同步字段,则一直维持在寻找同步字段状态(S1)。当发现同步字段后,关闭cclk输出使能,同时进入到等待用户指令状态(S2),在该状态等待用户指令,即是否开始从PROM/FLASH中读取数据或寻找同步字段。如果用户逻辑使能read信号,则转到得到数据状态(S3),这时打开cclk输出使能;如果想寻找下一个同步字段,则使能next_sync,进入寻找同步字段状态(S1),同时cclk输出使能。(个人认为这样设计是非常合理的:即用户数据用不同的同步字段分割成不同的数据段,这样用户就可以根据实际需要,确定读哪一段、以及该段应读多少数据,在用户逻辑里,如果有必要,应该增加一个已读数据计数器。但是这个是根据实际需要而定)在得到数据状态(S3),计数接收到数据。由于数据是以位接收,以字节送出,故这个状态存在一个计数器。在该状态,存在两个不同的判断计数器值的语句,根据代码,思考一下就会明白的。当计数器值满足条件以后,就进入数据输出状态(S4)。在数据输出状态(S4)状态,已经串-并转换后的数据从dout[7:0]输出,同时转到等待用户指令状态(S2)。 如何将用户定义数据加到PROM/FLASH 前面所述都是已经假定用户数据已经装到了PROM/FLASH当中,现在就讲述具体怎样实现数据的装入。 首先存在一个名字为Perl的脚本文件,该脚本文件可以使用户定义数据加到PROM文件中。格式是Intel Object和Hex格式。 Perl脚本文件可以在参考设计的/Perl_Script目录中找到。 Perl脚本文件不支持Motorola EXORmacs和TEKTRONIX TEK两种文件格式。 为了详细解释这个脚本文件做了什么以及其如何工作,因此有必要详细PROM文件的格式。将分3部分来详细描述PROM文件的格式。 - 位交换
很好理解位交换。在Intel Object和Hex格式文件里的数据的顺序和数据从PROM/FLASH中读到FPGA当中后的顺序是相反的。也就是说在Intel Object和Hex文件中的MSB是FPGA当中的LSB,Intel Object和Hex文件中的LSB,在FPGA当中是MSB。就是顺序颠倒了。 在Hex文件里,可以使能位交换或者不使能位交换,但是Intel Object文件则无此功能。 由于数据顺序的颠倒,因此,可以有两种方式来处理位交换: 1. 用户数据不作任何变化而附加到PROM配置数据后面。当用户数据读到FPGA当中之后,根据实际需要,再决定是否将顺序调整过来; 2. 用户数据做了位交换后再附加到PROM配置数据后面。这样用户数据读到FPGA当中之后,就不必再做顺序调整。 以上两种方法都是可取,同时采用第一种方法也不会增加额外的逻辑资源开销。 在使用Perl脚本的时候,由于Hex文件有位交换是否使能的功能,因此-swap选项可以on或者off,来打开位交换使能或者关闭。尽管Intel Object无此功能,但是-swap选项也必须说明,尽管此时的说明是不起任何作用的。 - 记录、字节技术、校验和(不知道Record具体该翻译成哪个词,这里我翻译成“记录”)
当将用户数据附加到PROM文件后面的时候,需要说明许多数据域。Hex格式文件不需要附加任何数据域,但是Intel Object格式文件要附加开始字串域、字节计数域、地址域、记录类型域、校验和域、以及实际的数据。Perl文件可以自动计算这些域,并将它们加到PROM文件当中。为使脚本文件可以正确计算这些数值,用户数据需要以每行16字节排列。 Tab3到Tab5是可被iMPACT识别的记录类型:其中 00:数据记录 01:文件记录结束(指示文件结束) 04:扩展的线性地址记录(提供偏移,以便来确定绝对的目的地址) 校验和采用2进制和的补码方式以16进制给出。2进制和包括字节计数值+地址+记录类型+数据类型。 扩展的线性地址记录定义了一个32位的线性地址。该地址加到后续的数据记录地址上,得到绝对地址。 - PROM大小
PROM/FLASH是有大小限制的。因此要考虑可装到PROM/FLASH中的用户数据的大小。FPGA设计部分所占的PROM/FLASH的空间可以从对应FPGA的datasheet上查到。FPGA设计+同步字段+用户数据,这三者所占的空间要小于PROM/FLASH的容量。 注:在参考设计的/Perl_Script目录下有个readme.txt文件。这个文件里详细说明了如何使用Perl脚本。 参考设计 在附件的压缩文件里有参考设计。这里简单介绍一下参考设计。FIG9是参考设计的框图: 从PROM/FLASH中读到的数据在LCD上显示。LCD的驱动有PicoBlaze实现。 其他实现方法 前面讲的是在主-串模式下从PROM/FLASH中读用户数据。当然也可以采用SelectMap模式以并行方式从PROM/FLASH中读取用户数据。在设计方法与前述无太大区别,只是采用SelectMap方式后,数据为并行方式,少了串-并转换以及bit计数。 在同步字段问题上,如果用户数据分为几个不同部分,可以采用所有同步字段都相同以及同步字段不同的方式。两者各有优缺点。如果同步字段都相同,就不清楚当前所读的数据是属于哪一段;如果同步字段不同,可以清楚当天所读数据属于哪个部分,但是存在同步字段更新和存储的问题。很好理解,不再赘述。 说明 本文档全部内容完全来自于Xilinx XAPP694文档。参考设计也完全来自Xilinx的XAPP694.zip。由于时间和个人能力原因,肯定存在翻译和理解有偏差的地方,欢迎大家指正。有部分地方存在语句不通顺及错别字,也请大家海涵。
|