CN104272265A - 用于检测dimm安装错误的系统和方法 - Google Patents
用于检测dimm安装错误的系统和方法 Download PDFInfo
- Publication number
- CN104272265A CN104272265A CN201280072884.0A CN201280072884A CN104272265A CN 104272265 A CN104272265 A CN 104272265A CN 201280072884 A CN201280072884 A CN 201280072884A CN 104272265 A CN104272265 A CN 104272265A
- Authority
- CN
- China
- Prior art keywords
- dimm
- setup error
- dram
- machine readable
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/02—Detection or location of defective auxiliary circuits, e.g. defective refresh counters
- G11C29/022—Detection or location of defective auxiliary circuits, e.g. defective refresh counters in I/O circuitry
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/04—Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
- G11C29/08—Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/04—Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
- G11C29/08—Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
- G11C29/10—Test algorithms, e.g. memory scan [MScan] algorithms; Test patterns, e.g. checkerboard patterns
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/52—Protection of memory contents; Detection of errors in memory contents
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/56—External testing equipment for static stores, e.g. automatic test equipment [ATE]; Interfaces therefor
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C5/00—Details of stores covered by group G11C11/00
- G11C5/02—Disposition of storage elements, e.g. in the form of a matrix array
- G11C5/04—Supports for storage elements, e.g. memory modules; Mounting or fixing of storage elements on such supports
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C5/00—Details of stores covered by group G11C11/00
- G11C5/06—Arrangements for interconnecting storage elements electrically, e.g. by wiring
Landscapes
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
可检测DIMM安装错误。示例检测方法包括确定是否发生针对DIMM的动态随机存取存储器(DRAM)的训练错误。示例方法包括识别每个DRAM的位置。示例方法包括基于训练错误、数量和DRAM的位置确定是否发生安装错误。
Description
背景技术
在许多计算设备,如个人电脑(PC)中,随机存取存储器(RAM)采用双列直插式存储模块(DIMM)的形式。DIMM与总线交互或者通过被配置为安装独立的DIMM的插槽互联。当使在DIMM插槽中良好接触时,DIMM被正确安装。未良好接触的DIMM降低了PC的性能。然而,通常安装DIMM用于提高计算机处理的速度,未正确安装的DIMM具有相反的效果。而且,具有未正确安装的DIMM的PC不能利用DIMM中的所有内存,并且导致PC报告许多错误。此外,未正确安装的DIMM造成间歇接触,这产生严重错误和无法补救的错误。
附图说明
在下面的详细说明和参考附图中,描述了某些示例,附图中:
图1是可用于检测双列直插式存储模块(DIMM)安装错误的示例系统的框图;
图2是根据示例具有若干DIMM的内存条的透视图;
图3是用于检测DIMM安装错误的示例方法的处理流程图;以及
图4是显示存储有代码的示例有形的、非瞬态性的机器可读介质的框图,所述代码被采用以检测DIMM安装错误。
具体实施方式
由于对计算设备适当处理的影响,生产个人电脑(PC)和其他此类设备的公司在把设备运送给客户和零售商之前,试图检测和重新安装未正确安装的双列直插式存储模块(DIMM)。然而,检测方法容易产生错误,导致不必要且昂贵的步骤,例如,在算法上重新安装已正确安装的DIMM。另外,制造团队估计每一百万第一次插入失败的缺陷率是2000-5000,这些测度包括已经安装的计算平台,如服务器和PC。这表示识别故障的DIMM和重新安装或者替换它们的巨大的制造成本。通常,在DIMM和平台上使用阶段式的连接器和额外的硬件来检测未正确安装的组件。然而,示例系统使用计算设备的基本输入输出系统(BIOS)检测DIMM安装错误。
图1是可用于检测DIMM安装错误的示例系统100的框图。图1所示的功能框和设备可包括硬件元件、软件元件或者硬件元件和软件元件二者的组合,硬件元件包括电路,软件元件包括存储在有形的、非瞬态的、机器可读介质上的计算机代码。此外,系统100的功能框和设备只是可在多个示例中实现的功能框和设备的一个示例。系统100可包括任何数量的计算设备,例如手机、个人数字助理(PDA)、计算机、服务器、笔记本或者其他计算设备。
示例系统100可包括计算机102,计算机102具有通过总线106连接至显示器108的处理器104、键盘110以及输入设备112,比如鼠标、触摸屏等。计算机102还可包括储存操作软件和数据的有形的计算机可读介质,如硬盘驱动器114或内存116。硬盘驱动器114可包括硬盘驱动器阵列、光驱、光驱阵列、闪存驱动器等。内存116可用于储存程序、数据和操作软件,并且可包括例如BIOS 118、随机存取存储器(RAM)120和DIMM内存条128。
通常,BIOS 118控制计算机系统的启动过程。在这样做时,BIOS 118可执行许多功能,包括识别、测试和初始化系统设备,比如内存116、人机接口、网络接口、磁盘驱动器等。初始化之后,BIOS 118可启动操作系统,并且把部分或者全部功能传递给操作系统。
BIOS 118在DIMM上的DIMM内存条128中执行训练过程。训练过程是控制器用来在控制器和DIMM中的DRAM存储元件之间建立可靠的信号通道的过程。训练错误代表内存条128有问题。在示例系统中,未正确安装的DIMM导致训练错误。因此,如果发生训练错误,则BIOS 118确定是否产生训练错误的DIMM未正确安装。如果DIMM未正确安装,则可产生错误消息指示未正确安装的DIMM。
BIOS 118通常存储在只读存储器(ROM)芯片上。然而,示例系统不限于存储在ROM芯片上的BIOS 118,如可使用当前技术中的其他配置。例如,可使用ROM中的代码序列将BIOS镜像从硬盘驱动114加载到RAM 120中。于是,计算机可以从RAM 120中的BIOS镜像启动。在示例中,BIOS镜像的更新可以被应用于储存在硬盘驱动上的BIOS镜像。根据本文包含的公开,本领域普通技术人员将识别出可使用的许多其他任何配置。
计算机102可通过总线106连接至网络接口卡(NIC)122。NIC 122可将计算机102连接到网络124。网络124可以是局域网(LAN)、广域网(WAN)或其它网络配置。网络124可包括路由器、交换机、调制解调器或用于互联的其他任何种类的接口设备。此外,网络124可包括互联网或企业网络。计算机102可通过网络124与一个或多个远程计算机126进行通信。可类似于计算机102配置远程计算机126。
图2是根据示例具有若干DIMM的内存条128的透视图。内存条128可以布置在电路板202上,并且可包括一个或多个安装在内存插槽206上的DIMM包204。内存条128可被包括在任何合适的计算机系统,例如,台式计算机、刀片式服务器等等中。
每一个DIMM包204可包括DIMM 208、散热器210以及夹片212。DIMM 208可包括一个或多个存储器芯片,其可包括任何合适类型的存储器,例如静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、同步DRAM(SDRAM)、双数据速率(DDR)、SDRAM等。
散热器210可包括任何合适的导热材料,用来从DIMM 208支出热量。夹片212可跨装在DIMM包204的顶部边缘,并且夹住散热器210的边以控制散热器210和DIMM 208接触。夹片212可由任何合适的弹性材料例如铝、塑料等制成。
图3是用于检测DIMM安装错误的示例方法300的处理流程图。该方法300由BIOS 118执行,并且在框302开始,在框302BIOS 118针对每个DIMM 208开始训练过程。在框304,BIOS 118执行写入均衡过程。写入均衡是针对DDR3DIMM和DDR4DIMM的训练过程的一部分。
在框306,BIOS 118确定是否发生了训练错误。写入均衡过程改变时钟和数据线(DQ)序列(DQS)之间的关系。DQS表示在非训练模式操作期间控制器和指示有效数据的DRAM存储元件之间的时序信号。每个单独的DRAM感知这两个信号之间的关系,并且为DDR3把结果返回到DQ0上以及为DDR4把结果返回到所有DQ上。这导致101或010的DQ序列被返回。如果这两个序列都没有被观察到,则发生训练错误。
如果发生了训练错误,则在框308,BIOS 118确定产生训练错误的DIMM是否有安装错误。通过分析当训练错误产生时训练错误的模式,可以确定安装错误的决定。例如,穿过整个DIMM的全部故障的DRAM并不指示DIMM未正确安装,这是因为全部故障的DRAM指示I2C接口没有工作。如果I2C接口不工作,则在那个位置被插入的DIMM不会被检测到(假设插入的DIMM的清单在启动周期之间被保存)。
然而,如果单独的DRAM故障并且它位于接近DIMM的一端,那么DIMM可能没有被正确安装。另外,单比特位失效(DDR4)指示可能的污染问题,其可以通过清洁DIMM和重新安装被解决。此外,如果有针对多个DRAM的训练错误,则未正确安装的DIMM通过集中在接近DIMM一端的DRAM指示。此外,当返回有效写入均衡数据的DIMM未被检测到时,也指示DIMM未正确安装。如果有安装错误,则在框310,生成指示DIMM有安装错误的消息。
图4是显示存储有代码的示例有形的、非瞬态的机器可读介质400的框图,代码被采用以检测DIMM安装错误。该机器可读介质整体由附图标记400表示。机器可读介质400可对应于存储有计算机可执行指令,如程序代码等的任何典型的存储设备。此外,机器可读介质400可包括在图1所示的存储122中。当通过处理器402读取和执行时,存储在机器可读介质400上的指令被采用以使处理器402检测DIMM安装错误。该介质包括安装错误检测器406。该安装错误检测器406针对DIMM模块中的每个DRAM接收训练序列。如果训练序列指示一个或多个训练错误,则安装错误检测器406基于DRAM的位置和具有训练错误的DRAM的数量确定是否有安装错误408。安装错误检测器生成指示安装错误和指定DIMM模块的消息。
Claims (20)
1.一种用于检测双列直插式存储模块(DIMM)安装错误的方法,所述方法包括:
确定是否发生针对DIMM的多个动态随机存取存储器(DRAM)的训练错误;
识别每个所述DRAM的位置;以及
基于所述训练错误、所述DRAM的数量和所述DRAM的所述位置,确定是否发生安装错误。
2.根据权利要求1所述的方法,其中如果所述数量等于1,则发生所述安装错误。
3.根据权利要求1所述的方法,其中如果所述数量大于1并且所述位置布置于接近所述DIMM的一端,则发生所述安装错误。
4.根据权利要求1所述的方法,其中如果所述数量指示DRAM全部故障,则没有发生所述安装错误。
5.根据权利要求1所述的方法,其中写入均衡过程包括确定是否发生所述安装错误。
6.根据权利要求1所述的方法,其中所述DIMM包括DDR3DRAM和DDR4DRAM。
7.根据权利要求1所述的方法,包括生成指示所述安装错误和所述DIMM的错误消息。
8.根据权利要求1所述的方法,包括:
移除所述DIMM;以及
重新安装所述DIMM。
9.根据权利要求8所述的方法,包括从所述DIMM移除污染物。
10.根据权利要求1所述的方法,其中如果发生以下情形,则发生所述安装错误:
所述DIMM返回了有效的写入均衡数据;以及
所述DIMM没有被检测到。
11.一种用于检测DIMM安装错误的计算机系统,所述计算机系统包括:
处理器,用于执行存储的指令;以及
存储指令的存储器设备,所述存储器设备包括:
用于确定是否发生针对DIMM的多个动态随机存取存储器(DRAM)的训练错误的计算机执行代码;
用于识别每个所述DRAM的位置的计算机执行代码;以及
用于基于所述训练错误、所述DRAM的数量和所述DRAM的所述位置,确定是否发生安装错误的计算机执行代码,其中,写入均衡过程包括确定是否发生所述安装错误。
12.根据权利要求11所述的计算机系统,其中如果所述数量等于1,则发生所述安装错误。
13.根据权利要求11所述的计算机系统,其中如果所述数量大于1并且所述位置布置于接近所述DIMM的一端,则发生所述安装错误。
14.根据权利要求11所述的计算机系统,其中如果所述数量指示DRAM全部故障,则没有发生所述安装错误。
15.根据权利要求11所述的计算机系统,其中如果发生以下情形,则发生所述安装错误:
所述DIMM返回有效的写入均衡数据;以及
所述DIMM没有被检测到。
16.根据权利要求11所述的计算机系统,其中所述DIMM包括DDR3DRAM和DDR4DRAM。
17.根据权利要求11所述的计算机系统,包括用于生成指示所述安装错误和所述DIMM的错误消息的计算机执行代码。
18.根据权利要求11所述的计算机系统,包括:
用于移除所述DIMM的装置;以及
用于重新安装所述DIMM的装置。
19.根据权利要求18所述的计算机系统,包括用于从所述DIMM移除污染物的装置。
20.一种有形的、非瞬态的机器可读介质,所述机器可读介质存储处理器可执行的机器可读指令以检测DIMM安装错误;所述有形的、非瞬态的机器可读介质包括:
当被所述处理器执行时,确定是否发生针对DIMM的多个动态随机存取存储器(DRAM)的训练错误的机器可读指令;
当被所述处理器执行时,识别每个所述DRAM的位置的机器可读指令;
当被所述处理器执行时,基于所述训练错误、所述DRAM的数量和所述DRAM的所述位置,确定是否发生安装错误的机器可读指令;以及
当被所述处理器执行时,用于生成指示所述安装错误和所述DIMM的错误消息的机器可读指令。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2012/048626 WO2014018060A1 (en) | 2012-07-27 | 2012-07-27 | Systems and methods for detecting a dimm seating error |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104272265A true CN104272265A (zh) | 2015-01-07 |
Family
ID=49997688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280072884.0A Pending CN104272265A (zh) | 2012-07-27 | 2012-07-27 | 用于检测dimm安装错误的系统和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20150143186A1 (zh) |
EP (1) | EP2877925A4 (zh) |
KR (1) | KR20150035687A (zh) |
CN (1) | CN104272265A (zh) |
WO (1) | WO2014018060A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110501554A (zh) * | 2019-08-15 | 2019-11-26 | 苏州浪潮智能科技有限公司 | 一种存储芯片安装的检测方法及装置 |
CN110659234A (zh) * | 2018-06-30 | 2020-01-07 | 联想企业解决方案(新加坡)有限公司 | 服务器主板和主板dimm插槽的填充方法 |
CN114816822A (zh) * | 2022-05-07 | 2022-07-29 | 宝德计算机系统股份有限公司 | 一种基于内存故障的服务器管理方法、装置以及系统 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102707683B1 (ko) | 2016-07-12 | 2024-09-20 | 삼성전자주식회사 | 메모리 채널의 소프트웨어 트레이닝을 수행하는 전자 장치 및 그것의 메모리 채널 트레이닝 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020016942A1 (en) * | 2000-01-26 | 2002-02-07 | Maclaren John M. | Hard/soft error detection |
US20050028038A1 (en) * | 2003-07-30 | 2005-02-03 | Pomaranski Ken Gary | Persistent volatile memory fault tracking |
CN102214125A (zh) * | 2011-06-13 | 2011-10-12 | 浪潮电子信息产业股份有限公司 | 一种内存ecc功能的测试方法 |
US20120072786A1 (en) * | 2010-09-21 | 2012-03-22 | International Business Machines Corporation | Use of hashing function to distinguish random and repeat errors in a memory system |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5953243A (en) * | 1998-09-30 | 1999-09-14 | International Business Machines Corporation | Memory module identification |
US6766469B2 (en) * | 2000-01-25 | 2004-07-20 | Hewlett-Packard Development Company, L.P. | Hot-replace of memory |
KR100493058B1 (ko) * | 2003-04-15 | 2005-06-02 | 삼성전자주식회사 | 소켓 이상 유무를 실시간으로 판단하는 반도체 소자의전기적 검사방법 |
US7331010B2 (en) * | 2004-10-29 | 2008-02-12 | International Business Machines Corporation | System, method and storage medium for providing fault detection and correction in a memory subsystem |
US7979759B2 (en) * | 2009-01-08 | 2011-07-12 | International Business Machines Corporation | Test and bring-up of an enhanced cascade interconnect memory system |
US20100251029A1 (en) * | 2009-03-26 | 2010-09-30 | International Business Machines Corporation | Implementing self-optimizing ipl diagnostic mode |
US8255773B2 (en) * | 2009-06-29 | 2012-08-28 | Sandisk Technologies Inc. | System and method of tracking error data within a storage device |
US20120247504A1 (en) * | 2010-10-01 | 2012-10-04 | Waleed Nasr | System and Method for Sub-micron Level Cleaning of Surfaces |
US8788883B2 (en) * | 2010-12-16 | 2014-07-22 | Dell Products L.P. | System and method for recovering from a configuration error |
US8508999B2 (en) * | 2011-09-29 | 2013-08-13 | Intel Corporation | Vertical NAND memory |
-
2012
- 2012-07-27 CN CN201280072884.0A patent/CN104272265A/zh active Pending
- 2012-07-27 KR KR1020147030428A patent/KR20150035687A/ko not_active Application Discontinuation
- 2012-07-27 WO PCT/US2012/048626 patent/WO2014018060A1/en active Application Filing
- 2012-07-27 EP EP12881788.9A patent/EP2877925A4/en not_active Withdrawn
- 2012-07-27 US US14/395,951 patent/US20150143186A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020016942A1 (en) * | 2000-01-26 | 2002-02-07 | Maclaren John M. | Hard/soft error detection |
US20050028038A1 (en) * | 2003-07-30 | 2005-02-03 | Pomaranski Ken Gary | Persistent volatile memory fault tracking |
US7143236B2 (en) * | 2003-07-30 | 2006-11-28 | Hewlett-Packard Development Company, Lp. | Persistent volatile memory fault tracking using entries in the non-volatile memory of a fault storage unit |
US20120072786A1 (en) * | 2010-09-21 | 2012-03-22 | International Business Machines Corporation | Use of hashing function to distinguish random and repeat errors in a memory system |
CN102214125A (zh) * | 2011-06-13 | 2011-10-12 | 浪潮电子信息产业股份有限公司 | 一种内存ecc功能的测试方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110659234A (zh) * | 2018-06-30 | 2020-01-07 | 联想企业解决方案(新加坡)有限公司 | 服务器主板和主板dimm插槽的填充方法 |
CN110659234B (zh) * | 2018-06-30 | 2024-02-02 | 联想企业解决方案(新加坡)有限公司 | 服务器主板和主板dimm插槽的填充方法 |
CN110501554A (zh) * | 2019-08-15 | 2019-11-26 | 苏州浪潮智能科技有限公司 | 一种存储芯片安装的检测方法及装置 |
CN110501554B (zh) * | 2019-08-15 | 2022-04-26 | 苏州浪潮智能科技有限公司 | 一种存储芯片安装的检测方法及装置 |
CN114816822A (zh) * | 2022-05-07 | 2022-07-29 | 宝德计算机系统股份有限公司 | 一种基于内存故障的服务器管理方法、装置以及系统 |
Also Published As
Publication number | Publication date |
---|---|
KR20150035687A (ko) | 2015-04-07 |
EP2877925A4 (en) | 2016-03-30 |
US20150143186A1 (en) | 2015-05-21 |
EP2877925A1 (en) | 2015-06-03 |
WO2014018060A1 (en) | 2014-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110119327A (zh) | 用于校正存储器错误的共享的奇偶校验 | |
US9818492B2 (en) | Method for testing a memory and memory system | |
US7596648B2 (en) | System and method for information handling system error recovery | |
US20050028038A1 (en) | Persistent volatile memory fault tracking | |
JP2012532372A5 (zh) | ||
US8572444B2 (en) | Memory apparatus and testing method thereof | |
WO2009129174A3 (en) | Apparatus and method for identifying disk drives with unreported data corruption | |
JP6070374B2 (ja) | 情報処理装置、メモリ試験プログラムおよびメモリ試験方法 | |
US9917601B2 (en) | Adaptive error correction in a memory system | |
KR20090118863A (ko) | 오퍼레이팅 시스템 메모리 핫 애드를 시뮬레이션하여 파워온 시간을 감소시키는 방법 | |
US20140328132A1 (en) | Memory margin management | |
WO2016022156A1 (en) | Error counters on a memory device | |
TWI632459B (zh) | 記憶體位址保護電路與方法 | |
CN104272265A (zh) | 用于检测dimm安装错误的系统和方法 | |
US20140164822A1 (en) | Host computer and method for managing sas expanders of sas expander storage system | |
US20170103797A1 (en) | Calibration method and device for dynamic random access memory | |
WO2014068739A1 (ja) | 情報処理装置、およびメモリ試験方法 | |
US20140317473A1 (en) | Implementing ecc redundancy using reconfigurable logic blocks | |
CN107807870B (zh) | 一种存储服务器主板掉电保护功能的测试方法和系统 | |
US8312311B2 (en) | Computer system and method for automatically overclocking based upon a signal standard and an I/O signal of overclocking element | |
US20130151886A1 (en) | Computing device and method for switching physical links of a sas expander of the computing device | |
CN116244127A (zh) | 一种硬盘检测方法、装置、设备以及存储介质 | |
US20060206764A1 (en) | Memory reliability detection system and method | |
US11862275B2 (en) | System and method for verifying and analyzing memory for high performance computing systems | |
EP4127932A1 (en) | Targeted repair of hardware components in a computing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150107 |
|
WD01 | Invention patent application deemed withdrawn after publication |