Nothing Special   »   [go: up one dir, main page]

CN104272265A - 用于检测dimm安装错误的系统和方法 - Google Patents

用于检测dimm安装错误的系统和方法 Download PDF

Info

Publication number
CN104272265A
CN104272265A CN201280072884.0A CN201280072884A CN104272265A CN 104272265 A CN104272265 A CN 104272265A CN 201280072884 A CN201280072884 A CN 201280072884A CN 104272265 A CN104272265 A CN 104272265A
Authority
CN
China
Prior art keywords
dimm
setup error
dram
machine readable
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280072884.0A
Other languages
English (en)
Inventor
麦尔文·K·贝内迪克特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of CN104272265A publication Critical patent/CN104272265A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/02Detection or location of defective auxiliary circuits, e.g. defective refresh counters
    • G11C29/022Detection or location of defective auxiliary circuits, e.g. defective refresh counters in I/O circuitry
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C29/08Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C29/08Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
    • G11C29/10Test algorithms, e.g. memory scan [MScan] algorithms; Test patterns, e.g. checkerboard patterns 
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/52Protection of memory contents; Detection of errors in memory contents
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/56External testing equipment for static stores, e.g. automatic test equipment [ATE]; Interfaces therefor
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C5/00Details of stores covered by group G11C11/00
    • G11C5/02Disposition of storage elements, e.g. in the form of a matrix array
    • G11C5/04Supports for storage elements, e.g. memory modules; Mounting or fixing of storage elements on such supports
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C5/00Details of stores covered by group G11C11/00
    • G11C5/06Arrangements for interconnecting storage elements electrically, e.g. by wiring

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

可检测DIMM安装错误。示例检测方法包括确定是否发生针对DIMM的动态随机存取存储器(DRAM)的训练错误。示例方法包括识别每个DRAM的位置。示例方法包括基于训练错误、数量和DRAM的位置确定是否发生安装错误。

Description

用于检测DIMM安装错误的系统和方法
背景技术
在许多计算设备,如个人电脑(PC)中,随机存取存储器(RAM)采用双列直插式存储模块(DIMM)的形式。DIMM与总线交互或者通过被配置为安装独立的DIMM的插槽互联。当使在DIMM插槽中良好接触时,DIMM被正确安装。未良好接触的DIMM降低了PC的性能。然而,通常安装DIMM用于提高计算机处理的速度,未正确安装的DIMM具有相反的效果。而且,具有未正确安装的DIMM的PC不能利用DIMM中的所有内存,并且导致PC报告许多错误。此外,未正确安装的DIMM造成间歇接触,这产生严重错误和无法补救的错误。
附图说明
在下面的详细说明和参考附图中,描述了某些示例,附图中:
图1是可用于检测双列直插式存储模块(DIMM)安装错误的示例系统的框图;
图2是根据示例具有若干DIMM的内存条的透视图;
图3是用于检测DIMM安装错误的示例方法的处理流程图;以及
图4是显示存储有代码的示例有形的、非瞬态性的机器可读介质的框图,所述代码被采用以检测DIMM安装错误。
具体实施方式
由于对计算设备适当处理的影响,生产个人电脑(PC)和其他此类设备的公司在把设备运送给客户和零售商之前,试图检测和重新安装未正确安装的双列直插式存储模块(DIMM)。然而,检测方法容易产生错误,导致不必要且昂贵的步骤,例如,在算法上重新安装已正确安装的DIMM。另外,制造团队估计每一百万第一次插入失败的缺陷率是2000-5000,这些测度包括已经安装的计算平台,如服务器和PC。这表示识别故障的DIMM和重新安装或者替换它们的巨大的制造成本。通常,在DIMM和平台上使用阶段式的连接器和额外的硬件来检测未正确安装的组件。然而,示例系统使用计算设备的基本输入输出系统(BIOS)检测DIMM安装错误。
图1是可用于检测DIMM安装错误的示例系统100的框图。图1所示的功能框和设备可包括硬件元件、软件元件或者硬件元件和软件元件二者的组合,硬件元件包括电路,软件元件包括存储在有形的、非瞬态的、机器可读介质上的计算机代码。此外,系统100的功能框和设备只是可在多个示例中实现的功能框和设备的一个示例。系统100可包括任何数量的计算设备,例如手机、个人数字助理(PDA)、计算机、服务器、笔记本或者其他计算设备。
示例系统100可包括计算机102,计算机102具有通过总线106连接至显示器108的处理器104、键盘110以及输入设备112,比如鼠标、触摸屏等。计算机102还可包括储存操作软件和数据的有形的计算机可读介质,如硬盘驱动器114或内存116。硬盘驱动器114可包括硬盘驱动器阵列、光驱、光驱阵列、闪存驱动器等。内存116可用于储存程序、数据和操作软件,并且可包括例如BIOS 118、随机存取存储器(RAM)120和DIMM内存条128。
通常,BIOS 118控制计算机系统的启动过程。在这样做时,BIOS 118可执行许多功能,包括识别、测试和初始化系统设备,比如内存116、人机接口、网络接口、磁盘驱动器等。初始化之后,BIOS 118可启动操作系统,并且把部分或者全部功能传递给操作系统。
BIOS 118在DIMM上的DIMM内存条128中执行训练过程。训练过程是控制器用来在控制器和DIMM中的DRAM存储元件之间建立可靠的信号通道的过程。训练错误代表内存条128有问题。在示例系统中,未正确安装的DIMM导致训练错误。因此,如果发生训练错误,则BIOS 118确定是否产生训练错误的DIMM未正确安装。如果DIMM未正确安装,则可产生错误消息指示未正确安装的DIMM。
BIOS 118通常存储在只读存储器(ROM)芯片上。然而,示例系统不限于存储在ROM芯片上的BIOS 118,如可使用当前技术中的其他配置。例如,可使用ROM中的代码序列将BIOS镜像从硬盘驱动114加载到RAM 120中。于是,计算机可以从RAM 120中的BIOS镜像启动。在示例中,BIOS镜像的更新可以被应用于储存在硬盘驱动上的BIOS镜像。根据本文包含的公开,本领域普通技术人员将识别出可使用的许多其他任何配置。
计算机102可通过总线106连接至网络接口卡(NIC)122。NIC 122可将计算机102连接到网络124。网络124可以是局域网(LAN)、广域网(WAN)或其它网络配置。网络124可包括路由器、交换机、调制解调器或用于互联的其他任何种类的接口设备。此外,网络124可包括互联网或企业网络。计算机102可通过网络124与一个或多个远程计算机126进行通信。可类似于计算机102配置远程计算机126。
图2是根据示例具有若干DIMM的内存条128的透视图。内存条128可以布置在电路板202上,并且可包括一个或多个安装在内存插槽206上的DIMM包204。内存条128可被包括在任何合适的计算机系统,例如,台式计算机、刀片式服务器等等中。
每一个DIMM包204可包括DIMM 208、散热器210以及夹片212。DIMM 208可包括一个或多个存储器芯片,其可包括任何合适类型的存储器,例如静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、同步DRAM(SDRAM)、双数据速率(DDR)、SDRAM等。
散热器210可包括任何合适的导热材料,用来从DIMM 208支出热量。夹片212可跨装在DIMM包204的顶部边缘,并且夹住散热器210的边以控制散热器210和DIMM 208接触。夹片212可由任何合适的弹性材料例如铝、塑料等制成。
图3是用于检测DIMM安装错误的示例方法300的处理流程图。该方法300由BIOS 118执行,并且在框302开始,在框302BIOS 118针对每个DIMM 208开始训练过程。在框304,BIOS 118执行写入均衡过程。写入均衡是针对DDR3DIMM和DDR4DIMM的训练过程的一部分。
在框306,BIOS 118确定是否发生了训练错误。写入均衡过程改变时钟和数据线(DQ)序列(DQS)之间的关系。DQS表示在非训练模式操作期间控制器和指示有效数据的DRAM存储元件之间的时序信号。每个单独的DRAM感知这两个信号之间的关系,并且为DDR3把结果返回到DQ0上以及为DDR4把结果返回到所有DQ上。这导致101或010的DQ序列被返回。如果这两个序列都没有被观察到,则发生训练错误。
如果发生了训练错误,则在框308,BIOS 118确定产生训练错误的DIMM是否有安装错误。通过分析当训练错误产生时训练错误的模式,可以确定安装错误的决定。例如,穿过整个DIMM的全部故障的DRAM并不指示DIMM未正确安装,这是因为全部故障的DRAM指示I2C接口没有工作。如果I2C接口不工作,则在那个位置被插入的DIMM不会被检测到(假设插入的DIMM的清单在启动周期之间被保存)。
然而,如果单独的DRAM故障并且它位于接近DIMM的一端,那么DIMM可能没有被正确安装。另外,单比特位失效(DDR4)指示可能的污染问题,其可以通过清洁DIMM和重新安装被解决。此外,如果有针对多个DRAM的训练错误,则未正确安装的DIMM通过集中在接近DIMM一端的DRAM指示。此外,当返回有效写入均衡数据的DIMM未被检测到时,也指示DIMM未正确安装。如果有安装错误,则在框310,生成指示DIMM有安装错误的消息。
图4是显示存储有代码的示例有形的、非瞬态的机器可读介质400的框图,代码被采用以检测DIMM安装错误。该机器可读介质整体由附图标记400表示。机器可读介质400可对应于存储有计算机可执行指令,如程序代码等的任何典型的存储设备。此外,机器可读介质400可包括在图1所示的存储122中。当通过处理器402读取和执行时,存储在机器可读介质400上的指令被采用以使处理器402检测DIMM安装错误。该介质包括安装错误检测器406。该安装错误检测器406针对DIMM模块中的每个DRAM接收训练序列。如果训练序列指示一个或多个训练错误,则安装错误检测器406基于DRAM的位置和具有训练错误的DRAM的数量确定是否有安装错误408。安装错误检测器生成指示安装错误和指定DIMM模块的消息。

Claims (20)

1.一种用于检测双列直插式存储模块(DIMM)安装错误的方法,所述方法包括:
确定是否发生针对DIMM的多个动态随机存取存储器(DRAM)的训练错误;
识别每个所述DRAM的位置;以及
基于所述训练错误、所述DRAM的数量和所述DRAM的所述位置,确定是否发生安装错误。
2.根据权利要求1所述的方法,其中如果所述数量等于1,则发生所述安装错误。
3.根据权利要求1所述的方法,其中如果所述数量大于1并且所述位置布置于接近所述DIMM的一端,则发生所述安装错误。
4.根据权利要求1所述的方法,其中如果所述数量指示DRAM全部故障,则没有发生所述安装错误。
5.根据权利要求1所述的方法,其中写入均衡过程包括确定是否发生所述安装错误。
6.根据权利要求1所述的方法,其中所述DIMM包括DDR3DRAM和DDR4DRAM。
7.根据权利要求1所述的方法,包括生成指示所述安装错误和所述DIMM的错误消息。
8.根据权利要求1所述的方法,包括:
移除所述DIMM;以及
重新安装所述DIMM。
9.根据权利要求8所述的方法,包括从所述DIMM移除污染物。
10.根据权利要求1所述的方法,其中如果发生以下情形,则发生所述安装错误:
所述DIMM返回了有效的写入均衡数据;以及
所述DIMM没有被检测到。
11.一种用于检测DIMM安装错误的计算机系统,所述计算机系统包括:
处理器,用于执行存储的指令;以及
存储指令的存储器设备,所述存储器设备包括:
用于确定是否发生针对DIMM的多个动态随机存取存储器(DRAM)的训练错误的计算机执行代码;
用于识别每个所述DRAM的位置的计算机执行代码;以及
用于基于所述训练错误、所述DRAM的数量和所述DRAM的所述位置,确定是否发生安装错误的计算机执行代码,其中,写入均衡过程包括确定是否发生所述安装错误。
12.根据权利要求11所述的计算机系统,其中如果所述数量等于1,则发生所述安装错误。
13.根据权利要求11所述的计算机系统,其中如果所述数量大于1并且所述位置布置于接近所述DIMM的一端,则发生所述安装错误。
14.根据权利要求11所述的计算机系统,其中如果所述数量指示DRAM全部故障,则没有发生所述安装错误。
15.根据权利要求11所述的计算机系统,其中如果发生以下情形,则发生所述安装错误:
所述DIMM返回有效的写入均衡数据;以及
所述DIMM没有被检测到。
16.根据权利要求11所述的计算机系统,其中所述DIMM包括DDR3DRAM和DDR4DRAM。
17.根据权利要求11所述的计算机系统,包括用于生成指示所述安装错误和所述DIMM的错误消息的计算机执行代码。
18.根据权利要求11所述的计算机系统,包括:
用于移除所述DIMM的装置;以及
用于重新安装所述DIMM的装置。
19.根据权利要求18所述的计算机系统,包括用于从所述DIMM移除污染物的装置。
20.一种有形的、非瞬态的机器可读介质,所述机器可读介质存储处理器可执行的机器可读指令以检测DIMM安装错误;所述有形的、非瞬态的机器可读介质包括:
当被所述处理器执行时,确定是否发生针对DIMM的多个动态随机存取存储器(DRAM)的训练错误的机器可读指令;
当被所述处理器执行时,识别每个所述DRAM的位置的机器可读指令;
当被所述处理器执行时,基于所述训练错误、所述DRAM的数量和所述DRAM的所述位置,确定是否发生安装错误的机器可读指令;以及
当被所述处理器执行时,用于生成指示所述安装错误和所述DIMM的错误消息的机器可读指令。
CN201280072884.0A 2012-07-27 2012-07-27 用于检测dimm安装错误的系统和方法 Pending CN104272265A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2012/048626 WO2014018060A1 (en) 2012-07-27 2012-07-27 Systems and methods for detecting a dimm seating error

Publications (1)

Publication Number Publication Date
CN104272265A true CN104272265A (zh) 2015-01-07

Family

ID=49997688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280072884.0A Pending CN104272265A (zh) 2012-07-27 2012-07-27 用于检测dimm安装错误的系统和方法

Country Status (5)

Country Link
US (1) US20150143186A1 (zh)
EP (1) EP2877925A4 (zh)
KR (1) KR20150035687A (zh)
CN (1) CN104272265A (zh)
WO (1) WO2014018060A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110501554A (zh) * 2019-08-15 2019-11-26 苏州浪潮智能科技有限公司 一种存储芯片安装的检测方法及装置
CN110659234A (zh) * 2018-06-30 2020-01-07 联想企业解决方案(新加坡)有限公司 服务器主板和主板dimm插槽的填充方法
CN114816822A (zh) * 2022-05-07 2022-07-29 宝德计算机系统股份有限公司 一种基于内存故障的服务器管理方法、装置以及系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102707683B1 (ko) 2016-07-12 2024-09-20 삼성전자주식회사 메모리 채널의 소프트웨어 트레이닝을 수행하는 전자 장치 및 그것의 메모리 채널 트레이닝 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020016942A1 (en) * 2000-01-26 2002-02-07 Maclaren John M. Hard/soft error detection
US20050028038A1 (en) * 2003-07-30 2005-02-03 Pomaranski Ken Gary Persistent volatile memory fault tracking
CN102214125A (zh) * 2011-06-13 2011-10-12 浪潮电子信息产业股份有限公司 一种内存ecc功能的测试方法
US20120072786A1 (en) * 2010-09-21 2012-03-22 International Business Machines Corporation Use of hashing function to distinguish random and repeat errors in a memory system

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5953243A (en) * 1998-09-30 1999-09-14 International Business Machines Corporation Memory module identification
US6766469B2 (en) * 2000-01-25 2004-07-20 Hewlett-Packard Development Company, L.P. Hot-replace of memory
KR100493058B1 (ko) * 2003-04-15 2005-06-02 삼성전자주식회사 소켓 이상 유무를 실시간으로 판단하는 반도체 소자의전기적 검사방법
US7331010B2 (en) * 2004-10-29 2008-02-12 International Business Machines Corporation System, method and storage medium for providing fault detection and correction in a memory subsystem
US7979759B2 (en) * 2009-01-08 2011-07-12 International Business Machines Corporation Test and bring-up of an enhanced cascade interconnect memory system
US20100251029A1 (en) * 2009-03-26 2010-09-30 International Business Machines Corporation Implementing self-optimizing ipl diagnostic mode
US8255773B2 (en) * 2009-06-29 2012-08-28 Sandisk Technologies Inc. System and method of tracking error data within a storage device
US20120247504A1 (en) * 2010-10-01 2012-10-04 Waleed Nasr System and Method for Sub-micron Level Cleaning of Surfaces
US8788883B2 (en) * 2010-12-16 2014-07-22 Dell Products L.P. System and method for recovering from a configuration error
US8508999B2 (en) * 2011-09-29 2013-08-13 Intel Corporation Vertical NAND memory

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020016942A1 (en) * 2000-01-26 2002-02-07 Maclaren John M. Hard/soft error detection
US20050028038A1 (en) * 2003-07-30 2005-02-03 Pomaranski Ken Gary Persistent volatile memory fault tracking
US7143236B2 (en) * 2003-07-30 2006-11-28 Hewlett-Packard Development Company, Lp. Persistent volatile memory fault tracking using entries in the non-volatile memory of a fault storage unit
US20120072786A1 (en) * 2010-09-21 2012-03-22 International Business Machines Corporation Use of hashing function to distinguish random and repeat errors in a memory system
CN102214125A (zh) * 2011-06-13 2011-10-12 浪潮电子信息产业股份有限公司 一种内存ecc功能的测试方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659234A (zh) * 2018-06-30 2020-01-07 联想企业解决方案(新加坡)有限公司 服务器主板和主板dimm插槽的填充方法
CN110659234B (zh) * 2018-06-30 2024-02-02 联想企业解决方案(新加坡)有限公司 服务器主板和主板dimm插槽的填充方法
CN110501554A (zh) * 2019-08-15 2019-11-26 苏州浪潮智能科技有限公司 一种存储芯片安装的检测方法及装置
CN110501554B (zh) * 2019-08-15 2022-04-26 苏州浪潮智能科技有限公司 一种存储芯片安装的检测方法及装置
CN114816822A (zh) * 2022-05-07 2022-07-29 宝德计算机系统股份有限公司 一种基于内存故障的服务器管理方法、装置以及系统

Also Published As

Publication number Publication date
KR20150035687A (ko) 2015-04-07
EP2877925A4 (en) 2016-03-30
US20150143186A1 (en) 2015-05-21
EP2877925A1 (en) 2015-06-03
WO2014018060A1 (en) 2014-01-30

Similar Documents

Publication Publication Date Title
CN110119327A (zh) 用于校正存储器错误的共享的奇偶校验
US9818492B2 (en) Method for testing a memory and memory system
US7596648B2 (en) System and method for information handling system error recovery
US20050028038A1 (en) Persistent volatile memory fault tracking
JP2012532372A5 (zh)
US8572444B2 (en) Memory apparatus and testing method thereof
WO2009129174A3 (en) Apparatus and method for identifying disk drives with unreported data corruption
JP6070374B2 (ja) 情報処理装置、メモリ試験プログラムおよびメモリ試験方法
US9917601B2 (en) Adaptive error correction in a memory system
KR20090118863A (ko) 오퍼레이팅 시스템 메모리 핫 애드를 시뮬레이션하여 파워온 시간을 감소시키는 방법
US20140328132A1 (en) Memory margin management
WO2016022156A1 (en) Error counters on a memory device
TWI632459B (zh) 記憶體位址保護電路與方法
CN104272265A (zh) 用于检测dimm安装错误的系统和方法
US20140164822A1 (en) Host computer and method for managing sas expanders of sas expander storage system
US20170103797A1 (en) Calibration method and device for dynamic random access memory
WO2014068739A1 (ja) 情報処理装置、およびメモリ試験方法
US20140317473A1 (en) Implementing ecc redundancy using reconfigurable logic blocks
CN107807870B (zh) 一种存储服务器主板掉电保护功能的测试方法和系统
US8312311B2 (en) Computer system and method for automatically overclocking based upon a signal standard and an I/O signal of overclocking element
US20130151886A1 (en) Computing device and method for switching physical links of a sas expander of the computing device
CN116244127A (zh) 一种硬盘检测方法、装置、设备以及存储介质
US20060206764A1 (en) Memory reliability detection system and method
US11862275B2 (en) System and method for verifying and analyzing memory for high performance computing systems
EP4127932A1 (en) Targeted repair of hardware components in a computing device

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150107

WD01 Invention patent application deemed withdrawn after publication