CN116016606B - 一种基于智慧云的污水处理运维数据高效管理系统 - Google Patents
一种基于智慧云的污水处理运维数据高效管理系统 Download PDFInfo
- Publication number
- CN116016606B CN116016606B CN202310026043.6A CN202310026043A CN116016606B CN 116016606 B CN116016606 B CN 116016606B CN 202310026043 A CN202310026043 A CN 202310026043A CN 116016606 B CN116016606 B CN 116016606B
- Authority
- CN
- China
- Prior art keywords
- data
- layer
- bit block
- bit
- binary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000010865 sewage Substances 0.000 title claims abstract description 28
- 238000012423 maintenance Methods 0.000 title claims abstract description 18
- 238000007906 compression Methods 0.000 claims abstract description 41
- 230000006835 compression Effects 0.000 claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 14
- 238000007405 data analysis Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 108091026890 Coding region Proteins 0.000 claims description 8
- 230000006837 decompression Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 description 10
- 238000007726 management method Methods 0.000 description 10
- 238000013144 data compression Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- XKMRRTOUMJRJIA-UHFFFAOYSA-N ammonia nh3 Chemical compound N.N XKMRRTOUMJRJIA-UHFFFAOYSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02W—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
- Y02W10/00—Technologies for wastewater treatment
- Y02W10/10—Biological treatment of water, waste water, or sewage
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及一种基于智慧云的污水处理运维数据高效管理系统,该系统包括:数据预处理模块,用于获取污水处理过程中的每个待存储数据的二进制编码,对二进制编码进行划分得到比特块,根据比特块的位置设置比特块对应的标识符;数据分析模块,用于构建二进制编码表;根据每层比特块的数据类型得到每层对应的合并必要性;根据合并必要性对需要合并的层进行合并得到优选二进制编码表;压缩存储模块,用于根据优选二进制编码表中每层比特块确定基元大小,根据基元大小统计游程长度对所有层进行游程编码压缩,对压缩得到的数据序列进行存储。本发明能够对污水处理运维数据进行高效存储管理。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于智慧云的污水处理运维数据高效管理系统。
背景技术
智能运营管理系统是通过智能采集设备运行过程中的基础数据,利用相关的数据处理手段达到智能化的系统。由于污水处理的站点多,各个站点采集到的数据均会传输至中央处理系统进行数据分析,并保留设备运行的基础数据,该过程势必会产生大量的数据需要存储,因此会加重系统的存储压力,故需要对采集到的数据进行压缩后存储。目前,利用较为常用的游程编码对数据进行压缩时,针对连续多个重复数据进行压缩的效果较高,而对于较少的连续重复数据的压缩效果较差,甚至出现数据膨胀的现象。
发明内容
为了解决游程编码对较少的连续重复数据的压缩效果较差,进而导致无法对运维数据进行高效存储管理的技术问题,本发明的目的在于提供一种基于智慧云的污水处理运维数据高效管理系统,所采用的技术方案具体如下:
数据预处理模块,用于对污水处理过程中的每个待存储数据进行二进制转换,得到每个待存储数据的二进制编码,利用设定长度对二进制编码进行划分得到至少两个比特块,根据比特块的位置设置比特块对应的标识符;
数据分析模块,用于将待存储数据的二进制编码对应的比特块和标识符放置不同层中,构建二进制编码表;根据每层比特块的数据类型得到每层对应的合并必要性;根据合并必要性对需要合并的层进行合并,得到优选二进制编码表;
压缩存储模块,用于根据优选二进制编码表中每层比特块确定基元大小,根据基元大小统计游程长度对所有层进行游程编码压缩,对压缩得到的数据序列进行存储。
优选地,所述根据优选二进制编码表中每层比特块确定基元大小具体为:
在优选二进制编码表中,将经过合并后的层记为合并层,将未合并的层记为独立层,将标识符所在层记为标识符层;对于合并层,以比特块的编码数据长度作为基元大小;对于独立层和标识符层,以预设的固定长度作为基元大小。
优选地,所述根据比特块的位置设置比特块对应的标识符具体为:
将任意一个比特块记为目标比特块,在目标比特块所在的二进制编码中,若目标比特块后还存在比特块,则将目标比特块的标识符设置为第一数值;若目标比特块后不存在比特块,则将目标比特块的标识符设置为第二数值。
优选地,所述合并必要性的获取方法具体为:
对于任意一层比特块,统计每种类型比特块出现的次数,将出现的次数最多的类型对应的比特块记为选定比特块,计算除选定比特块外其他所有类型比特块出现的次数的均值,计算选定比特块出现的次数与所述均值的差值,所述差值与选定比特块出现的次数之间的比值为该层对应的合并必要性。
优选地,所述将待存储数据的二进制编码对应的比特块和标识符放置不同层中,构建二进制编码表,包括:
将待存储数据的二进制编码对应的比特块按照编码顺序进行排列,将每个待存储数据对应的排列顺序中第一个比特块放置在第一层比特层中,将第一个比特块对应的标识符放置在第一层标识符层中,将每个待存储数据对应的排列顺序中第二个比特块放置在第二个比特层中,将第二个比特块对应的标识符放置在第二层标识符层中,以此类推,直至所有比特块和标识符均被放置完成,得到二进制编码表。
优选地,所述根据合并必要性对需要合并的层进行合并,得到优选二进制编码表,包括:
当合并必要性大于或等于预设的合并阈值时,将对应层的比特块与其上一层的比特块进行合并,得到优选二进制编码表。
优选地,所述根据基元大小统计游程长度对所有层进行游程编码压缩具体为:
对于任意一层,长度为基元大小的二进制编码段构成元素,统计元素连续出现的次数得到游程长度,利用游程长度对该层进行游程编码压缩;将各层压缩后的数据按照设定顺序进行拼接,在拼接处添加标记符号,得到拼接后的数据,拼接后的数据为对所有层进行游程编码压缩后得到的数据。
优选地,所述压缩存储模块还包括:
数据解压缩单元,用于在对存储数据进行解压缩时,将存储数据还原成不同层的游程编码数据,分别对不同层的游程编码数据进行解码,得到优选二进制编码表;
对于任意一个待解压缩的数据,获取待解压缩的数据的位置序号记为目标位置序号,在优选二进制编码表第一层比特块所在的层中,获取目标位置序号对应的比特块,并获取目标位置序号对应的比特块的标识符,若标识符的取值为第一数值,则在第二层比特块所在的层中获取目标位置序号对应的比特块以及比特块对应的标识符,以此类推,直到比特块对应的标识符的取值为第二数值时,将所有比特块进行拼接得到待解压缩的数据对应的二进制编码,将二进制编码转换为十进制数,得到待解压缩的数据对应的解压缩后的数据。
本发明实施例至少具有如下有益效果:
本发明将污水处理过程中的每个待存储数据转换成二进制编码,后续利用二进制编码数据进行数据存储时,数据的传输和处理均不易出错,对二进制编码进行划分得到比特块,根据比特块的位置设置标识符,考虑到数据冗余程度较低,对数据进行拆分处理后对各个部分分别进行分析,并利用标识符表示比特块所在位置的放置情况;再将比特块和标识符进行分层放置得到二进制编码表,通过对每层比特块的数据类型之间的相似性进行分析得到每层的合并必要性,对需要合并的层进行合并得到优选二进制编码表,根据优选二进制编码表中每层比特块确定基元大小,改变了游程编码中统计连续出现的元素的大小,使得原本连续重复较少的元素,连续出现的次数变多,进而提高了游程编码算法对应数据进行压缩的数据压缩率;最终根据基元大小统计游程长度对所有层进行游程编码压缩,对压缩得到的数据序列进行存储,使得游程编码对较少的连续重复数据的压缩效果较好,进而能够对污水处理运维数据进行高效存储管理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明的一种基于智慧云的污水处理运维数据高效管理系统的系统框图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于智慧云的污水处理运维数据高效管理系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于智慧云的污水处理运维数据高效管理系统的具体方案。
实施例:
请参阅图1,其示出了本发明一个实施例提供的一种基于智慧云的污水处理运维数据高效管理系统的系统框图,该系统包括:数据预处理模块,数据分析模块以及压缩存储模块。
数据预处理模块,用于对污水处理过程中的每个待存储数据进行二进制转换,得到每个待存储数据的二进制编码,利用设定长度对二进制编码进行划分得到至少两个比特块,根据比特块的位置设置比特块对应的标识符。
首先,采集污水处理过程中相应的设备运行时的运行数据,例如,污水指标检测过程中的各种数据,包括PH值、氯化物含量和氨氮含量等。将采集到的运行数据作为待存储数据,由于采集到的数据大多数并非是正整数,采集到的数据通常是浮点数据,即采集到的数据具有小数部分,计算机系统在对数据进行存储等处理时往往是基于二进制数,故在对待存储数据进行压缩处理时,需要先将待存储数据中的浮点数据转换为整数数据,进而对整数数据进行二进制转换,得到每个待存储数据的二进制编码。其中,将浮点数据转换为整数数据为公知技术,在此不再过多介绍。
需要说明的是,待存储数据之间往往存在一定的差异,即数据的冗余程度较低,此时若采用游程编码对数据进行压缩,则会造成数据膨胀。通过分析发现待存储数据之间虽然存在差异,但也具有一定的相似性。例如,对于待存储数据364、366和367,利用游程编码无法对这三个待存储数据进行压缩,但是将其转换为二进制编码后,即364(101101100)、366(101101110)和367(10101111),可以发现待存储数据的二进制编码的前7位均是相同的,若将相同的部分放置在一起,则可以大大增加数据的压缩率。基于此,可以先对待存储数据的二进制编码进行拆分放置。
在本实施例中,采集到的污水处理过程中相应的设备运行时的运行数据为时序数据,故待存储数据为时序数据,将待存储数据构成时序数据序列,待存储数据的二进制编码构成二进制编码序列。例如,时序数据序列为,对应的二进制编码序列为/>,时序数据序列/>中元素为待存储数据,二进制编码序列/>中元素为待存储数据的二进制编码。
然后,利用设定长度将待存储数据的二进制编码划分编码段,将每个编码段记为比特块其中,在本实施例中设定长度的取值为2,实施者可根据实际情况进行设置。例如,待存储数据364的二进制编码为101101100,将该二进制编码划分为长度为2的编码段,得到比特块,即从二进制编码的第一个数值开始依次向后取两个数值,直至拆分完成,得到比特块分别为10,11,01,10和0。
由于待存储数据364的二进制编码的长度为9,利用设定长度进行划分时,最后一个比特块只有一个数字,故需添加符号将最后一个比特块的长度补齐,使之与其他比特块的长度相同,即使最后一个比特块的长度也为2。在本实施例中利用*表示空格,进而补齐比特块的长度。最终待存储数据364的二进制编码为101101100,比特块分别为10,11,01,10和0*。
最后,利用设定长度对所有待存储数据的二进制编码进行划分得到对应的比特块,由于待存储数据较多,划分后的比特块数量更多,将划分得到的比特块进行放置时,为了能够准确获取完整的二进制编码,根据比特块的位置设置比特块对应的标识符,标识符能够表征其对应的比特块在二进制编码中所在位置之后的部分是否存在其他比特块,以判断二进制编码是否提取完全。
具体地,将任意一个比特块记为目标比特块,在目标比特块所在的二进制编码中,若目标比特块后还存在比特块,则将目标比特块的标识符设置为第一数值;若目标比特块后不存在比特块,则将目标比特块的标识符设置为第二数值。其中,在本实施例中,第一数值的取值为1,第二数值的取值为0,实施者可根据实际情况进行设置。
举例说明,对于待存储数据364的二进制编码为101101100,比特块分别为10,11,01,10和0*。将比特块10记为目标比特块,在二进制编码中,目标比特块10后还存在比特块11,故将目标比特块10对应的标识符设置为1。将比特块0*记为目标比特块,在二进制编码中,目标比特块0*后不存在比特块,故将目标比特块0*对应的标识符设置为0。
如表1所示,时序数据序列中的各个待存储数据的二进制编码、比特块以及比特块对应的标识符,其中n表示时序数据序列中待存储数据的总数量。
表1
数据分析模块,用于将待存储数据的二进制编码对应的比特块和标识符放置不同层中,构建二进制编码表;根据每层比特块的数据类型得到每层对应的合并必要性;根据合并必要性对需要合并的层进行合并,得到优选二进制编码表。
首先,为了方便后续的分析,需要将待存储数据的二进制编码对应的比特块和标识符放置到不同层中,具体地,将待存储数据的二进制编码对应的比特块按照编码顺序进行排列,将每个待存储数据对应的排列顺序中第一个比特块放置在第一层比特层中,将第一个比特块对应的标识符放置在第一层标识符层中,将每个待存储数据对应的排列顺序中第二个比特块放置在第二个比特层中,将第二个比特块对应的标识符放置在第二层标识符层中,以此类推,直至所有比特块和标识符均被放置完成,得到二进制编码表。
举例说明,待存储数据364的二进制编码对应的比特块按照编码顺序进行排列的结果为10,11,01,10和0*,则排列顺序中第一个比特块为10,将比特块10放置在第一层比特层中,将第一个比特块10对应的标识符1放置在第一层标识符层中。排列顺序中第二个比特块为11,将比特块11放置在第二层比特层中,将第二个比特块11对应的标识符1放置在第二层标识符层中,以此类推,直至所有比特块和标识符均被放置完成,得到的二进制编码表如表2所示。
表2
表2中,A1表示第一层比特层,B1表示第一层标识符层,A2表示第二层比特层,B2表示第二层标识符层,A3表示第三层比特层,B3表示第三层标识符层,A4表示第四层比特层,B4表示第四层标识符层,A5表示第五层比特层,B5表示第五层标识符层。
然后,在二进制编码表中,将数据拆分成比特块以及比特块对应的标识符,如此便增大了对二进制编码表中的数据进行压缩时的数据量,故可以通过分析拆分后的数据之间的关系,进而将能够被合并的比特块进行合并,在保证分层效果的同时,使得最终的压缩率较大。
在本发明实施例的示例中,待存储数据的二进制编码的前7位数字均是相同的,若将前7位作为一个比特块,不仅可以将相同的二进制编码数字置于同一层,还可以大大减少标识符的个数。对于待存储数据364,其对应的比特块共有5个,比特块对应的标识符则也有5个,若将待存储数据364的二进制编码的前7位合并为一个比特块,最后两位构成一个比特块,则合并后的比特块和标识符均有两个,合并后仍具有分层效果,但是标识符的个数减少,相应的最终进行压缩时的数据量也就减少。
基于此,为了达到更大的压缩率,需要使得标识符增加的数量应当尽可能的少,故可通过对初始拆分的比特块进行合并,以减少标识符的数量。对于任意一层比特块,相同类型的比特块出现的次数越多,则说明该层比特块的相似性越高,将该层比特块与其他层比特块进行合并有利于减少标识符的数量。
根据每层比特块的数据类型得到每层对应的合并必要性,具体地,对于任意一层比特块,统计每种类型比特块出现的次数,将出现的次数最多的类型对应的比特块记为选定比特块,计算除选定比特块外其他所有类型比特块出现的次数的均值,计算选定比特块出现的次数与所述均值的差值,所述差值与选定比特块出现的次数之间的比值为该层对应的合并必要性。
在本实施例中,将所有类型比特块出现的次数按照从小到大的顺序排列,若比特块共有L种类型,则第L个类型的比特块出现的次数即为出现次数最多的类型,即第L个类型的比特块即为选定比特块,进而所述合并必要性用公式表示为:
其中,表示第u层比特块对应的合并必要性,/>表示比特块类型出现的次数的最大值,即选定比特块出现的次数,/>表示第l个类型比特块出现的次数,L表示比特块的类型种类的总数量。
表示除选定比特块外其他所有类型比特块出现的次数的均值,反映了除出现次数最多类型的比特块外其他所有类型比特块出现次数的均衡情况。表示出现次数最多类型的比特块与其他类型的比特块之间出现的次数的差异,该差异越大,说明出现次数最多的类型对应的数量远远大于其他类型,进而说明当前层内比特块之间的相似性越高,对应的合并必要性的取值越大,说明当前层的比特块与其他层比特块进行合并的必要程度越大。
在本实施例中,利用与/>的比值,使得合并必要性的取值范围位于(0,1],当合并必要性的取值越大,越趋近于1时,说明当前层的比特块之间的相似性越大,当前层的比特块与其他层比特块进行合并的必要程度越大。当合并必要性的取值越小,越趋近于0时,说明当前层的比特块之间的相似性越小,当前层的比特块与其他层比特块进行合并的必要程度越小。
设置合并阈值,在本实施例中合并阈值的取值为0.85,当合并必要性大于或等于合并阈值时,说明此时对应层的比特块之间的相似性越大,越需要进行合并,以减少标识符的数量,故将对应层的比特块与上一层比特块进行合并,得到优选二进制编码表。
在本发明实施例的示例中,如表2所示,A2层的比特块均为11,A3层的比特块均为01,此时A2层和A3层对应的合并必要性的取值均为1,故将A2层和A3层合并后再与A1合并,此时原本的五层比特层变为三层比特层,则对应的标识符也有三层,如表3所示。
表3
需要说明的是,在上述示例中,A5层的比特块的第二位均为空格,则可将A5层的每一个比特块的第一位合并到上一层中,由于本实施例进行比特块拆分时是以长度2为参数进行拆分的,故将A5层的一位二进制数合并到A4层的同时,A4层也需将第一位合并到A4层的上一层中,则进行合并后的二进制编码表如表4所示。
表4
表4即为优选二进制编码表,表示二进制编码表中第一层比特层,/>表示二进制编码表中第一层标识符层,/>表示二进制编码表中第二层比特层,/>表示二进制编码表中第二层标识符层。
压缩存储模块,用于根据优选二进制编码表中每层比特块确定基元大小,根据基元大小统计游程长度对所有层进行游程编码压缩,对压缩得到的编码数据序列进行存储。
首先,需要说明的是,传统的游程编码实现是用当前数据元素以及该元素连续出现的次数来取代字符串中连续出现的数据部分,使用游程算法可以将较长的字符串用较短的字符串后加一个计数值来表示,进而实现了对原始数据的压缩。
但是游程编码对较少的连续重复数据的压缩效果较差,故本实施例通过改变游程编码统计连续出现的元素的大小,利用游程编码对数据进行压缩时,使得原本连续重复较少的元素,连续出现的次数变多,进而提高了游程编码算法对应数据进行压缩的数据压缩率。
举例说明,对于待存储数据364的二进制编码为101101100,利用传统的游程编码对该二进制编码进行压缩的效果较差。对于待存储数据364、366、367和364的二进制编码的前7位均相同,即前7位数值相似性较大,利用游程编码对待存储数据364、366、367和364的二进制编码进行压缩时,可将前7位数值作为一个元素,统计元素连续出现的次数,即可实现对多个数据的压缩,同时,增大了压缩率。
基于此,根据优选二进制编码表中每层比特块确定基元大小,在优选二进制编码表中,将经过合并后的层记为合并层,将未合并的层记为独立层,将标识符所在层记为标识符层;对于合并层,以比特块的编码数据长度作为基元大小;对于独立层和标识符层,以预设的固定长度作为基元大小。
在优选二进制编码表中包含了比特块所在层和标识符所在层,利用传统的游程编码对每层数据进行分层压缩处理,对比特块所在层进行压缩时的效果较差。而比特块所在层包括经过数据合并后的层和未经过数据合并的层,将经过合并后的层记为合并层,将未合并的层记为独立层。
合并层中的比特块数据的相似性较大,此时根据合并层中比特块的长度确定游程编码的基元大小,后续根据基元大小统计游程长度,降低了数据的压缩率。例如,在表4中层为合并层,/>层的比特块的长度为7,则游程编码的基元大小为7,即将一个比特块作为一个元素,对/>层各个元素连续出现的次数进行统计,表4中/>层压缩后的数据为(1011011,m),m表示元素1011011连续出现的次数。
由于独立层中比特块的长度较短,且比特块数据较不规则,故对独立层采用传统游程编码进行压缩。需要说明的是,在表4中,虽然层是经过合并获得的,但是/>层中每个比特块的长度与初始的设定长度相同,且长度较短,故对/>层也采用传统游程编码进行压缩。即对于比特块的长度与初始的设定长度相同的合并层,也采用传统游程编码进行压缩。同时,标识符层中均只包含一个数值,故对标识符层也采用传统游程编码进行压缩。
对于任意一层,长度为基元大小的二进制编码段构成元素,统计元素连续出现的次数得到游程长度,利用游程长度对该层进行游程编码压缩,进而对优选二进制编码表中所有层均进行压缩处理。
进一步的,利用游程编码算法对比特块所在层和标识符层进行压缩后,需要将各层按照设定顺序进行拼接,在拼接处添加标记符号,得到拼接后的数据,拼接后的数据为对所有层进行游程编码压缩后得到的数据。
其中,设定顺序即为第一层比特层、第一层标识符层、第二层比特层、第二层标识符层、…、第k层比特层和第k层标识符层,k为比特层的总层数,标识符和比特块是一一对应的关系,故k也表示标识符的总层数。因此,将第一层比特层与第一层标识符层进行拼接,在第一层比特层和第一层标识符层之间添加标记符号,在本实施例中标记符号为“+”,实施者可根据实际情况进行设置。进而将第一层比特层和与第一层标识符层拼接后,再与第二层比特层进行拼接,以此类推,直到所有层均被拼接完成得到拼接后的数据,则拼接后的数据为对所有层进行游程编码压缩后得到的数据。进而对压缩得到的数据序列进行存储,即可实现对污水处理的运维数据进行高效存储管理。
数据解压缩单元,用于在对存储数据进行解压缩时,将存储数据还原成不同层的游程编码数据,分别对不同层的游程编码数据进行解码,得到优选二进制编码表;对于任意一个待解压缩的数据,获取待解压缩的数据的位置序号记为目标位置序号,在优选二进制编码表第一层比特块所在的层中,获取目标位置序号对应的比特块,并获取目标位置序号对应的比特块的标识符,若标识符的取值为第一数值,则在第二层比特块所在的层中获取目标位置序号对应的比特块以及比特块对应的标识符,以此类推,直到比特块对应的标识符的取值为第二数值时,将所有比特块进行拼接得到待解压缩的数据对应的二进制编码,将二进制编码转换为十进制数,得到待解压缩的数据对应的解压缩后的数据。
具体地,在对存储的数据进行解压缩时,先需要将存储的数据还原成多层次的形式,再对数据进行解压缩操作。即利用标记符号将系统中存储的数据还原为不同层的游程编码数据,分别对不同层的游程编码的数据进行解码,得到优选二进制编码表,利用优选二进制编码可以获得解压缩后的数据。
例如,对第三个待解压缩的数据进行解码,即该待解压缩的数据的位置序号为第三个,将第三个记为目标位置序号,在第一层比特层中找到第三个待解压缩的数据对应的比特块,即第一层比特层中第三个比特块为1011011,第一层标识符层中第三个待解压缩的数据对应的标识符为1,说明该比特块后还存在比特块,故在第二层比特层中找到第三个待解压缩的数据对应比特块,即第二层比特层中第三个比特块为11,第二层标识符层中第三个数据对应的标识符为0,说明比特块11后不存在比特块,此时数据获取完成,解码得到的第三个数据的二进制编码为101101111,对应的十进制数字为367,解码成功。
此时,不仅解决了传统游程编码对相似但不相同的数据压缩率小且存在数据膨胀的问题,大大增加了数据的压缩率。同时,可以从需要解压缩的数据直接进行解压缩操作,大大增加了对数据进行解压缩的效率。
需要说明的是,在本实施例的一个示例中,时序数据序列中的各个待存储数据的二进制编码的长度均相等,作为另一个示例,时序数据序列为,对应的二进制编码序列为,即待存储数据的二进制编码长度不相同。
将待存储数据的二进制编码划分为长度为2的编码段得到比特块,具体地,待存储数据4的二进制编码为100,将其划分为长度为2的编码段得到的比特块分别为10和0,最后一个比特块的长度不足2,故需添加符号将该比特块的长度补齐,即利用*表示空格,进而补齐比特块的长度。最终待存储数据4的二进制编码为100,比特块分别为10和0*。
如表5示出了时序数据序列的各个待存储数据的二进制编码、比特块以及比特块对应的标识符。
表5
待存储数据4的二进制编码对应的比特块按照编码顺序进行排列的结果为10和0*,则排列顺序中第一个比特块为10,将比特块10放置在第一层比特层中,将第一个比特块10对应的标识符1放置在第一层标识符层中。排列顺序中第二个比特块为0*,将比特块0*放置在第二层比特层中,将第二个比特块0*对应的标识符0放置在第二层标识符层中,以此类推,直至所有比特块和标识符均被放置完成,得到的二进制编码表如表6所示。
表6
表6中,A1表示第一层比特层,B1表示第一层标识符层,A2表示第二层比特层,B2表示第二层标识符层,A3表示第三层比特层,B3表示第三层标识符层。
进一步的,在对时序数据序列中的待存储数据进行压缩存储后进行解压缩的方法为,例如对第三个数据进行解码,则在第一层比特层中找到第三个数据对应的比特块为10,第二层标识符层中找到第三个数据对应的标识符为1,说明比特块10后还存在比特块,在表6中,第一层标识符层中存在两个比特块对应的标识符为0,说明两个比特块后不存在比特块,故第二层比特层的比特块数量比第一层比特层少两个。在第一层标识符层的前三个比特块的标识符中存在两个标识符为1,故第二层比特层中第三个数据对应的比特块为第二个比特块10,比特块10对应的标识符为0,说明比特块10后不存在比特块,故解码第三个数据的二进制编码为1010,对应的十进制数字为10,解码成功。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,均应包含在本申请的保护范围之内。
Claims (7)
1.一种基于智慧云的污水处理运维数据高效管理系统,其特征在于,该系统包括:
数据预处理模块,用于对污水处理过程中的每个待存储数据进行二进制转换,得到每个待存储数据的二进制编码,利用设定长度对二进制编码进行划分得到至少两个比特块,根据比特块的位置设置比特块对应的标识符;
数据分析模块,用于将待存储数据的二进制编码对应的比特块和标识符放置不同层中,构建二进制编码表;根据每层比特块的数据类型得到每层对应的合并必要性;根据合并必要性对需要合并的层进行合并,得到优选二进制编码表;
压缩存储模块,用于根据优选二进制编码表中每层比特块确定基元大小,根据基元大小统计游程长度对所有层进行游程编码压缩,对压缩得到的数据序列进行存储;
所述合并必要性的获取方法具体为:
对于任意一层比特块,统计每种类型比特块出现的次数,将出现的次数最多的类型对应的比特块记为选定比特块,计算除选定比特块外其他所有类型比特块出现的次数的均值,计算选定比特块出现的次数与所述均值的差值,所述差值与选定比特块出现的次数之间的比值为该层对应的合并必要性。
2.根据权利要求1所述的一种基于智慧云的污水处理运维数据高效管理系统,其特征在于,所述根据优选二进制编码表中每层比特块确定基元大小具体为:
在优选二进制编码表中,将经过合并后的层记为合并层,将未合并的层记为独立层,将标识符所在层记为标识符层;对于合并层,以比特块的编码数据长度作为基元大小;对于独立层和标识符层,以预设的固定长度作为基元大小。
3.根据权利要求1所述的一种基于智慧云的污水处理运维数据高效管理系统,其特征在于,所述根据比特块的位置设置比特块对应的标识符具体为:
将任意一个比特块记为目标比特块,在目标比特块所在的二进制编码中,若目标比特块后还存在比特块,则将目标比特块的标识符设置为第一数值;若目标比特块后不存在比特块,则将目标比特块的标识符设置为第二数值。
4.根据权利要求1所述的一种基于智慧云的污水处理运维数据高效管理系统,其特征在于,所述将待存储数据的二进制编码对应的比特块和标识符放置不同层中,构建二进制编码表,包括:
将待存储数据的二进制编码对应的比特块按照编码顺序进行排列,将每个待存储数据对应的排列顺序中第一个比特块放置在第一层比特层中,将第一个比特块对应的标识符放置在第一层标识符层中,将每个待存储数据对应的排列顺序中第二个比特块放置在第二个比特层中,将第二个比特块对应的标识符放置在第二层标识符层中,以此类推,直至所有比特块和标识符均被放置完成,得到二进制编码表。
5.根据权利要求1所述的一种基于智慧云的污水处理运维数据高效管理系统,其特征在于,所述根据合并必要性对需要合并的层进行合并,得到优选二进制编码表,包括:
当合并必要性大于或等于预设的合并阈值时,将对应层的比特块与其上一层的比特块进行合并,得到优选二进制编码表。
6.根据权利要求1所述的一种基于智慧云的污水处理运维数据高效管理系统,其特征在于,所述根据基元大小统计游程长度对所有层进行游程编码压缩具体为:
对于任意一层,长度为基元大小的二进制编码段构成元素,统计元素连续出现的次数得到游程长度,利用游程长度对该层进行游程编码压缩;将各层压缩后的数据按照设定顺序进行拼接,在拼接处添加标记符号,得到拼接后的数据,拼接后的数据为对所有层进行游程编码压缩后得到的数据。
7.根据权利要求3所述的一种基于智慧云的污水处理运维数据高效管理系统,其特征在于,所述压缩存储模块还包括:
数据解压缩单元,用于在对存储数据进行解压缩时,将存储数据还原成不同层的游程编码数据,分别对不同层的游程编码数据进行解码,得到优选二进制编码表;
对于任意一个待解压缩的数据,获取待解压缩的数据的位置序号记为目标位置序号,在优选二进制编码表第一层比特块所在的层中,获取目标位置序号对应的比特块,并获取目标位置序号对应的比特块的标识符,若标识符的取值为第一数值,则在第二层比特块所在的层中获取目标位置序号对应的比特块以及比特块对应的标识符,以此类推,直到比特块对应的标识符的取值为第二数值时,将所有比特块进行拼接得到待解压缩的数据对应的二进制编码,将二进制编码转换为十进制数,得到待解压缩的数据对应的解压缩后的数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310026043.6A CN116016606B (zh) | 2023-01-09 | 2023-01-09 | 一种基于智慧云的污水处理运维数据高效管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310026043.6A CN116016606B (zh) | 2023-01-09 | 2023-01-09 | 一种基于智慧云的污水处理运维数据高效管理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116016606A CN116016606A (zh) | 2023-04-25 |
CN116016606B true CN116016606B (zh) | 2023-08-18 |
Family
ID=86026621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310026043.6A Active CN116016606B (zh) | 2023-01-09 | 2023-01-09 | 一种基于智慧云的污水处理运维数据高效管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116016606B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116303374B (zh) * | 2023-05-22 | 2023-08-29 | 深圳市维度数据科技股份有限公司 | 基于sql数据库的多维度报表数据优化压缩方法 |
CN117040542B (zh) * | 2023-10-08 | 2024-01-12 | 广东佰林电气设备厂有限公司 | 一种智能综合配电箱能耗数据处理方法 |
CN117097906B (zh) * | 2023-10-20 | 2023-12-26 | 河北天英软件科技有限公司 | 一种区域医疗资源高效利用的方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108123777A (zh) * | 2016-11-30 | 2018-06-05 | 华为技术有限公司 | 一种编码方式确定方法及装置 |
CN110198171A (zh) * | 2018-03-15 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 数据压缩方法、装置、计算机可读介质及电子设备 |
WO2021060758A1 (ko) * | 2019-09-24 | 2021-04-01 | 심인보 | 데이터 무손실 압축 장치 및 그 방법 |
CN115150201A (zh) * | 2022-09-02 | 2022-10-04 | 南通市艺龙科技有限公司 | 一种云计算数据的远程加密传输方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019865B (zh) * | 2017-09-08 | 2021-01-26 | 北京京东尚科信息技术有限公司 | 海量图片处理方法、装置、电子设备及存储介质 |
-
2023
- 2023-01-09 CN CN202310026043.6A patent/CN116016606B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108123777A (zh) * | 2016-11-30 | 2018-06-05 | 华为技术有限公司 | 一种编码方式确定方法及装置 |
CN110198171A (zh) * | 2018-03-15 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 数据压缩方法、装置、计算机可读介质及电子设备 |
WO2021060758A1 (ko) * | 2019-09-24 | 2021-04-01 | 심인보 | 데이터 무손실 압축 장치 및 그 방법 |
CN115150201A (zh) * | 2022-09-02 | 2022-10-04 | 南通市艺龙科技有限公司 | 一种云计算数据的远程加密传输方法 |
Non-Patent Citations (1)
Title |
---|
J. Senecal ; M. Duchaineau ; K.I. Joy.Length-limited variable-to-variable length codes for high-performance entropy coding.IEEE.2004,全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN116016606A (zh) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116016606B (zh) | 一种基于智慧云的污水处理运维数据高效管理系统 | |
CN103067022B (zh) | 一种整型数据无损压缩方法、解压缩方法及装置 | |
CN112953550B (zh) | 数据压缩的方法、电子设备及存储介质 | |
CN116303374B (zh) | 基于sql数据库的多维度报表数据优化压缩方法 | |
CN108768403A (zh) | 基于lzw的无损数据压缩、解压方法及lzw编码器、解码器 | |
CN100517979C (zh) | 一种数据压缩及解压缩方法 | |
CN109871362A (zh) | 一种面向流式时序数据的数据压缩方法 | |
CN104125475B (zh) | 一种多维量子数据压缩、解压缩方法及装置 | |
CN116805537B (zh) | 用于心肺康复管理系统的数据处理方法 | |
US6748520B1 (en) | System and method for compressing and decompressing a binary code image | |
JP2003524983A (ja) | 複数コーダを用いる最適化ロスレス圧縮のための方法及び装置 | |
CN115695564B (zh) | 一种物联网数据的高效传输方法 | |
CN113035282A (zh) | 基于标签数据生长基因的数据序列处理方法 | |
KR101023536B1 (ko) | 데이터 무손실 압축 방법 | |
JP5913748B2 (ja) | セキュアで損失のないデータ圧縮 | |
CN113612483A (zh) | 一种工业实时数据无损编码压缩方法 | |
CN117177100B (zh) | 一种智能ar偏振数据传输方法 | |
CN118075472A (zh) | 一种基于loco-i算法和哈夫曼编码的频谱压缩方法 | |
US10931303B1 (en) | Data processing system | |
CN115913248A (zh) | 一种直播软件开发数据智能管理系统 | |
CN115567058A (zh) | 一种结合预测与编码的时序数据有损压缩方法 | |
CN118399976B (zh) | 一种设备运行数据远程监控方法和系统 | |
CN117155408B (zh) | 一种生产数据的高效传输方法 | |
CN113868206B (zh) | 一种数据压缩方法、解压缩方法、装置及存储介质 | |
CN117082154B (zh) | 基于大数据的双路服务器数据存储系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230731 Address after: Floor 102, 401 and 6, Building 3, Hefei Innovation Center, No. 168 Jiulong Road, Economic and Technological Development Zone, Hefei City, Anhui Province, 230000 Applicant after: Anhui focus analysis and Test Technology Co.,Ltd. Address before: 230000 building 3, Hefei innovation center, No. 168, Jiulong Road, Hefei Economic and Technological Development Zone, Anhui Province Applicant before: ANHUI WANXIN ENVIRONMENTAL TECHNOLOGY CO.,LTD. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |