CN117238504B - 一种智慧城市cim数据优化处理方法 - Google Patents
一种智慧城市cim数据优化处理方法 Download PDFInfo
- Publication number
- CN117238504B CN117238504B CN202311434333.0A CN202311434333A CN117238504B CN 117238504 B CN117238504 B CN 117238504B CN 202311434333 A CN202311434333 A CN 202311434333A CN 117238504 B CN117238504 B CN 117238504B
- Authority
- CN
- China
- Prior art keywords
- data
- disease
- ith
- illness state
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005457 optimization Methods 0.000 title abstract description 14
- 238000003672 processing method Methods 0.000 title abstract description 9
- 201000010099 disease Diseases 0.000 claims abstract description 119
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 119
- 238000011156 evaluation Methods 0.000 claims abstract description 115
- 230000005180 public health Effects 0.000 claims abstract description 98
- 238000007906 compression Methods 0.000 claims abstract description 61
- 230000006835 compression Effects 0.000 claims abstract description 61
- 230000036541 health Effects 0.000 claims abstract description 60
- 238000009792 diffusion process Methods 0.000 claims abstract description 42
- 208000035473 Communicable disease Diseases 0.000 claims abstract description 30
- 208000015181 infectious disease Diseases 0.000 claims abstract description 28
- 230000005540 biological transmission Effects 0.000 claims abstract description 27
- 230000007721 medicinal effect Effects 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000010606 normalization Methods 0.000 claims description 18
- 238000001514 detection method Methods 0.000 claims description 10
- 241000700605 Viruses Species 0.000 claims description 9
- 238000002255 vaccination Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 10
- 230000000694 effects Effects 0.000 abstract description 8
- 238000004364 calculation method Methods 0.000 description 7
- 230000007480 spreading Effects 0.000 description 7
- 238000003892 spreading Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000013144 data compression Methods 0.000 description 2
- 230000003862 health status Effects 0.000 description 2
- 206010022000 influenza Diseases 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 241000711573 Coronaviridae Species 0.000 description 1
- 206010011409 Cross infection Diseases 0.000 description 1
- 206010017918 Gastroenteritis viral Diseases 0.000 description 1
- 208000020061 Hand, Foot and Mouth Disease Diseases 0.000 description 1
- 208000025713 Hand-foot-and-mouth disease Diseases 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 206010029803 Nosocomial infection Diseases 0.000 description 1
- 206010034038 Parotitis Diseases 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000005541 medical transmission Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 208000005871 monkeypox Diseases 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及数据优化处理技术领域,具体涉及一种智慧城市CIM数据优化处理方法。方法包括:获取CIM系统中待处理城市在预设时间段内不同病情的公共健康数据,根据每种病情的公共健康数据的波动情况获得峰值评估指数;根据每种病情的传染病相关数据与居民身体健康数据的差异得到传播评价值;根据每种病情的医疗资源数据、医疗服务数据和健康教育数据得到医疗成效评价值;根据每种病情的公共卫生数据、公共交通数据、传播评价值和医疗成效评价值得到扩散指数;结合峰值评估指数和扩散指数,确定最优压缩窗口长度,进而对公共健康数据进行压缩。本发明在保证公共健康数据压缩效果的同时提高了压缩效率。
Description
技术领域
本发明涉及数据优化处理技术领域,具体涉及一种智慧城市CIM数据优化处理方法。
背景技术
智慧城市是指利用先进的信息和通信技术来改善城市基础设施、提高城市管理效率、优化资源利用,从而提供更好的市民生活质量和城市可持续发展的城市发展模式。在智慧城市建设中,城市信息模型(City Information Modeling,CIM)数据优化处理是一个关键领域,CIM是一种用于描述城市基础设施和资源的数据模型,包括建筑、道路、供水、供电、交通以及地下排水系统等各种信息。通过对CIM数据的优化处理,城市管理者可以更好地了解城市的运作和需求,做出更合理的决策,提高城市管理效率。并且能够促进资源的利用效率,改善市民生活质量,推动城市可持续发展和经济增长。
一个城市中可能同时存在多种传染病,如流感、肺炎等。智慧城市CIM管理系统可以同时监测这些不同病情的相关数据,确保城市能够及时采取适当的控制措施,避免交叉感染和疫情的相互影响。然而在智慧城市CIM系统中,疫情数据可能需要从多个数据源传输到中央服务器或云平台。压缩数据可以减少数据传输的带宽需求和传输时间,确保数据的及时性。然而在使用LZ77算法对所获得的数据统计结果进行压缩时,由于病情相关数据的统计结果维度较高,不同类型的病情可能具有不同的重复模式或者数据结构,使得原始LZ77算法对数据进行压缩时的效率较低。
发明内容
为了解决现有方法在对城市CIM数据进行压缩处理时存在的压缩效率较低的问题,本发明的目的在于提供一种智慧城市CIM数据优化处理方法,所采用的技术方案具体如下:
本发明提供了一种智慧城市CIM数据优化处理方法,该方法包括以下步骤:
获取CIM系统中待处理城市在预设时间段内不同病情的公共健康数据,所述公共健康数据包括传染病相关数据、居民身体健康数据、医疗资源数据、医疗服务数据、健康教育数据、公共卫生数据、公共交通数据;
根据每种病情的所有公共健康数据的波动情况,获得每种病情的峰值评估指数;根据每种病情的传染病相关数据与居民身体健康数据之间的差异情况,得到每种病情的传播评价值;根据每种病情的医疗资源数据、医疗服务数据和健康教育数据,得到每种病情的医疗成效评价值;
根据每种病情的公共卫生数据、公共交通数据、所述传播评价值和所述医疗成效评价值,得到每种病情的扩散指数;结合所述峰值评估指数和所述扩散指数,确定每种病情数据对应的最优压缩窗口长度;
基于所述最优压缩窗口长度对每种病情的公共健康数据进行压缩,获得压缩后的数据。
优选的,所述根据每种病情的所有公共健康数据的波动情况,获得每种病情的峰值评估指数,包括:
对于第i种病情:
对第i种病情的所有公共健康数据进行傅里叶变换获得频率-幅值曲线;将所述频率-幅值曲线中最大幅值对应的频率的倒数,确定为主周期长度;
计算第i种病情的所有公共健康数据的熵值;
对第i种病情的所有公共健康数据进行曲线拟合获得第一曲线,获取所述第一曲线上极值点的数量;
根据所述熵值、所述主周期长度和所述极值点的数量,计算第i种病情的峰值评估指数。
优选的,根据所述熵值、所述主周期长度和所述极值点的数量,计算第i种病情的峰值评估指数,包括:
将所述熵值进行负相关归一化结果,记为第一特征值;
将所述主周期长度与所述极值点的数量的乘积的归一化结果,记为第二特征值;
将所述第一特征值与所述第二特征值的乘积,确定为第i种病情的峰值评估指数。
优选的,所述根据每种病情的传染病相关数据与居民身体健康数据之间的差异情况,得到每种病情的传播评价值,包括:
所述传染病相关数据包括病毒检测数据、病情扩散数据,所述居民身体健康数据包括疫苗接种数据、患者健康数据;
对于第i种病情:
将第i种病情的病毒检测数据与病情扩散数据的平均值记为第一平均值,将第i种病情的疫苗接种数据与患者健康数据的平均值记为第二平均值;
将所述第一平均值与所述第二平均值的比值的归一化结果,确定为第i种病情的传播评价值。
优选的,所述根据每种病情的医疗资源数据、医疗服务数据和健康教育数据,得到每种病情的医疗成效评价值,包括:
对于第i种病情:
将第i种病情的医疗服务数据的负相关归一化结果,记为第三特征值;
将第i种病情的医疗资源数据、第i种病情的健康教育数据和所述第三特征值三者的乘积的归一化结果,确定为第i种病情的医疗成效评价值。
优选的,所述根据每种病情的公共卫生数据、公共交通数据、所述传播评价值和所述医疗成效评价值,得到每种病情的扩散指数,包括:
对于第i种病情:
将第i种病情的公共卫生数据与公共交通数据的平均值记为第三平均值;
根据第i种病情的传播评价值、第i种病情的医疗成效评价值和所述第三平均值,得到第i种病情的扩散指数。
优选的,采用如下公式计算第i种病情的扩散指数:
;
其中,Yi为第i种病情的扩散指数,Norm( )为归一化函数,Bi为第i种病情的传播评价值,为第i种病情的公共卫生数据与公共交通数据的平均值,Ci为第i种病情的医疗成效评价值,ε为预设调整参数,ε大于0。
优选的,所述结合所述峰值评估指数和所述扩散指数,确定每种病情数据对应的最优压缩窗口长度,包括:
对于第i种病情:
基于第i种病情的峰值评估指数和扩散指数对初始压缩窗口长度进行调整,获得第i种病情数据对应的最优压缩窗口长度,所述峰值评估指数和所述扩散指数均与所述最优压缩窗口长度呈正相关关系。
优选的,基于第i种病情的峰值评估指数和扩散指数对初始压缩窗口长度进行调整,获得第i种病情数据对应的最优压缩窗口长度,包括:
将第i种病情的峰值评估指数与扩散指数的乘积的归一化结果记为第一指标;将所述第一指标与预设调参因子的乘积记为调整特征值;所述预设调参因子大于1;
基于所述调整特征值对初始压缩窗口长度进行调整,获得第i种病情数据对应的最优压缩窗口长度。
优选的,所述基于所述最优压缩窗口长度对每种病情的公共健康数据进行压缩,获得压缩后的数据,包括:
分别基于每种病情数据对应的最优压缩窗口长度,采用LZ77压缩算法对每种病情的公共健康数据进行压缩,获得压缩后的数据。
本发明至少具有如下有益效果:
本发明首先根据待处理城市每种病情的所有公共健康数据的波动情况,获得了每种病情的峰值评估指数,也即分别对每种病情的所有公共健康数据进行了综合评估,峰值评估指数能够反映公共健康数据的周期性,其值越大,意味着需要越大的窗口进行压缩处理才能更好地捕捉到数据中的波动特征。然后根据每种病情的传染病相关数据与居民身体健康数据之间的差异情况,得到了每种病情的传播评价值;根据每种病情的医疗资源数据、医疗服务数据和健康教育数据,得到了每种病情的医疗成效评价值,医疗成效评价值综合考虑了医疗资源数据、医疗服务需求和健康教育数据;考虑到公共卫生数据和公共交通数据能够反映公共卫生政策综合情况,因此本发明根据每种病情的公共卫生数据、公共交通数据、传播评价值和医疗成效评价值,得到了每种病情的扩散指数,有助于了解社会对病情扩散所做的贡献。本发明从病情扩散情况、医疗成效影响以及社会传播影响三个方面进行了分析,进而确定了每种病情的扩散指数,扩散指数反映传染病相关数据与居民身体健康数据之间的关系以及病情传播情况与患者健康的关联性;综合考虑病情传播、医疗成效和社会传播三个方面的因素,评估特定疫情在城市中的扩散情况;进一步地结合峰值评估指数和扩散指数确定每种病情数据对应的最优压缩窗口长度,使其能够通过每种病情的数据变化情况自适应地调整窗口大小,在保证公共健康数据压缩效果的同时提高了压缩效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明实施例所提供的一种智慧城市CIM数据优化处理方法的流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于阈值分割的焊缝缺陷检测方法进行详细说明如下。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种智慧城市CIM数据优化处理方法的具体方案。
一种智慧城市CIM数据优化处理方法实施例:
本实施例所针对的具体场景为:由于智慧城市CIM数据量较大,存储时需要占用较大的空间,因此一般会对智慧城市CIM数据进行压缩存储,以减少存储空间,在采用LZ77压缩算法对智慧城市CIM数据进行压缩处理时,窗口的长度设置的不合适会直接影响数据的压缩效率,本实施例首先采集了待处理城市每种病情的公共健康数据,然后根据每种病情的公共健康数据的分布情况,自适应地确定每种病情数据对应的最优压缩窗口长度,进而采用LZ77压缩算法对所对应的公共健康数据进行压缩处理。
本实施例提出了一种智慧城市CIM数据优化处理方法,如图1所示,本实施例的一种智慧城市CIM数据优化处理方法包括以下步骤:
步骤S1,获取CIM系统中待处理城市在预设时间段内不同病情的公共健康数据,所述公共健康数据包括传染病相关数据、居民身体健康数据、医疗资源数据、医疗服务数据、健康教育数据、公共卫生数据、公共交通数据。
本实施例首先获取CIM系统中待处理城市在预设时间段内不同病情的公共健康数据,本实施例中的预设时间段为与当前时刻的时间间隔小于等于预设时长的所有历史时刻构成的集合,本实施例中的预设时长为一个月,因此预设时间段为最近一个月,也即获取了CIM系统中待处理城市在最近一个月内不同病情的公共健康数据,在具体应用中,实施者可根据具体情况进行设置。本实施例中采集的病情数据包括流感、麻疹、腮腺炎、手足口病、病毒性肠胃炎、肝炎、猴痘、新型冠状病毒数据,在具体应用中,可根据实际情况进行数据采集;本实施例中的公共健康数据包括传染病相关数据、居民身体健康数据、医疗资源数据、医疗服务数据、健康教育数据、公共卫生数据、公共交通数据;传染病相关数据包括病毒检测数据和病情扩散数据,居民身体健康数据包括疫苗接种数据和患者健康数据。CIM系统中的公共健康数据是预先通过待处理城市中的检测设备、医疗机构报告或者市民报告采集到的。其中,病毒检测数据可以为检测阳性的概率;病情扩散数据可以为感染者的地理分布数据;疫苗接种数据可以为疫苗接种人数所占比例;医疗资源数据可以为医疗资源的信息,如医院床位占用比例、相关医疗设备使用率等;医疗服务数据可以为医院的就诊时间分布;健康教育数据可以为健康宣传活动在城市中的覆盖率,公共卫生数据为适宜病毒病菌传染的地区分布和卫生状况;公共交通数据可以为城市居民选择公共交通出行的概率。
使用BoW(词袋模型)将获取到的待处理城市中所有公共健康数据拆分词汇单位,形成词汇表,对于每个数据点,计算每个单词在该数据点中出现的次数创建一个向量,其中每个元素代表一个单词在该数据点中出现的次数,对于每个数据点的BoW特征向量,进行标准化处理,以消除不同量纲的影响。经过数字化和标准化处理后,每个公共健康数据点都将表示为一个数值特征向量。所有数据都通过BoW转化为了数字数据,并通过归一化消除了量纲的影响。需要说明的是:本实施例后续提到的公共健康数据均为消除量纲后的数据。
至此,本实施例获取了待处理城市在预设时间段内不同病情的公共健康数据。
步骤S2,根据每种病情的所有公共健康数据的波动情况,获得每种病情的峰值评估指数;根据每种病情的传染病相关数据与居民身体健康数据之间的差异情况,得到每种病情的传播评价值;根据每种病情的医疗资源数据、医疗服务数据和健康教育数据,得到每种病情的医疗成效评价值。
本实施例采集了待处理城市在预设时间段内不同病情的公共健康数据,本实施例接下来将分别对每种病情的公共健康数据的变化情况进行分析,确定每种病情的峰值评估指数;,用于反映公共健康数据的周期性。
对于第i种病情:
对第i种病情的所有公共健康数据进行傅里叶变换获得频率-幅值曲线;将所述频率-幅值曲线中最大幅值对应的频率的倒数,确定为主周期长度;计算第i种病情的所有公共健康数据的熵值;对第i种病情的所有公共健康数据进行曲线拟合获得对应的曲线,将此时获得的取下记为第一曲线,获取所述第一曲线上极值点的数量;将所述熵值进行负相关归一化结果,记为第一特征值;将所述主周期长度与所述极值点的数量的乘积的归一化结果,记为第二特征值;将所述第一特征值与所述第二特征值的乘积,确定为第i种病情的峰值评估指数。熵值的计算方法、曲线的拟合方法以及极值点的获取方法均为现有技术,此处不再过多赘述。第i种病情的峰值评估指数的具体计算公式为:
;
其中,Di为第i种病情的峰值评估指数,Hi为第i种病情的所有公共健康数据的熵值,Norm( )为归一化函数,Ti为第i种病情的公共健康数据的主周期长度,Mi为第i种病情对应的第一曲线上极值点的数量,e为自然常数。
第i种病情的所有公共健康数据的熵值越大,说明第i种病情的公共健康数据的混乱程度越高,也即第i种病情的公共健康数据的随机性越高;主周期长度反映公共健康数据的主要周期性,第i种病情对应的第一曲线上极值点的数量能够反映第i种病情的所有公共健康数据的整体幅度变化情况。当第i种病情的所有公共健康数据的熵值越小、主周期长度越长,对应的第一曲线上极值点的数量越多时,第i种病情的峰值评估指数越大。
采用上述方法,能够获得每种病情发的峰值评估指数。
公共健康数据的类别能够反映了解和应对特定传染病或病情的严重程度的关键因素。传染病相关数据和居民身体健康数据提供了关于病情传播和疾病爆发的实时信息,而医疗资源数据、医疗服务数据和健康教育数据代表了对特定传染病或病情的严重程度的关键因素,这类数据提供了关于病情传播和疾病爆发的实时信息,公共卫生数据和公共交通数据涵盖了影响传染病传播的广泛因素,如卫生措施、社会互动和公共交通。这些因素可以影响病情的传播途径和传播速度。
通过上述分析可知,传染病相关数据和居民身体健康数据的变化可以直接影响到医疗服务和资源的需求。例如,高传播率的病情可能导致医院床位短缺,需要调配更多的医疗资源。医疗服务和资源的可用性与公共卫生和社会因素直接相关。例如,卫生政策的执行和社区的健康教育活动可以影响人们是否寻求医疗服务,从而影响资源的利用和医疗系统的压力。公共卫生和社会因素的实施和变化可以直接影响到病情数据的变化趋势。例如,引入社会隔离政策可能导致疫情传播率下降。因此综合来看,这三个类别之间的数据联系较为密切。
对于第i种病情:
传染病相关数据通常与病情的传播和爆发有关,这些数据涵盖了病毒检测、感染率、疫情扩散速度等,它们通常与传染病的监测和控制直接相关;而居民身体健康数据通常涵盖了患者的健康状态、疾病历史、医疗记录等信息,这些数据反映了个体或群体的健康状况。前者主要用于直接反映病情监测和传染病控制情况,后者主要用于通过个体或群体的健康评估反映病情的抑制情况。本实施例将对传染病相关数据与居民身体健康数据进行分析。
具体地,将第i种病情的病毒检测数据与病情扩散数据的平均值记为第一平均值,将第i种病情的疫苗接种数据与患者健康数据的平均值记为第二平均值;将所述第一平均值与所述第二平均值的比值的归一化结果,确定为第i种病情的传播评价值。需要说明的是,本实施例在对所述第一平均值与所述第二平均值的比值进行归一化处理时,利用Norm函数进行归一化处理,作为其他实施方式,也可以利用其他归一化函数进行归一化处理。在计算传播评价值时,传染病相关数据的均值作为了分子,居民身体健康数据的均值用作为了分母。传播评价值反映了病情的传播情况,传染病相关数据的数据值越大时,病例增加或病情的扩散越快,第i种病情的传播评价值也会越大。而当居民身体健康数据的数据值越大时说明居民身体越健康,第i种病情的传播评价值越小。
将第i种病情的医疗服务数据的负相关归一化结果,记为第三特征值;将第i种病情的医疗资源数据、第i种病情的健康教育数据和所述第三特征值三者的乘积的归一化结果,确定为第i种病情的医疗成效评价值。将第i种病情的公共卫生数据与公共交通数据的平均值记为第三平均值;根据第i种病情的传播评价值、第i种病情的医疗成效评价值和所述第三平均值,得到第i种病情的扩散指数。第i种病情的医疗成效评价值的具体计算公式分别为:
;
其中,Ci为第i种病情的医疗成效评价值,Ei为第i种病情的医疗资源数据,Gi为第i种病情的健康教育数据,Fi为第i种病情的医疗服务数据,e为自然常数。
表示第三特征值。当医疗资源数据和健康教育数据越大时,医疗成效评价值越大;医疗服务需求越小时,说明医院需要对该病情治疗的患者减少,第i种病情的医疗成效评价值会越大。第i种病情的公共卫生数据与公共交通数据的平均值用于反映公共卫生政策的综合情况,本实施例考虑了公共卫生措施和社会因素对政策的影响。
采用上述方法,能够获得每种病情的传播评价值和医疗成效评价值。
步骤S3,根据每种病情的公共卫生数据、公共交通数据、所述传播评价值和所述医疗成效评价值,得到每种病情的扩散指数;结合所述峰值评估指数和所述扩散指数,确定每种病情数据对应的最优压缩窗口长度。
本实施例已经获得了每种病情的传播评价值和医疗成效评价值,传播评价值是基于传染病相关数据和居民身体健康数据获得的,医疗成效评价值是基于医疗资源数据、医疗服务数据和健康教育数据获得的,接下来本实施例将结合公共卫生数据和公共交通数据,确定每种病情的扩散指数。
对于第i种病情:
将第i种病情的公共卫生数据与公共交通数据的平均值记为第三平均值;根据第i种病情的传播评价值、第i种病情的医疗成效评价值和所述第三平均值,得到第i种病情的扩散指数;第i种病情的扩散指数的具体计算公式为:
;
其中,Yi为第i种病情的扩散指数,Norm( )为归一化函数,Bi为第i种病情的传播评价值,为第i种病情的公共卫生数据与公共交通数据的平均值,Ci为第i种病情的医疗成效评价值,ε为预设调整参数,ε大于0。
表示第三平均值。扩散指数的计算公式中引入预设调整参数是为了防止分母为0,为了防止预设调整参数对计算结果的影响,预设调整参数应当设置为足够小的正数,本实施例中预设调整参数为10-6,在具体应用中,实施者可根据具体情况进行设置。疫情传播速度越大且社会传播影响越大时,第i种病情的扩散指数越大。由于有效的治疗方法会减缓病情传播速度,因此医疗成效评价值会对关系产生抑制作用,从而降低疫情扩散指数的值。
采用上述方法,能够获得每种病情的扩散指数。
本实施例接下来将结合每种病情的峰值评估指数和扩散指数,确定每种病情数据对应的最优压缩窗口长度。
对于第i种病情:
基于第i种病情的峰值评估指数和扩散指数对初始压缩窗口长度进行调整,获得第i种病情数据对应的最优压缩窗口长度,所述峰值评估指数和所述扩散指数均与所述最优压缩窗口长度呈正相关关系。将第i种病情的峰值评估指数与扩散指数的乘积的归一化结果记为第一指标;将所述第一指标与预设调参因子的乘积记为调整特征值;所述预设调参因子大于1;基于所述调整特征值对初始压缩窗口长度进行调整,获得第i种病情数据对应的最优压缩窗口长度。第i种病情数据对应的最优压缩窗口长度的具体计算公式为:
;
其中,为第i种病情数据对应的最优压缩窗口长度,Li为初始压缩窗口长度,/>为向上取整符号,α为预设调参因子。
本实施例中预设调参因子的取值为2,在具体应用中,实施者可根据具体情况进行设置。初始压缩窗口长度是LZ77算法初始设置的窗口长度。扩散指数越大,则代表疫情扩散情况在不同时间或地点之间变化越大,存在更多的波动和不确定性。在这种情况下,窗口长度应当随之增大,以适应较大范围内的数据波动,捕获公共健康数据中可能存在的数据变化情况。峰值评估指数越大,说明公共健康数据中存在明显且越多的重复周期性,在这种情况下,应该使用较大的窗口捕捉到整个周期的重复序列,因此第i种病情数据对应的最优压缩窗口长度越大。
采用上述方法,能够获得每种病情数据对应的最优压缩窗口长度。
步骤S4,基于所述最优压缩窗口长度对每种病情的公共健康数据进行压缩,获得压缩后的数据。
本实施例自适应地确定了每种病情数据对应的最优压缩窗口长度,接下来将基于最优压缩窗口长度对所对应的公共健康数据进行压缩处理。
具体地,分别基于每种病情数据对应的最优压缩窗口长度,采用LZ77压缩算法对每种病情的公共健康数据进行压缩,获得压缩后的数据。LZ77压缩算法为现有技术,此处不再过多赘述。
至此,采用本实施例提供的方法完成了对待处理城市不同病情的公共健康数据的压缩处理,在保证压缩效果的同时提高了压缩效率。
本实施例首先根据待处理城市每种病情的所有公共健康数据的波动情况,获得了每种病情的峰值评估指数,也即分别对每种病情的所有公共健康数据进行了综合评估,峰值评估指数能够反映公共健康数据的周期性,其值越大,意味着需要越大的窗口进行压缩处理才能更好地捕捉到数据中的波动特征。然后根据每种病情的传染病相关数据与居民身体健康数据之间的差异情况,得到了每种病情的传播评价值;根据每种病情的医疗资源数据、医疗服务数据和健康教育数据,得到了每种病情的医疗成效评价值,医疗成效评价值综合考虑了医疗资源数据、医疗服务需求和健康教育数据;考虑到公共卫生数据和公共交通数据能够反映公共卫生政策综合情况,因此本实施例根据每种病情的公共卫生数据、公共交通数据、传播评价值和医疗成效评价值,得到了每种病情的扩散指数,有助于了解社会对病情扩散所做的贡献。本实施例从病情扩散情况、医疗成效影响以及社会传播影响三个方面进行了分析,进而确定了每种病情的扩散指数,扩散指数反映传染病相关数据与居民身体健康数据之间的关系以及病情传播情况与患者健康的关联性;综合考虑病情传播、医疗成效和社会传播三个方面的因素,评估特定疫情在城市中的扩散情况;进一步地结合峰值评估指数和扩散指数确定每种病情数据对应的最优压缩窗口长度,使其能够通过每种病情的数据变化情况自适应地调整窗口大小,在保证公共健康数据压缩效果的同时提高了压缩效率。
需要说明的是:以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.一种智慧城市CIM数据优化处理方法,其特征在于,该方法包括以下步骤:
获取CIM系统中待处理城市在预设时间段内不同病情的公共健康数据,所述公共健康数据包括传染病相关数据、居民身体健康数据、医疗资源数据、医疗服务数据、健康教育数据、公共卫生数据、公共交通数据;
根据每种病情的所有公共健康数据的波动情况,获得每种病情的峰值评估指数;根据每种病情的传染病相关数据与居民身体健康数据之间的差异情况,得到每种病情的传播评价值;根据每种病情的医疗资源数据、医疗服务数据和健康教育数据,得到每种病情的医疗成效评价值;
根据每种病情的公共卫生数据、公共交通数据、所述传播评价值和所述医疗成效评价值,得到每种病情的扩散指数;结合所述峰值评估指数和所述扩散指数,确定每种病情数据对应的最优压缩窗口长度;
基于所述最优压缩窗口长度对每种病情的公共健康数据进行压缩,获得压缩后的数据;
所述根据每种病情的所有公共健康数据的波动情况,获得每种病情的峰值评估指数,包括:
对于第i种病情:
对第i种病情的所有公共健康数据进行傅里叶变换获得频率-幅值曲线;将所述频率-幅值曲线中最大幅值对应的频率的倒数,确定为主周期长度;
计算第i种病情的所有公共健康数据的熵值;
对第i种病情的所有公共健康数据进行曲线拟合获得第一曲线,获取所述第一曲线上极值点的数量;
根据所述熵值、所述主周期长度和所述极值点的数量,计算第i种病情的峰值评估指数;
根据所述熵值、所述主周期长度和所述极值点的数量,计算第i种病情的峰值评估指数,包括:
将所述熵值进行负相关归一化结果,记为第一特征值;
将所述主周期长度与所述极值点的数量的乘积的归一化结果,记为第二特征值;
将所述第一特征值与所述第二特征值的乘积,确定为第i种病情的峰值评估指数;
所述根据每种病情的传染病相关数据与居民身体健康数据之间的差异情况,得到每种病情的传播评价值,包括:
所述传染病相关数据包括病毒检测数据、病情扩散数据,所述居民身体健康数据包括疫苗接种数据、患者健康数据;
对于第i种病情:
将第i种病情的病毒检测数据与病情扩散数据的平均值记为第一平均值,将第i种病情的疫苗接种数据与患者健康数据的平均值记为第二平均值;
将所述第一平均值与所述第二平均值的比值的归一化结果,确定为第i种病情的传播评价值;
所述根据每种病情的医疗资源数据、医疗服务数据和健康教育数据,得到每种病情的医疗成效评价值,包括:
对于第i种病情:
将第i种病情的医疗服务数据的负相关归一化结果,记为第三特征值;
将第i种病情的医疗资源数据、第i种病情的健康教育数据和所述第三特征值三者的乘积的归一化结果,确定为第i种病情的医疗成效评价值;
所述根据每种病情的公共卫生数据、公共交通数据、所述传播评价值和所述医疗成效评价值,得到每种病情的扩散指数,包括:
对于第i种病情:
将第i种病情的公共卫生数据与公共交通数据的平均值记为第三平均值;
根据第i种病情的传播评价值、第i种病情的医疗成效评价值和所述第三平均值,得到第i种病情的扩散指数;
采用如下公式计算第i种病情的扩散指数:
;
其中,Yi为第i种病情的扩散指数,Norm( )为归一化函数,Bi为第i种病情的传播评价值,为第i种病情的公共卫生数据与公共交通数据的平均值,Ci为第i种病情的医疗成效评价值,ε为预设调整参数,ε大于0;
所述结合所述峰值评估指数和所述扩散指数,确定每种病情数据对应的最优压缩窗口长度,包括:
对于第i种病情:
基于第i种病情的峰值评估指数和扩散指数对初始压缩窗口长度进行调整,获得第i种病情数据对应的最优压缩窗口长度,所述峰值评估指数和所述扩散指数均与所述最优压缩窗口长度呈正相关关系;
基于第i种病情的峰值评估指数和扩散指数对初始压缩窗口长度进行调整,获得第i种病情数据对应的最优压缩窗口长度,包括:
将第i种病情的峰值评估指数与扩散指数的乘积的归一化结果记为第一指标;将所述第一指标与预设调参因子的乘积记为调整特征值;所述预设调参因子大于1;
基于所述调整特征值对初始压缩窗口长度进行调整,获得第i种病情数据对应的最优压缩窗口长度;
所述基于所述最优压缩窗口长度对每种病情的公共健康数据进行压缩,获得压缩后的数据,包括:
分别基于每种病情数据对应的最优压缩窗口长度,采用LZ77压缩算法对每种病情的公共健康数据进行压缩,获得压缩后的数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311434333.0A CN117238504B (zh) | 2023-11-01 | 2023-11-01 | 一种智慧城市cim数据优化处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311434333.0A CN117238504B (zh) | 2023-11-01 | 2023-11-01 | 一种智慧城市cim数据优化处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117238504A CN117238504A (zh) | 2023-12-15 |
CN117238504B true CN117238504B (zh) | 2024-04-09 |
Family
ID=89096890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311434333.0A Active CN117238504B (zh) | 2023-11-01 | 2023-11-01 | 一种智慧城市cim数据优化处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117238504B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117747129B (zh) * | 2024-02-21 | 2024-04-30 | 天津大学 | 基于候诊流程的医院感染风险空间分布预测方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103546162A (zh) * | 2013-09-22 | 2014-01-29 | 上海交通大学 | 基于非连续上下文建模和最大熵原则的基因压缩方法 |
CN104156990A (zh) * | 2014-07-03 | 2014-11-19 | 华南理工大学 | 一种支持特大型数据窗口的无损压缩编码方法及系统 |
CN109684284A (zh) * | 2018-12-29 | 2019-04-26 | 南方电网科学研究院有限责任公司 | 基于边缘计算的滑动分块重复数据删除方法 |
CN114157305A (zh) * | 2021-11-18 | 2022-03-08 | 华中科技大学 | 一种基于硬件快速实现gzip压缩的方法及其应用 |
WO2023040367A1 (zh) * | 2021-09-15 | 2023-03-23 | 华为技术有限公司 | 一种数据压缩方法及装置 |
CN115883670A (zh) * | 2023-02-21 | 2023-03-31 | 湖南格尔智慧科技有限公司 | 一种医疗数据分析采集方法及装置 |
WO2023160123A1 (zh) * | 2022-02-24 | 2023-08-31 | 麒麟软件有限公司 | Lz系列压缩算法编解码速度优化方法 |
CN116828070A (zh) * | 2023-08-28 | 2023-09-29 | 无锡市锡容电力电器有限公司 | 一种智慧电网数据优化传输方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7027982B2 (en) * | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
US7507897B2 (en) * | 2005-12-30 | 2009-03-24 | Vtech Telecommunications Limited | Dictionary-based compression of melody data and compressor/decompressor for the same |
US7765346B2 (en) * | 2007-12-14 | 2010-07-27 | Bmc Software, Inc. | Dynamic compression of systems management data |
US7864085B2 (en) * | 2009-02-05 | 2011-01-04 | Lsi Corporation | Data compression method and apparatus |
EP2658443B1 (en) * | 2010-12-31 | 2018-06-27 | TomTom Global Content B.V. | Accelerometer data compression |
CN110021369B (zh) * | 2017-10-24 | 2020-03-17 | 人和未来生物科技(长沙)有限公司 | 基因测序数据压缩解压方法、系统及计算机可读介质 |
-
2023
- 2023-11-01 CN CN202311434333.0A patent/CN117238504B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103546162A (zh) * | 2013-09-22 | 2014-01-29 | 上海交通大学 | 基于非连续上下文建模和最大熵原则的基因压缩方法 |
CN104156990A (zh) * | 2014-07-03 | 2014-11-19 | 华南理工大学 | 一种支持特大型数据窗口的无损压缩编码方法及系统 |
CN109684284A (zh) * | 2018-12-29 | 2019-04-26 | 南方电网科学研究院有限责任公司 | 基于边缘计算的滑动分块重复数据删除方法 |
WO2023040367A1 (zh) * | 2021-09-15 | 2023-03-23 | 华为技术有限公司 | 一种数据压缩方法及装置 |
CN114157305A (zh) * | 2021-11-18 | 2022-03-08 | 华中科技大学 | 一种基于硬件快速实现gzip压缩的方法及其应用 |
WO2023160123A1 (zh) * | 2022-02-24 | 2023-08-31 | 麒麟软件有限公司 | Lz系列压缩算法编解码速度优化方法 |
CN115883670A (zh) * | 2023-02-21 | 2023-03-31 | 湖南格尔智慧科技有限公司 | 一种医疗数据分析采集方法及装置 |
CN116828070A (zh) * | 2023-08-28 | 2023-09-29 | 无锡市锡容电力电器有限公司 | 一种智慧电网数据优化传输方法 |
Non-Patent Citations (2)
Title |
---|
The Sliding-Window Lempel-Ziv Algorithm is Asymptotically Optimal;A.D.Wyner&J.Ziv;Proceedings of the IEEE;19940630;872-877 * |
倒排索引压缩算法研究综述;姜琨;朱磊;宋省身;杨岳湘;;小型微型计算机系统;20200409(第04期);715-723 * |
Also Published As
Publication number | Publication date |
---|---|
CN117238504A (zh) | 2023-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111680912B (zh) | 一种旱涝急转风险评估方法 | |
CN117238504B (zh) | 一种智慧城市cim数据优化处理方法 | |
JP2021162591A (ja) | 3層データセットニューラルネットワークによる性能地震動危険度解析方法 | |
WO2021129086A1 (zh) | 流量预测方法、装置以及存储介质 | |
WO2021190658A1 (zh) | 一种传染病预测设备、方法、装置及存储介质 | |
CN113328755B (zh) | 一种面向边缘计算的压缩数据传输方法 | |
CN111343650B (zh) | 一种基于跨域数据和对抗损失的城市尺度无线业务流量预测方法 | |
CN111710433B (zh) | 传染病的发展趋势预测方法及系统 | |
CN109166630A (zh) | 一种传染病数据监控处理方法和系统 | |
JP7315018B2 (ja) | 情報処理方法、記憶媒体、及び情報処理装置 | |
CN112398700A (zh) | 一种服务降级方法及装置、存储介质、计算机设备 | |
CN116453696B (zh) | 基于人员时空分布模型的呼吸道疾病感染风险预测方法 | |
CN102347944B (zh) | 基于小波算法的心电信号传输方法和系统 | |
CN112532615B (zh) | 一种智能电网蠕虫检测方法 | |
CN117649063B (zh) | 基于人口大数据的公共服务设施选址规划方法 | |
CN113393177A (zh) | 一种城市清洁智能监测系统及方法 | |
LU505334B1 (en) | Infectious disease trend prediction system and method based on big data | |
CN116777845B (zh) | 基于人工智能的建筑工地安全风险智能评估方法及系统 | |
CN117767960B (zh) | 一种传感器数据优化采集存储方法 | |
CN112488805A (zh) | 基于多元回归时间序列分析的长租市场预警方法 | |
CN112529311A (zh) | 一种基于图卷积分析的道路流量预测方法和装置 | |
CN110545282A (zh) | 一种基于无线体域网的数据采集与分析系统及低能耗数据融合隐私保护算法 | |
CN116894585B (zh) | 一种应用于未来社区综合数据智能分析方法和系统 | |
CN112867110B (zh) | 通信小区的效能识别方法、装置及电子设备 | |
CN116095084B (zh) | 一种基于区块链的智能电网数据存储方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |