CN117314424B - 面向金融大数据的区块链交易系统及方法 - Google Patents
面向金融大数据的区块链交易系统及方法 Download PDFInfo
- Publication number
- CN117314424B CN117314424B CN202311198166.4A CN202311198166A CN117314424B CN 117314424 B CN117314424 B CN 117314424B CN 202311198166 A CN202311198166 A CN 202311198166A CN 117314424 B CN117314424 B CN 117314424B
- Authority
- CN
- China
- Prior art keywords
- data
- transaction
- financial
- financial data
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000013500 data storage Methods 0.000 claims abstract description 18
- 230000002159 abnormal effect Effects 0.000 claims description 98
- 238000012549 training Methods 0.000 claims description 92
- 238000012795 verification Methods 0.000 claims description 47
- 238000011156 evaluation Methods 0.000 claims description 45
- 230000006870 function Effects 0.000 claims description 24
- 238000007689 inspection Methods 0.000 claims description 20
- 238000013136 deep learning model Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 17
- 238000012790 confirmation Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 230000001737 promoting effect Effects 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 6
- 238000010845 search algorithm Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004900 laundering Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 238000013140 knowledge distillation Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012896 Statistical algorithm Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013496 data integrity verification Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000452 restraining effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/382—Payment protocols; Details thereof insuring higher security of transaction
- G06Q20/3829—Payment protocols; Details thereof insuring higher security of transaction involving key management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Accounting & Taxation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Bioethics (AREA)
- Computer Hardware Design (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种面向金融大数据的区块链交易系统及方法,涉及区块链技术领域,包括:数据采集模块,其配置为从数据提供方处采集金融数据,并将采集的金融数据以及数据提供方的信息传输至数据存储模块;数据存储模块,其配置为将接收到的金融数据以分布式账本的形式存储在区块链网络中;数据交易模块,其配置为根据数据需求方的交易请求创建交易,形成交易订单,并对交易订单进行验证,验证通过后交易成功,将交易订单加入区块链网络中;数据发布模块,其配置为将交易订单的数据发布至系统中,以供用户查询和浏览。本发明的交易系统提供了一个安全、透明、可追溯的交易环境,有助于推动金融数据的安全交易和有效利用。
Description
技术领域
本发明涉及区块链技术领域,尤其涉及一种面向金融大数据的区块链交易系统及方法。
背景技术
随着金融行业的快速发展,金融大数据已经成为了金融机构的核心资源之一。金融机构通过收集、分析和利用金融大数据,可以更好地了解客户需求,预测市场趋势,优化业务运营,从而提高市场竞争力。然而,金融大数据的收集、存储和使用过程中,存在一些问题,例如数据真实性、数据泄露、数据不可追溯等。这些问题不仅影响了金融机构的业务运营和决策,也给金融市场带来了潜在的风险。
为了解决上述问题,区块链技术被引入到金融行业。区块链技术是一种去中心化、分布式、不可篡改的数字技术,具有数据不可篡改、多方共享、可追溯等特点,可以有效解决金融大数据的信任问题。然而,现有的区块链交易系统在处理金融大数据时,存在一些问题。例如,出现交易欺诈时无法及时应对、异常交易无法及时识别、金融数据自身缺陷导致交易出现问题等。这些问题限制了区块链技术在金融大数据领域的广泛应用。
中国申请号为202010186424.7的发明专利公开了区块链供应链金融场景下的交易隐私保护和分层监管,通过交易发起方生成的派生密匙来加密交易内容,因为交易的顺序是从高层顺序向下流转,该方法可做到上级根据自己的对称密钥信息计算出下级的对称密钥信息,而下级不可反向计算出上级的对称密钥信息,但可在自己上链的数据中查看到能信流转的直线信息。该现有技术是针对用户身份来对数据加密级进行分级,达到分层监管,但没有解决数据本身质量参差不齐的问题,也没有考虑到异常交易带来的后果。
发明内容
有鉴于此,本发明提出了一种面向金融大数据的区块链交易系统及方法,实现金融数据的安全性、透明性和可追溯性。通过分布式账本的存储方式,数据存储和交易过程实现了去中心化,减少了中间环节的风险和成本。区块链的不可篡改性保证了数据的可信性和完整性,使得金融数据更加可靠和可信。本发明的交易系统提供了一个安全、透明、可追溯的交易环境,有助于推动金融数据的安全交易和有效利用。
本发明的技术方案是这样实现的:
一方面,本发明提供一种面向金融大数据的区块链交易系统,包括:
数据采集模块,其配置为从数据提供方处采集金融数据,并将采集的金融数据以及数据提供方的信息传输至数据存储模块;
数据存储模块,其配置为将接收到的金融数据以分布式账本的形式存储在区块链网络中;
数据交易模块,其配置为根据数据需求方的交易请求创建交易,形成交易订单,并对交易订单进行验证,验证通过后交易成功,将交易订单加入区块链网络中;
数据发布模块,其配置为将交易订单的数据发布至系统中,以供用户查询和浏览。
在以上技术方案的基础上,优选的,数据存储模块包括:
数据接收单元,其配置为接收数据采集模块传输的金融数据和数据提供方的信息,将金融数据和数据提供方的信息传递至数据引擎单元,数据提供方的信息包括数据提供方的用户公钥、用户私钥和账户信息;
数据引擎单元,其配置为对金融数据进行解析,将其转换为统一存储的格式,对解析后的金融数据进行处理,剔除不可用的金融数据,根据处理后的金融数据创建索引,将金融数据以文件形式存储在分布式账本中,形成金融数据文件的哈希值,并得到文件签名;
数据登记单元,其配置为根据数据提供方的用户公钥将金融数据文件的哈希值和文件签名进行加密,并根据数据提供方的用户私钥得到数字签名,将加密后的金融数据文件的哈希值、文件签名、数字签名、金融数据的价格形成智能合约,将智能合约进行登记和存储。
在以上技术方案的基础上,优选的,数据引擎单元中,对解析后的金融数据进行处理的过程为:
获取金融数据对应的元数据,对元数据进行信息提取,得到元数据信息;
根据元数据信息对金融数据进行质量检查,质量检查包括完整性检查、一致性检查、准确性检查和来源检查,将符合质量要求的金融数据保留,将不符合质量要求的金融数据予以剔除,包括:
根据元数据信息中的完整性约束对金融数据的完整性进行评估,根据完整性评估指标对金融数据的完整性评估结果进行判定,将符合完整性评估指标的金融数据保留,将不符合完整性评估指标的金融数据予以剔除,其中,完整性约束包括数据关系约束、数据范围约束和数据逻辑约束;
针对单个金融数据,比较其对应的不同来源或不同时间点的元数据信息,若比较结果为一致,则将金融数据保留,若比较结果为不一致,则将金融数据予以剔除;
根据元数据信息中的准确性约束对金融数据的准确性进行评估,根据准确性评估指标对金融数据的准确性评估结果进行判定,将符合准确性评估指标的金融数据保留,将不符合准确性评估指标的金融数据予以剔除,其中,准确性约束包括缺失值约束、异常值约束和重复值约束;
根据元数据信息抓取数据血缘关系,基于数据血缘关系对单个元数据信息进行数据溯源,若元数据信息的数据溯源路径存在,则元数据信息对应的金融数据保留,若元数据信息的数据溯源路径不存在,则元数据信息对应的金融数据予以剔除。
在以上技术方案的基础上,优选的,数据交易模块包括:
交易请求单元,其配置为接收并处理数据需求方的交易请求,对交易请求进行初步的验证,初步验证通过后,将交易请求传输至交易订单创建单元;
交易订单创建单元,其配置为根据交易请求的内容创建交易订单,交易请求的内容包括交易双方的信息、交易数据、交易描述、交易金额、交易时间和交易限制;
交易订单验证单元,其配置为对交易订单进行全面的验证,全面验证通过后,将全面验证后的交易订单传输至交易确认单元;
交易确认单元,其配置为将交易订单传送至数据提供方,经数据提供方签名确认后形成新的智能合约,执行新的智能合约完成交易,并将交易的信息广播至整个区块链网络,之后形成一个新的区块添加到区块链网络中;
交易存储单元,其配置为将交易完成后数据需求方获取的交易数据存储在区块链网络上,以供区块链节点访问和验证。
在以上技术方案的基础上,优选的,交易请求单元中,对交易请求进行初步的验证包括:
验证数据需求方的实体身份的有效性,包括数据需求方是否已注册、数据需求方的用户公钥是否有效;
检查交易金额的合理性,包括交易金额是否超过数据需求方的余额、交易金额是否符合金额限制;
检查交易数据的合规性,包括交易数据是否符合规定的格式和结构;
检查交易描述的内容信息,包括交易描述中是否包含哈希值;
检查交易请求的合法性,包括交易请求是否符合区块链网络的政策和规则。
在以上技术方案的基础上,优选的,交易订单验证单元中包含一个预训练的深度学习模型,利用深度学习模型对交易订单进行全面的验证,判定交易订单是否为异常交易:
若交易订单为异常交易,则给出异常等级,将异常交易及其异常等级反馈至区块链网络进行记录和广播,由区块链网络给出惩罚措施;
若交易订单为正常交易,则判定交易订单的全面验证通过,将全面验证后的交易订单传输至交易确认单元。
在以上技术方案的基础上,优选的,深度学习模型的预训练过程为:
步骤一、根据异常交易的种类获取N个训练任务,每个训练任务为一种异常交易类型的预测任务;
步骤二、获取与N个训练任务相关的样本数据,样本数据包含真实标签;
步骤三、构建教师网络和学生网络,并随机初始化教师网络,其中,教师网络和学生网络是基于相同结构的深度卷积神经网络构建得到;
步骤四、随机选取一个未完成的训练任务;
步骤五、将该训练任务的样本数据随机划分为k个数据子集,依次利用k个数据子集对教师网络进行分类预测,得到k组教师网络参数,取k组教师网络参数的平均值作为训练参数,利用训练参数对应的教师网络对样本数据进行二次训练,得到预测结果;
步骤六、重复步骤四和步骤五,直至N个训练任务均完成训练,得到N组预测结果,根据预测结果和真实标签得到N个训练任务的评价值;
步骤七、根据评价值和权重设置方法构建学生网络的损失函数,依次利用N个训练任务对学生网络进行训练,直至损失函数收敛,得到预训练的学生网络,将其作为预训练的深度学习模型。
进一步优选的,步骤六中,根据预测结果和真实标签得到N个训练任务的评价值,包括:
式中,F为评价值,N为训练任务的数量,i表示第i个训练任务,为第i个训练任务的训练参数,αi为第i个训练任务的预测误差,j为第j个样本数据,m为样本数据的数量,/>为第j个样本数据的真实标签,/>为第j个样本数据的预测结果,L表示误差函数;
相应地,步骤七中,根据评价值和权重设置方法构建学生网络的损失函数,包括:
式中,Loss为学生网络的损失函数,y为真实标签,F为评价值,G表示平方损失函数,表示该样本数据的真实标签为第少类,x表示第x个网络参数,A为费希尔信息矩阵,为新训练任务的第x个网络参数,θx为上一个任务的第x个网络参数,βx为第x个网络参数分配得到的权值,γ为可调值。
进一步优选的,若交易订单为异常交易,则给出异常等级,异常等级的确定方法为:
从交易金额、交易对象的可信度两个方面对异常交易的风险程度进行评估,确定风险值;
根据异常交易对系统的影响、对参与方的影响对异常交易的影响程度进行评估,确定影响值;
将异常等级定为低、中和高,分别量化为值:1、2、3,每个异常交易的异常等级计算方法为:
式中,LE为异常等级,1、2、3分别表示异常等级为低、中、高,D1为风险值,D2为影响值,M1为交易金额,μ为交易金额阈值,M2为交易对象的可信度,C1为异常交易对系统的影响,C2为异常交易对参与方的影响,M2>0表示交易对象可信,M2<0表示交易对象不可信,C1>0表示异常交易对系统的影响超过承受范围,C1<0表示异常交易对系统的影响低于承受范围,C2>0表示异常交易对参与方的影响超过承受范围,C2<0表示异常交易对参与方的影响低于承受范围。
另一方面,本发明还提供一种面向金融大数据的区块链交易方法,所述方法在上述任一所述的系统中执行,所述方法包括:
S1从数据提供方处采集金融数据,并获取相应的数据提供方的信息,其中,数据提供方的信息包括数据提供方的用户公钥、用户私钥和账户信息;
S2对金融数据进行解析,将其转换为统一存储的格式,对解析后的金融数据进行处理,剔除不可用的金融数据,根据处理后的金融数据创建索引,将金融数据以文件形式存储在分布式账本中,形成金融数据文件的哈希值,并得到文件签名;
S3根据数据提供方的用户公钥将金融数据文件的哈希值和文件签名进行加密,并根据数据提供方的用户私钥得到数字签名,将加密后的金融数据文件的哈希值、文件签名、数字签名、金融数据的价格形成智能合约,将智能合约进行登记和存储;
S4对数据需求方提出的交易请求进行初步的验证,初步验证通过后,根据交易请求的内容创建交易订单,交易请求的内容包括交易双方的信息、交易数据、交易描述、交易金额、交易时间和交易限制;
S5对交易订单进行全面的验证,全面验证通过后,将交易订单传送至数据提供方,经数据提供方签名确认后形成新的智能合约,执行新的智能合约完成交易,并将交易的信息广播至整个区块链网络,之后形成一个新的区块添加到区块链网络中;
S6将交易订单的数据发布至系统中,以供用户查询和浏览。
本发明的方法相对于现有技术具有以下有益效果:
(1)本发明提供了一个交易系统,利用区块链技术实现了数据采集、存储、交易和发布的功能。系统包括数据采集模块、数据存储模块、数据交易模块和数据发布模块。区块链技术实现金融数据的安全性、透明性和可追溯性。通过分布式账本的存储方式,交融数据存储和交易过程实现了去中心化,减少了中间环节的风险和成本。区块链的不可篡改性保证了金融数据的可信性和完整性,使得金融数据更加可靠和可信;
(2)本发明通过将金融数据以文件形式存储在分布式账本中,数据存储模块确保了金融数据的安全性,并使用哈希值和数字签名来保证金融数据的完整性。每个金融数据文件都有唯一的哈希值,用于验证数据的完整性,即使是最小的数据更改也会导致哈希值的不同。此外,数字签名通过使用数据提供方的私钥来生成,确保了数据的真实性和不可篡改性;
(3)本发明在数据引擎单元设置了对金融数据的质检环节,通过对金融数据进行完整性、一致性和准确性等质量检查,数据引擎单元可以过滤掉不符合质量要求的数据,仅保留高质量的金融数据。这有助于提高数据的可靠性和准确性,减少错误和失误对后续分析和决策的影响,促进了金融数据的有效利用和创新应用;
(4)本发明在数据交易模块设置了双重验证,对交易请求进行初步验证可以过滤掉无效或不合法的交易请求,提高了整个系统的安全性和效率。初步验证通过后才会根据交易请求创建交易订单,之后对交易订单进行全面验证,确保交易订单符合预定的规则和约束条件,避免了非法或异常交易的发生。这样可以保证交易的安全性和合规性,减少了潜在的风险和纠纷;
(5)本发明通过教师网络和学生网络的特性,利用性能优异的教师网络学习不同异常交易类型的特征,并指导轻量化的学生网络进行学习,根据知识蒸馏的方式来降低模型的复杂度,利用轻量化的模型即可对不同类型的异常交易识别任务进行很好的预测;
(6)本发明针对教师网络的预测性能构建了评价值计算公式,并根据评价值和权重设置方法来构建学生网络的损失函数,权重设置方法是一种动态权重分配的方法,根据教师网络的参数来指导学生网络的各参数权重分配,用这样的方式将教师网络学习到的知识传递给学生网络,以训练得到一个性能优异的轻量化深度学习模型,对不同种类的异常交易类型均可达到较好的预测效果;
(7)本发明从交易金额、交易对象的可信度来评估异常交易的风险程度,从异常交易对系统的影响、对参与方的影响来评估异常交易的影响程度,通过不同的量化指标,构建了异常交易的异常等级的计算公式,涵盖了各种不同情况下的异常等级确定逻辑,对异常交易进行细致化的表示,并反馈给区块链网络,以便区块链根据异常等级来决定具体的惩罚措施。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的系统结构示意图;
图2为本发明实施例的数据存储模块的结构示意图;
图3为本发明实施例的金融数据的处理流程图;
图4为本发明实施例的数据交易模块的结构示意图;
图5为本发明实施例的深度学习模型的网络执行流程图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,一方面,本发明提供一种面向金融大数据的区块链交易系统,包括:
数据采集模块,其配置为从数据提供方处采集金融数据,并将采集的金融数据以及数据提供方的信息传输至数据存储模块;
数据存储模块,其配置为将接收到的金融数据以分布式账本的形式存储在区块链网络中;
数据交易模块,其配置为根据数据需求方的交易请求创建交易,形成交易订单,并对交易订单进行验证,验证通过后交易成功,将交易订单加入区块链网络中;
数据发布模块,其配置为将交易订单的数据发布至系统中,以供用户查询和浏览。
具体地,在数据采集模块,数据提供方可以是各个金融机构,金融数据包括这些金融机构的金融产品数据,如债券、基金、保险、股票、外汇等金融产品,金融产品数据可以用于交易分析和量化交易等;还可以包括金融市场数据,如股票、债券、期货、外汇等市场的实时行情数据,如市场价格、买卖盘、市场深度等,金融市场数据可以用于投资决策、风险管理等;还可以包括金融宏观数据,如国家或地区的宏观经济指标,如通货膨胀率、失业率、利率等,金融宏观数据可以用于宏观经济分析等。而数据提供方的信息则包括金融机构在交易系统中注册的用户账号、用户公钥,以及金融机构自身的数据,例如金融机构的基本面数据,如金融机构的财务报表数据、财务指标数据等,包括资产负债表、利润表、现金流量表、市盈率、市净率、信用评级、风险评估等。在采集了金融数据和数据提供方的信息后,还同步采集与这些数据和信息相关的元数据,元数据是描述数据的数据,它提供了关于数据的信息,如数据源、采集时间、数据格式、数据质量等。采集元数据有助于数据管理和数据分析的过程中对数据进行追溯和验证,提高数据的可信度和可用性。
具体地,请参阅图2,本发明一实施例中,数据存储模块包括:
数据接收单元,其配置为接收数据采集模块传输的金融数据和数据提供方的信息,将金融数据和数据提供方的信息传递至数据引擎单元,数据提供方的信息包括数据提供方的用户公钥、用户私钥和账户信息;
数据引擎单元,其配置为对金融数据进行解析,将其转换为统一存储的格式,对解析后的金融数据进行处理,剔除不可用的金融数据,根据处理后的金融数据创建索引,将金融数据以文件形式存储在分布式账本中,形成金融数据文件的哈希值,并得到文件签名;
数据登记单元,其配置为根据数据提供方的用户公钥将金融数据文件的哈希值和文件签名进行加密,并根据数据提供方的用户私钥得到数字签名,将加密后的金融数据文件的哈希值、文件签名、数字签名、金融数据的价格形成智能合约,将智能合约进行登记和存储。
以一具体实施例对数据存储模块进行说明:
数据接收单元设有一输入端口,用于接收数据采集模块传输过来的金融数据和数据提供方的信息,数据提供方的信息包括:
用户公钥:数据提供方的公钥用于金融数据的加密和验证。公钥是一对密钥中的一个,用于加密金融数据或验证数字签名。
用户私钥:数据提供方的私钥用于对金融数据进行解密和数字签名。私钥是与公钥配对的另一个密钥,用于解密加密金融数据或生成数字签名。
账户信息:数据提供方的账户信息包括与其身份和交易相关的信息,如账户名称、账户地址等。这些信息用于识别数据提供方和进行数据交易的结算。
数据接收单元接收到金融数据和数据提供方的信息后,将其传递给数据引擎单元进行后续处理。这样的配置可以确保在金融数据传递过程中,金融数据的安全性得到保护,并且可以追溯金融数据的来源和交易信息,提高金融数据交易的可信度和安全性。
数据引擎单元的配置如下:
解析金融数据:数据引擎单元接收到金融数据后,对其进行解析。这包括解析数据的结构、格式和字段,以便后续处理和存储。
转换为统一存储格式:解析后的金融数据可能来自不同的数据源,格式各异。数据引擎单元将这些数据转换为统一的存储格式,以便进行一致的处理和分析。
处理金融数据:数据引擎单元对解析后的金融数据进行处理,包括数据清洗、数据校验、数据合并等操作。这些处理步骤旨在确保数据的质量和一致性,并剔除不可用的金融数据。
创建索引:为了快速检索和查询金融数据,数据引擎单元根据处理后的金融数据创建索引。索引可以基于特定的字段或属性,以提高数据的访问效率和响应速度。
存储金融数据:数据引擎单元将处理后的金融数据以文件形式存储在分布式账本中。分布式账本是一种去中心化的数据存储系统,可以确保数据的安全性和可靠性,并提供高度的可扩展性和容错性。
哈希值和文件签名:为了确保金融数据的完整性和防止篡改,数据引擎单元计算金融数据文件的哈希值,并生成文件的签名。哈希值用于验证文件内容是否发生变化,而文件签名用于验证文件的来源和完整性。
如图3所示,本实施例给出一个对解析后的金融数据进行处理的实现方式,具体步骤如下:
获取金融数据对应的元数据,对元数据进行信息提取,得到元数据信息;
根据元数据信息对金融数据进行质量检查,质量检查包括完整性检查、一致性检查、准确性检查和来源检查,将符合质量要求的金融数据保留,将不符合质量要求的金融数据予以剔除,包括:
根据元数据信息中的完整性约束对金融数据的完整性进行评估,根据完整性评估指标对金融数据的完整性评估结果进行判定,将符合完整性评估指标的金融数据保留,将不符合完整性评估指标的金融数据予以剔除,其中,完整性约束包括数据关系约束、数据范围约束和数据逻辑约束。
具体地,数据关系约束要求某些金融数据之间存在特定的关系,例如,对于金融产品数据,同一个数据提供方的相同类型的金融产品数据之间有一定的影响关系。数据范围约束要求金融数据的取值必须在特定范围内,例如,对于股票价格数据,要求价格必须在0到100之间。数据逻辑约束:要求金融数据满足特定的逻辑条件,例如,对于财务报表数据,要求资产负债表中的总资产必须等于总负债加所有者权益。
针对单个金融数据,比较其对应的不同来源或不同时间点的元数据信息,若比较结果为一致,则将金融数据保留,若比较结果为不一致,则将金融数据予以剔除。
具体地,比较不同来源或时间点的元数据信息可以是:对于债券数据,比较不同数据源或不同时间点的债券数据的内容信息,如果信息一致,则保留债券数据,否则剔除。
根据元数据信息中的准确性约束对金融数据的准确性进行评估,根据准确性评估指标对金融数据的准确性评估结果进行判定,将符合准确性评估指标的金融数据保留,将不符合准确性评估指标的金融数据予以剔除,其中,准确性约束包括缺失值约束、异常值约束和重复值约束。
具体地,缺失值约束要求金融数据中不允许存在缺失值,例如,对于贷款申请数据,要求每个申请记录都必须包含客户的姓名、年龄、收入等信息。异常值约束要求金融数据中不允许存在异常值,例如,对于股票数据,要求股票的价格不能超过一定的百分比范围,以排除异常的价格波动。重复值约束要求金融数据中不允许存在重复值,例如,对于同一数据提供方的同一时间节点采集的金融产品数据,应当只采集一次,以避免重复出现相同数据而价格不等的情况。
根据元数据信息抓取数据血缘关系,基于数据血缘关系对单个元数据信息进行数据溯源,若元数据信息的数据溯源路径存在,则元数据信息对应的金融数据保留,若元数据信息的数据溯源路径不存在,则元数据信息对应的金融数据予以剔除。
具体地,抓取数据血缘关系具体为:利用元数据的数据表之间的关系,根据ETL调度作业依赖关系自动捕捉元数据之间数据血缘关系。数据溯源为:对于单个元数据信息,例如某个元数据的数据表中的字段,利用深度搜索算法在数据血缘关系中进行搜索,由于数据血缘关系是有向无环图,根据深度搜索算法能够得到该元数据的上游元数据和下游元数据,若是在深度搜索算法运行完成后,该元数据的数据溯源路径存在,即根据这个路径能知道该元数据的上游元数据和下游元数据,则保留该元数据,若是在深度搜索算法运行完成后,该元数据的数据溯源路径不存在,例如,搜索算法的起点和终点都在该元数据,则表示该元数据没有确切的血缘元数据,或者搜索算法无法搜索该元数据的上游数据,则表示该元数据没有现实中的来源,对该元数据进行剔除,以确保数据的可信度和完整性。
之后,数据登记单元的配置是将金融数据文件的哈希值和文件签名使用数据提供方的用户公钥进行加密,并使用数据提供方的用户私钥生成数字签名。然后,将加密后的金融数据文件的哈希值、文件签名、数字签名、以及金融数据的价格形成智能合约,并进行登记和存储。
这样的配置可以提供以下好处和功能:
1.数据安全性:通过使用数据提供方的用户公钥对金融数据文件的哈希值和文件签名进行加密,确保只有持有相应私钥的用户能够解密和验证数据的完整性。
5.数据完整性验证:通过数字签名,可以验证金融数据文件的完整性,即确保数据在传输过程中没有被篡改或损坏。
3.数据来源认证:通过使用数据提供方的用户私钥生成数字签名,可以确保数据的来源可信,即只有数据提供方才能生成有效的数字签名。
4.智能合约登记和存储:将加密后的金融数据文件的哈希值、文件签名、数字签名和金融数据的价格形成智能合约,并进行登记和存储,以确保数据的可追溯性和不可篡改性。
通过这样的配置,可以建立一个安全可靠的金融数据登记系统,确保数据的安全性、完整性和可信度。同时,智能合约的使用可以提供自动化的数据处理和管理功能,为金融数据的使用和分析提供便利。
具体地,请参阅图4,本发明一实施例中,数据交易模块包括:
交易请求单元,其配置为接收并处理数据需求方的交易请求,对交易请求进行初步的验证,初步验证通过后,将交易请求传输至交易订单创建单元;
交易订单创建单元,其配置为根据交易请求的内容创建交易订单,交易请求的内容包括交易双方的信息、交易数据、交易描述、交易金额、交易时间和交易限制;
交易订单验证单元,其配置为对交易订单进行全面的验证,全面验证通过后,将全面验证后的交易订单传输至交易确认单元;
交易确认单元,其配置为将交易订单传送至数据提供方,经数据提供方签名确认后形成新的智能合约,执行新的智能合约完成交易,并将交易的信息广播至整个区块链网络,之后形成一个新的区块添加到区块链网络中;
交易存储单元,其配置为将交易完成后数据需求方获取的交易数据存储在区块链网络上,以供区块链节点访问和验证。
本实施例中,交易请求单元中,对交易请求进行初步的验证是确保交易的合法性和安全性的重要步骤。对交易请求进行初步的验证包括:
验证数据需求方的实体身份的有效性,包括:
检查数据需求方是否已注册:验证数据需求方是否在系统中注册,并且具有有效的身份信息和权限。
查询数据需求方注册信息:从系统的用户数据库或身份验证服务中查询数据需求方的注册信息,包括用户名、身份证明等。
验证数据需求方的用户公钥的有效性:验证数据需求方提供的用户公钥是否有效,以确保数据的加密和解密过程安全可靠。
检查交易金额的合理性,包括:
检查交易金额是否超过数据需求方的余额:从系统的账户数据库中查询数据需求方的账户余额,验证交易金额是否超过数据需求方的账户余额,以确保交易不会导致资金不足。
检查交易金额是否符合金额限制:根据系统设定的金额限制,将交易金额与账户余额进行比较,确保交易金额不超过账户余额,并符合金额限制,以验证交易金额是否在合理范围内。
检查交易数据的合规性,包括:
验证交易数据是否符合规定的格式和结构:检查交易数据是否符合预定义的数据格式和结构,以确保数据的有效性和一致性。例如根据预定义的数据格式和结构规范,对交易数据进行验证,确保其符合规定的格式和结构要求。
检查交易描述的内容信息,包括:
检查交易描述中是否包含哈希值:对交易描述进行解析,提取其中的关键信息,验证交易描述中是否包含哈希值等关键信息,以确保交易的完整性和正确性。
检查交易请求的合法性,包括:
验证交易请求是否符合区块链网络的政策和规则:检查交易请求是否符合区块链网络的验证规则、共识机制和智能合约的约束,以确保交易的合法性和安全性。
本实施例中,接收到交易请求后,交易订单创建单元负责根据交易请求的内容创建交易订单。其中,交易请求的内容包括:
交易双方的信息:交易请求中应包含交易的参与方信息,例如买方和卖方的身份标识、账户信息或公钥等。
交易数据:交易请求中应包含要传输或处理的具体交易的金融数据,这取决于具体的金融交易类型。例如,如果是股票交易,交易数据可能包括股票代码、交易数量等。
交易描述:交易请求中应包含交易的描述信息,以提供对交易目的、内容或其他相关信息的说明。例如,描述可能包括交易的目的、交易对象的特征、交易数据相关的哈希值等。
交易金额:交易请求中应包含交易的金额信息,指示交易涉及的货币金额。这可以是数字值,表示交易的货币数量。
交易时间:交易请求中应包含交易的时间戳或日期时间信息,用于记录交易发生的确切时间。
交易限制:交易请求中可能包含交易的限制条件,例如最大交易金额、最小交易数量、交易有效期等。这些限制条件可以根据交易类型和相关规定进行定义。
以一具体实施例对创建交易订单进行说明:
首先,根据系统需求,定义一个适合存储交易订单信息的数据结构,例如一个包含交易双方信息、交易数据、交易描述、交易金额、交易时间和交易限制的订单对象。
从交易请求中提取所需的信息,将其分别存储到交易订单数据结构的相应字段中。例如,将交易双方的信息存储到订单对象的买方和卖方字段中,将交易数据存储到订单对象的数据字段中,依此类推。
使用订单对象中存储的信息,创建一个新的交易订单。
在创建了交易订单后,将其传输至交易订单验证单元,交易订单验证单元中包含一个预训练的深度学习模型,利用深度学习模型对交易订单进行全面的验证,判定交易订单是否为异常交易:
若交易订单为异常交易,则给出异常等级,将异常交易及其异常等级反馈至区块链网络进行记录和广播,由区块链网络给出惩罚措施。这样做可以增加交易的透明度和可追溯性,其他参与方可以了解到异常交易的存在并采取相应的措施。区块链网络可以根据异常等级给出相应的惩罚措施,例如冻结账户、限制交易或采取其他适当的措施,以维护交易的安全性和合规性。
若交易订单为正常交易,则判定交易订单的全面验证通过,将全面验证后的交易订单传输至交易确认单元。这样可以确保正常交易的顺利执行,提高交易的效率和可靠性。
本实施例中,深度学习模型的预训练过程为:
深度学习模型的预训练过程为:
步骤一、根据异常交易的种类获取N个训练任务,每个训练任务为一种异常交易类型的预测任务;
步骤二、获取与N个训练任务相关的样本数据,样本数据包含真实标签;
步骤三、构建教师网络和学生网络,并随机初始化教师网络,其中,教师网络和学生网络是基于相同结构的深度卷积神经网络构建得到;
步骤四、随机选取一个未完成的训练任务;
步骤五、将该训练任务的样本数据随机划分为k个数据子集,依次利用k个数据子集对教师网络进行分类预测,得到k组教师网络参数,取k组教师网络参数的平均值作为训练参数,利用训练参数对应的教师网络对样本数据进行二次训练,得到预测结果;
步骤六、重复步骤四和步骤五,直至N个训练任务均完成训练,得到N组预测结果,根据预测结果和真实标签得到N个训练任务的评价值;
步骤七、根据评价值和权重设置方法构建学生网络的损失函数,依次利用N个训练任务对学生网络进行训练,直至损失函数收敛,得到预训练的学生网络,将其作为预训练的深度学习模型。
具体地,本实施例中,异常交易的种类包括:欺诈交易、洗钱交易、内幕交易、不当操纵市场行为、违反交易限制或规则、高风险交易,还可以包括其他种类。其中,欺诈交易是指故意进行虚假、误导或非法行为的交易,包括虚假身份、伪造文件、虚构交易数据、盗用他人账户等行为,旨在欺骗系统或其他交易参与方获取非法利益。洗钱交易是指将非法获得的资金通过一系列交易掩盖其来源和性质的行为,包括大额现金交易、频繁的转账操作、跨境资金流动等,旨在将非法资金合法化。内幕交易是指利用未公开的重要信息进行交易的行为,包括利用未公开的财务数据、商业机密或其他敏感信息进行交易,从而获取非公平的交易利益。不当操纵市场行为是指通过操纵市场价格、交易量或其他相关指标来干扰市场的正常运作,包括操纵股票、期货、外汇或其他金融产品的价格、操纵市场供需关系等行为。违反交易限制或规则是指违反系统或监管机构设定的交易限制、规则或法律法规的行为,包括超过交易限额、违反反洗钱规定、违反交易所规则等行为。高风险交易是指具有较高风险和潜在损失的交易,包括高杠杆交易、高频交易、复杂的金融衍生品交易等,需要特殊审慎和风险管理措施。
根据异常交易的种类分成不同的训练任务,例如,异常交易的种类为N个,则训练任务也为N个,每个训练任务对应着一种异常交易类型的分类预测任务。针对每个训练任务,均获取与该训练任务相关的异常数据和正常数据,作为样本数据,每个样本数据包含真实标签,真实标签为“正常”或“异常”,分别对应正常数据和异常数据。则对于深度学习模型的训练可看成是一个二分类的训练。
由于训练任务有N个,在多任务情景下,模型通常会有遗忘的问题,也就是如果按照一个任务一个任务依次训练,当训练了当前任务后,会遗忘上一个或上两个的训练结果,用训练当前任务的模型再去预测上一个任务,会出现准确度下降的情况,为了降低遗忘问题带来的风险,会采用知识蒸馏的方法,即先训练一个参数多、性能强的教师网络,教师网络能够较好的平衡各个训练任务的预测准确度,之后将教师网络的知识传递给学生网络,帮助学生网络学习到教师网络的特征表示和泛化能力。学生网络为轻量化的网络,教师网络和学生网络是以相同结构的深度卷积神经网络进行构建得到的,使用相同结构的神经网络能够在一定程度上保证教师网络与学生网络学习过程的相关性,提高对学生网络的指导意义。
本实施例中,教师网络和学生网络均采用AutoLSTM网络结构,在该网络中,包括一个自编码器和LSTM网络,其网络执行流程图如图5所示,自编码器作为特征提取器,对输入的数据进行特征提取,对于金融数据来说,特征提取部分可以结合统计算法等方式来辅助得到金融数据的特征,LSTM网络是以自编码器的输出作为输入,LSTM是一种循环神经网络,能够处理与时间有关的数据并捕捉长期依赖关系,LSTM网络对输入的特征按照时间戳进行重构,得到重构特征,重构特征进入一个输出层,在输出层中包含激活函数层,分类块用于对特征进行分类预测,输出预测结果。
图5中,输入层用于接受输入的数据,隐藏层1可采用编码网络和全连接层将输入数据进行特征提取并映射到中等维度的特征表示,隐藏层2将中等维度的特征表示映射到较低维度的特征表示,LSTM层1接收较低维度的特征表示作为输入,并学习特征之间的依赖关系,LSTM层2用于对依赖关系进行进一步的深层学习,LSTM层3将最终学习到的带有依赖关系的特征映射回原始特征空间,隐藏层3将LSTM层3的输出映射回原始特征的维度,输出层用于将隐藏层3的输出映射到最终的预测结果。
本实施例中,每个训练任务对应的样本数据数量有限,如果直接将样本数据输入教师模型中进行一次训练,容易出现过拟合,因此,对样本数据进行一个随机划分,得到k个数据子集,根据数据子集训练得到的k组教师网络参数,取平均值作为该样本数据的训练参数,将模型根据训练参数进行调试,再利用样本数据进行二次训练,得到的结果作为最终的预测结果,该方式能够避免模型过拟合,且提高模型的预测准确度。具体地,k可以取6。
在利用N个训练任务对教师网络完成训练后,根据最终的N组预测结果和真实标签来求得评价值,该评价值是为了评价训练后教师网络的预测性能,具体地,评价值的计算公式如下:
式中,F为评价值,N为训练任务的数量,i表示第i个训练任务,为第i个训练任务的训练参数,αi为第i个训练任务的预测误差,j为第j个样本数据,m为样本数据的数量,/>为第j个样本数据的真实标签,/>为第j个样本数据的预测结果,L表示误差函数。
根据评价值和权重设置方法来构建学生网络的损失函数,具体的,权重设置方法是一种动态权重分配的方法,根据教师网络的参数来指导学生网络的各参数权重分配,所构建的学生网络的损失函数如下:
式中,Loss为学生网络的损失函数,y为真实标签,F为评价值,G表示平方损失函数,表示该样本数据的真实标签为第y类,x表示第x个网络参数,A为费希尔信息矩阵,为新训练任务的第x个网络参数,θx为上一个任务的第x个网络参数,βx为第x个网络参数分配得到的权值,γ为可调值。
依次选择训练任务对学生网络进行训练,使用上述损失函数对学生网络进行约束,通过这个训练方法,能够一定程度的降低模型遗忘问题带来的影响,提升了网络训练的效率和训练的效果。
在对学生网络训练完毕后,将训练后的学生网络作为预训练的深度学习模型,利用其对交易订单进行识别,当识别到该交易订单是异常交易后,根据以下方式确定其异常等级:
(1)确定异常交易的风险程度:根据交易涉及的金额、交易对象的可信度等因素来评估交易的风险程度。较高风险的交易可能被判定为更严重的异常交易,而较低风险的交易可能被判定为较轻微的异常交易。本实施例从交易金额、交易对象的可信度两个方面对风险程度进行评估,设置一个交易金额的阈值用于判定交易金额是否有风险,同时根据交易对象的账号信息、机构信息等判断是否可信,利用风险值来表示风险程度。
(2)确定异常交易的影响程度:评估异常交易对金融系统和参与方的影响范围和后果,如果异常交易可能对系统的安全性、稳定性或其他参与方的利益产生重大影响,那么该异常交易可能被判定为较高等级的异常交易。本实施例根据异常交易对系统的影响、对参与方的影响来对影响程度进行评估,根据影响值来表示影响程度。
(3)将异常等级定为低、中和高,分别量化为值:1、2、3,每个异常交易的异常等级计算方法为:
式中,LE为异常等级,1、2、3分别表示异常等级为低、中、高,D1为风险值,D2为影响值,M1为交易金额,μ为交易金额阈值,M2为交易对象的可信度,C1为异常交易对系统的影响,C2为异常交易对参与方的影响,M2>0表示交易对象可信,M2<0表示交易对象不可信,C1>0表示异常交易对系统的影响超过承受范围,C1<0表示异常交易对系统的影响低于承受范围,C2>0表示异常交易对参与方的影响超过承受范围,C2<0表示异常交易对参与方的影响低于承受范围。
本实施例通过引入深度学习模型进行全面验证,交易订单验证单元可以更准确地识别异常交易,提高系统对异常交易的检测能力。这有助于防止欺诈、洗钱和其他非法活动,维护金融市场的稳定和安全。同时,记录和广播异常交易的信息也有助于其他参与方共同监督和防范风险。
另一方面,本发明还提供一种面向金融大数据的区块链交易方法,所述方法在上述所述的系统中执行,所述方法包括:
S1从数据提供方处采集金融数据,并获取相应的数据提供方的信息,其中,数据提供方的信息包括数据提供方的用户公钥、用户私钥和账户信息;
S2对金融数据进行解析,将其转换为统一存储的格式,对解析后的金融数据进行处理,剔除不可用的金融数据,根据处理后的金融数据创建索引,将金融数据以文件形式存储在分布式账本中,形成金融数据文件的哈希值,并得到文件签名;
S3根据数据提供方的用户公钥将金融数据文件的哈希值和文件签名进行加密,并根据数据提供方的用户私钥得到数字签名,将加密后的金融数据文件的哈希值、文件签名、数字签名、金融数据的价格形成智能合约,将智能合约进行登记和存储;
S4对数据需求方提出的交易请求进行初步的验证,初步验证通过后,根据交易请求的内容创建交易订单,交易请求的内容包括交易双方的信息、交易数据、交易描述、交易金额、交易时间和交易限制;
S5对交易订单进行全面的验证,全面验证通过后,将交易订单传送至数据提供方,经数据提供方签名确认后形成新的智能合约,执行新的智能合约完成交易,并将交易的信息广播至整个区块链网络,之后形成一个新的区块添加到区块链网络中;
S6将交易订单的数据发布至系统中,以供用户查询和浏览。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种面向金融大数据的区块链交易系统,其特征在于,包括:
数据采集模块,其配置为从数据提供方处采集金融数据,并将采集的金融数据以及数据提供方的信息传输至数据存储模块;
数据存储模块,其配置为将接收到的金融数据以分布式账本的形式存储在区块链网络中;
数据交易模块,其配置为根据数据需求方的交易请求创建交易,形成交易订单,并对交易订单进行验证,验证通过后交易成功,将交易订单加入区块链网络中;
数据交易模块包括:
交易请求单元,其配置为接收并处理数据需求方的交易请求,对交易请求进行初步的验证,初步验证通过后,将交易请求传输至交易订单创建单元;
交易订单创建单元,其配置为根据交易请求的内容创建交易订单,交易请求的内容包括交易双方的信息、交易数据、交易描述、交易金额、交易时间和交易限制;
交易订单验证单元,其配置为对交易订单进行全面的验证,全面验证通过后,将全面验证后的交易订单传输至交易确认单元;
交易确认单元,其配置为将交易订单传送至数据提供方,经数据提供方签名确认后形成新的智能合约,执行新的智能合约完成交易,并将交易的信息广播至整个区块链网络,之后形成一个新的区块添加到区块链网络中;
交易存储单元,其配置为将交易完成后数据需求方获取的交易数据存储在区块链网络上,以供区块链节点访问和验证;
交易订单验证单元中包含一个预训练的深度学习模型,利用深度学习模型对交易订单进行全面的验证,判定交易订单是否为异常交易:
若交易订单为异常交易,则给出异常等级,将异常交易及其异常等级反馈至区块链网络进行记录和广播,由区块链网络给出惩罚措施;
若交易订单为正常交易,则判定交易订单的全面验证通过,将全面验证后的交易订单传输至交易确认单元;
深度学习模型的预训练过程为:
步骤一、根据异常交易的种类获取N个训练任务,每个训练任务为一种异常交易类型的预测任务;
步骤二、获取与N个训练任务相关的样本数据,样本数据包含真实标签;
步骤三、构建教师网络和学生网络,并随机初始化教师网络,其中,教师网络和学生网络是基于相同结构的深度卷积神经网络构建得到;
步骤四、随机选取一个未完成的训练任务;
步骤五、将该训练任务的样本数据随机划分为k个数据子集,依次利用k个数据子集对教师网络进行分类预测,得到k组教师网络参数,取k组教师网络参数的平均值作为训练参数,利用训练参数对应的教师网络对样本数据进行二次训练,得到预测结果;
步骤六、重复步骤四和步骤五,直至N个训练任务均完成训练,得到N组预测结果,根据预测结果和真实标签得到N个训练任务的评价值;
步骤七、根据评价值和权重设置方法构建学生网络的损失函数,依次利用N个训练任务对学生网络进行训练,直至损失函数收敛,得到预训练的学生网络,将其作为预训练的深度学习模型;
步骤六中,根据预测结果和真实标签得到N个训练任务的评价值,包括:
式中,F为评价值,N为训练任务的数量,i表示第i个训练任务,为第i个训练任务的训练参数,αi为第i个训练任务的预测误差,j为第j个样本数据,m为样本数据的数量,/>为第j个样本数据的真实标签,/>为第j个样本数据的预测结果,L表示误差函数;
相应地,步骤七中,根据评价值和权重设置方法构建学生网络的损失函数,包括:
式中,Loss为学生网络的损失函数,y为真实标签,F为评价值,G表示平方损失函数,表示该样本数据的真实标签为第y类,x表示第x个网络参数,A为费希尔信息矩阵,/>为新训练任务的第x个网络参数,θx为上一个任务的第x个网络参数,βx为第x个网络参数分配得到的权值,γ为可调值;
数据发布模块,其配置为将交易订单的数据发布至系统中,以供用户查询和浏览。
2.如权利要求1所述的面向金融大数据的区块链交易系统,其特征在于,数据存储模块包括:
数据接收单元,其配置为接收数据采集模块传输的金融数据和数据提供方的信息,将金融数据和数据提供方的信息传递至数据引擎单元,数据提供方的信息包括数据提供方的用户公钥、用户私钥和账户信息;
数据引擎单元,其配置为对金融数据进行解析,将其转换为统一存储的格式,对解析后的金融数据进行处理,剔除不可用的金融数据,根据处理后的金融数据创建索引,将金融数据以文件形式存储在分布式账本中,形成金融数据文件的哈希值,并得到文件签名;
数据登记单元,其配置为根据数据提供方的用户公钥将金融数据文件的哈希值和文件签名进行加密,并根据数据提供方的用户私钥得到数字签名,将加密后的金融数据文件的哈希值、文件签名、数字签名、金融数据的价格形成智能合约,将智能合约进行登记和存储。
3.如权利要求2所述的面向金融大数据的区块链交易系统,其特征在于,数据引擎单元中,对解析后的金融数据进行处理的过程为:
获取金融数据对应的元数据,对元数据进行信息提取,得到元数据信息;
根据元数据信息对金融数据进行质量检查,质量检查包括完整性检查、一致性检查、准确性检查和来源检查,将符合质量要求的金融数据保留,将不符合质量要求的金融数据予以剔除,包括:
根据元数据信息中的完整性约束对金融数据的完整性进行评估,根据完整性评估指标对金融数据的完整性评估结果进行判定,将符合完整性评估指标的金融数据保留,将不符合完整性评估指标的金融数据予以剔除,其中,完整性约束包括数据关系约束、数据范围约束和数据逻辑约束;
针对单个金融数据,比较其对应的不同来源或不同时间点的元数据信息,若比较结果为一致,则将金融数据保留,若比较结果为不一致,则将金融数据予以剔除;
根据元数据信息中的准确性约束对金融数据的准确性进行评估,根据准确性评估指标对金融数据的准确性评估结果进行判定,将符合准确性评估指标的金融数据保留,将不符合准确性评估指标的金融数据予以剔除,其中,准确性约束包括缺失值约束、异常值约束和重复值约束;
根据元数据信息抓取数据血缘关系,基于数据血缘关系对单个元数据信息进行数据溯源,若元数据信息的数据溯源路径存在,则元数据信息对应的金融数据保留,若元数据信息的数据溯源路径不存在,则元数据信息对应的金融数据予以剔除。
4.如权利要求1所述的面向金融大数据的区块链交易系统,其特征在于,交易请求单元中,对交易请求进行初步的验证包括:
验证数据需求方的实体身份的有效性,包括数据需求方是否已注册、数据需求方的用户公钥是否有效;
检查交易金额的合理性,包括交易金额是否超过数据需求方的余额、交易金额是否符合金额限制;
检查交易数据的合规性,包括交易数据是否符合规定的格式和结构;
检查交易描述的内容信息,包括交易描述中是否包含哈希值;
检查交易请求的合法性,包括交易请求是否符合区块链网络的规则。
5.如权利要求1所述的面向金融大数据的区块链交易系统,其特征在于,若交易订单为异常交易,则给出异常等级,异常等级的确定方法为:
从交易金额、交易对象的可信度两个方面对异常交易的风险程度进行评估,确定风险值;
根据异常交易对系统的影响、对参与方的影响对异常交易的影响程度进行评估,确定影响值;
将异常等级定为低、中和高,分别量化为值:1、2、3,每个异常交易的异常等级计算方法为:
式中,LE为异常等级,1、2、3分别表示异常等级为低、中、高,D1为风险值,D2为影响值,M1为交易金额,μ为交易金额阈值,M2为交易对象的可信度,C1为异常交易对系统的影响,C2为异常交易对参与方的影响,M2>0表示交易对象可信,M2<0表示交易对象不可信,C1>0表示异常交易对系统的影响超过承受范围,C1<0表示异常交易对系统的影响低于承受范围,C2>0表示异常交易对参与方的影响超过承受范围,C2<0表示异常交易对参与方的影响低于承受范围。
6.一种面向金融大数据的区块链交易方法,其特征在于,所述方法在权利要求1-5任一所述的系统中执行,所述方法包括:
S1从数据提供方处采集金融数据,并获取相应的数据提供方的信息,其中,数据提供方的信息包括数据提供方的用户公钥、用户私钥和账户信息;
S2对金融数据进行解析,将其转换为统一存储的格式,对解析后的金融数据进行处理,剔除不可用的金融数据,根据处理后的金融数据创建索引,将金融数据以文件形式存储在分布式账本中,形成金融数据文件的哈希值,并得到文件签名;
S3根据数据提供方的用户公钥将金融数据文件的哈希值和文件签名进行加密,并根据数据提供方的用户私钥得到数字签名,将加密后的金融数据文件的哈希值、文件签名、数字签名、金融数据的价格形成智能合约,将智能合约进行登记和存储;
S4对数据需求方提出的交易请求进行初步的验证,初步验证通过后,根据交易请求的内容创建交易订单,交易请求的内容包括交易双方的信息、交易数据、交易描述、交易金额、交易时间和交易限制;
S5对交易订单进行全面的验证,全面验证通过后,将交易订单传送至数据提供方,经数据提供方签名确认后形成新的智能合约,执行新的智能合约完成交易,并将交易的信息广播至整个区块链网络,之后形成一个新的区块添加到区块链网络中;
S6将交易订单的数据发布至系统中,以供用户查询和浏览。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311198166.4A CN117314424B (zh) | 2023-09-18 | 2023-09-18 | 面向金融大数据的区块链交易系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311198166.4A CN117314424B (zh) | 2023-09-18 | 2023-09-18 | 面向金融大数据的区块链交易系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117314424A CN117314424A (zh) | 2023-12-29 |
CN117314424B true CN117314424B (zh) | 2024-03-29 |
Family
ID=89284066
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311198166.4A Active CN117314424B (zh) | 2023-09-18 | 2023-09-18 | 面向金融大数据的区块链交易系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117314424B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117726334B (zh) * | 2024-02-08 | 2024-06-11 | 泉州行创网络科技有限公司 | 一种金融数据处理方法及系统 |
CN117952613B (zh) * | 2024-02-22 | 2024-06-28 | 广州尚捷智慧云网络科技有限公司 | 一种基于b2b的协同交易平台及方法 |
CN117892112B (zh) * | 2024-03-13 | 2024-06-07 | 南方科技大学 | 基于区块链的数据分析方法 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107025602A (zh) * | 2017-02-24 | 2017-08-08 | 杭州象链网络技术有限公司 | 一种基于联盟链的金融资产交易系统构建方法 |
WO2018137316A1 (zh) * | 2017-01-24 | 2018-08-02 | 上海亿账通区块链科技有限公司 | 基于区块链的安全交易方法、电子装置、系统及存储介质 |
CN109446842A (zh) * | 2018-10-31 | 2019-03-08 | 深圳电通信息技术有限公司 | 一种基于区块链和分布式账本的版权权益交易方法及装置 |
CN109544160A (zh) * | 2018-11-20 | 2019-03-29 | 杭州呯嘭智能技术有限公司 | 一种基于区块链和智能合约的交易真实性验证方法及系统 |
CN110990845A (zh) * | 2019-10-30 | 2020-04-10 | 链农(深圳)信息科技有限公司 | 基于区块链的数据组织方法及供应链金融数据组织方法 |
CN111506666A (zh) * | 2020-04-26 | 2020-08-07 | 江苏荣泽信息科技股份有限公司 | 一种基于区块链的金融数据处理方法 |
CN111680107A (zh) * | 2020-08-11 | 2020-09-18 | 南昌木本医疗科技有限公司 | 一种基于人工智能和区块链的金融预测系统 |
CN115080925A (zh) * | 2022-08-19 | 2022-09-20 | 北京数慧时空信息技术有限公司 | 基于区块链的遥感成果知识产权管理方法及系统 |
CN115187259A (zh) * | 2022-07-13 | 2022-10-14 | 成都链安科技有限公司 | 基于无监督式机器学习的区块链异常交易识别方法和系统 |
CN115271913A (zh) * | 2022-07-26 | 2022-11-01 | 赵淑红 | 基于区块链的高价值金融数据上链存储系统及方法 |
CN115348551A (zh) * | 2022-07-22 | 2022-11-15 | 南京邮电大学 | 一种轻量化业务识别方法、装置、电子设备及存储介质 |
CN115526425A (zh) * | 2022-10-25 | 2022-12-27 | 深圳市东方碳素实业有限公司 | 一种基于区块链和大数据的金融数据预测系统及方法 |
CN115829574A (zh) * | 2022-12-29 | 2023-03-21 | 福建中科星泰数据科技有限公司 | 一种基于区块链的数据资产交易系统及方法 |
CN115934832A (zh) * | 2022-11-19 | 2023-04-07 | 国网河南省电力公司营销服务中心 | 基于区块链的计量试验检测数据可信共享方法 |
CN116109565A (zh) * | 2022-12-01 | 2023-05-12 | 电子科技大学长三角研究院(湖州) | 一种基于重生网络的早产儿视网膜病异常检测方法 |
WO2023142424A1 (zh) * | 2022-01-25 | 2023-08-03 | 国网江苏省电力有限公司南京供电分公司 | 基于gru-lstm神经网络的电力金融业务风控方法及系统 |
CN116627970A (zh) * | 2023-05-18 | 2023-08-22 | 浙江大学 | 一种基于区块链和联邦学习的数据共享方法及装置 |
CN116739764A (zh) * | 2023-05-15 | 2023-09-12 | 平安壹钱包电子商务有限公司 | 一种基于机器学习的交易风险检测方法、装置、设备及介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180189887A1 (en) * | 2018-01-02 | 2018-07-05 | Validareum Inc. | Cryptographic currency for financial data management, digital and digitalized cross-asset identification and unique digital asset identifier generation, asset valuation and financial risk management |
-
2023
- 2023-09-18 CN CN202311198166.4A patent/CN117314424B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018137316A1 (zh) * | 2017-01-24 | 2018-08-02 | 上海亿账通区块链科技有限公司 | 基于区块链的安全交易方法、电子装置、系统及存储介质 |
CN107025602A (zh) * | 2017-02-24 | 2017-08-08 | 杭州象链网络技术有限公司 | 一种基于联盟链的金融资产交易系统构建方法 |
CN109446842A (zh) * | 2018-10-31 | 2019-03-08 | 深圳电通信息技术有限公司 | 一种基于区块链和分布式账本的版权权益交易方法及装置 |
CN109544160A (zh) * | 2018-11-20 | 2019-03-29 | 杭州呯嘭智能技术有限公司 | 一种基于区块链和智能合约的交易真实性验证方法及系统 |
CN110990845A (zh) * | 2019-10-30 | 2020-04-10 | 链农(深圳)信息科技有限公司 | 基于区块链的数据组织方法及供应链金融数据组织方法 |
CN111506666A (zh) * | 2020-04-26 | 2020-08-07 | 江苏荣泽信息科技股份有限公司 | 一种基于区块链的金融数据处理方法 |
CN111680107A (zh) * | 2020-08-11 | 2020-09-18 | 南昌木本医疗科技有限公司 | 一种基于人工智能和区块链的金融预测系统 |
WO2023142424A1 (zh) * | 2022-01-25 | 2023-08-03 | 国网江苏省电力有限公司南京供电分公司 | 基于gru-lstm神经网络的电力金融业务风控方法及系统 |
CN115187259A (zh) * | 2022-07-13 | 2022-10-14 | 成都链安科技有限公司 | 基于无监督式机器学习的区块链异常交易识别方法和系统 |
CN115348551A (zh) * | 2022-07-22 | 2022-11-15 | 南京邮电大学 | 一种轻量化业务识别方法、装置、电子设备及存储介质 |
CN115271913A (zh) * | 2022-07-26 | 2022-11-01 | 赵淑红 | 基于区块链的高价值金融数据上链存储系统及方法 |
CN115080925A (zh) * | 2022-08-19 | 2022-09-20 | 北京数慧时空信息技术有限公司 | 基于区块链的遥感成果知识产权管理方法及系统 |
CN115526425A (zh) * | 2022-10-25 | 2022-12-27 | 深圳市东方碳素实业有限公司 | 一种基于区块链和大数据的金融数据预测系统及方法 |
CN115934832A (zh) * | 2022-11-19 | 2023-04-07 | 国网河南省电力公司营销服务中心 | 基于区块链的计量试验检测数据可信共享方法 |
CN116109565A (zh) * | 2022-12-01 | 2023-05-12 | 电子科技大学长三角研究院(湖州) | 一种基于重生网络的早产儿视网膜病异常检测方法 |
CN115829574A (zh) * | 2022-12-29 | 2023-03-21 | 福建中科星泰数据科技有限公司 | 一种基于区块链的数据资产交易系统及方法 |
CN116739764A (zh) * | 2023-05-15 | 2023-09-12 | 平安壹钱包电子商务有限公司 | 一种基于机器学习的交易风险检测方法、装置、设备及介质 |
CN116627970A (zh) * | 2023-05-18 | 2023-08-22 | 浙江大学 | 一种基于区块链和联邦学习的数据共享方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN117314424A (zh) | 2023-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Reddy | Blockchain Technology in E-commerce: A New Paradigm for Data Integrity and Security | |
Gatteschi et al. | To blockchain or not to blockchain: That is the question | |
CN117314424B (zh) | 面向金融大数据的区块链交易系统及方法 | |
US11170376B2 (en) | Informational and analytical system and method for ensuring the level of trust, control and secure interaction of counterparties when using electronic currencies and contracts | |
US20200005410A1 (en) | System and Method for Facilitating Legal Review for Commercial Loan Transactions | |
CN111178219A (zh) | 票据识别管理方法、装置、存储介质及电子设备 | |
CN111861716B (zh) | 一种基于软件系统的贷中监控预警等级生成方法 | |
US20210065304A1 (en) | Contract automation with blockchain based interaction and recording | |
US20230316261A1 (en) | Systems and Methods for Portable Identity, Documents, and Transactions | |
KR102069002B1 (ko) | 블록체인을 이용하여 위변조를 방지하는 이력관리 방법, 장치 및 프로그램 | |
Ostern et al. | Determining the idiosyncrasy of blockchain: An affordances perspective | |
CN113159796A (zh) | 一种贸易合同验证方法及装置 | |
CN111539724A (zh) | 一种基于区块链架构的电子商业承兑汇票融资方法及装置 | |
CN115760151A (zh) | 珠宝追溯信息的管理方法及系统 | |
CN113034275B (zh) | 一种基于区块链网络的管理系统、方法及终端设备 | |
Önkan et al. | The Impact of Blockchain Technology on Tax and Accounting Practices | |
Ajibade et al. | The Use of Blockchain Technology in Electronic Records Management Systems to Mitigate Corruption in South Africa. | |
CN113822764B (zh) | 资产数据处理方法及装置 | |
CN115564591A (zh) | 一种融资产品的确定方法及相关设备 | |
CN114331105A (zh) | 电子汇票的处理系统、方法、电子设备和存储介质 | |
Hu | [Retracted] Application Analysis of Block Technology Based on Block Chain Computer Model in the False Identification of the Catalog List of the Financial Department of Multinational Companies | |
CN117726468B (zh) | 一种ai财税机器人的财税管理方法、系统及应用 | |
CN116485547B (zh) | 一种基于区块链的碳资产交易方法 | |
CN117474531B (zh) | 一种基于区块链的再生资源产业服务系统 | |
CN112967049B (zh) | 通过区块链发行应收账款的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |