CN116542800A - 基于云端ai技术的智能化财务报表分析系统 - Google Patents
基于云端ai技术的智能化财务报表分析系统 Download PDFInfo
- Publication number
- CN116542800A CN116542800A CN202310779628.5A CN202310779628A CN116542800A CN 116542800 A CN116542800 A CN 116542800A CN 202310779628 A CN202310779628 A CN 202310779628A CN 116542800 A CN116542800 A CN 116542800A
- Authority
- CN
- China
- Prior art keywords
- data
- financial
- cloud
- module
- financial statement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 74
- 238000005516 engineering process Methods 0.000 title claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 45
- 238000000605 extraction Methods 0.000 claims abstract description 35
- 238000003860 storage Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 15
- 238000000034 method Methods 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 7
- 238000013500 data storage Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000013079 data visualisation Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 2
- 238000007794 visualization technique Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 5
- 230000006872 improvement Effects 0.000 description 8
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及财务技术领域,具体地说,涉及基于云端AI技术的智能化财务报表分析系统。其包括云端架构单元、财务报表提取单元、数据处理单元、指标分析单元和智能决策单元。本发明通过云端架构单元构建云端存储财务报表数据,实现用户发出语音指令,使财务报表提取单元提取对应的财务报表数据,通过指标分析单元针对性的分析和计算用户语音指令对应的财务报表数据的财务指标,提高控制效果,方便针对性的进行分析,同时,通过智能决策单元可视化的展示财务报表数据,提高准确性。
Description
技术领域
本发明涉及财务技术领域,具体地说,涉及基于云端AI技术的智能化财务报表分析系统。
背景技术
财务报表分析,是通过收集、整理企业财务会计报告中的相关数据,对企业的财务状况、经营成果和现金流量情况进行综合比较和评价,即通过财务指标如净利率、财务比率等等来展现,而财务指标数据主要依赖于财务报表中的项目数据,传统的财务报表分析通常依赖于人工处理和手工计算,存在着效率低下、易出错、主观性较强等问题,尽管根据中国专利申请号:CN202110299353.6涉及计算机和金融投资的技术领域,公开了一种利用计算机技术对所有上市公司的财报进行批量自动化的分析和处理,并智能生成最优投资策略的技术和方法。该方法包括:从互联网上的开放财经数据接口批量自动化地读取所有上市公司的原始财报数据;对每个上市公司原始的财报数据进行解析和处理,提取出各项基础性财务指标数据;对每个上市公司,根据提取出的基础性财务指标数据,计算出两个关键性的财务比率;根据计算出的两个关键性财务比率的大小,按照两个不同的维度对所有的上市公司进行综合排序;根据所有上市公司综合排序的结果,智能地生成最优的投资策略。本发明可以极大地提高财报分析工作的效率,帮助投资者作出最合理的投资决策;
但是现有技术进行智能化财务报表分析时,不方便直白的进行控制,导致输出的报表不具备针对性,并且,对大规模财务数据的处理效率有限,不方便准确提取关键指标,鉴于此,我们提出基于云端AI技术的智能化财务报表分析系统。
发明内容
本发明的目的在于提供基于云端AI技术的智能化财务报表分析系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供基于云端AI技术的智能化财务报表分析系统,包括云端架构单元、财务报表提取单元、数据处理单元、指标分析单元和智能决策单元;
所述云端架构单元用于基于云计算平台构建云端,通过云端实现财务报表数据的集中存储、处理和分析;
所述财务报表提取单元用于通过AI语音识别技术输入云端架构单元中,对企业提交的财务报表数据进行自动提取;
所述数据处理单元用于对所述财务报表提取单元提取的财务报表数据进行清洗的预处理;
所述指标分析单元用于利用机器学习算法计算和分析数据处理单元处理后的财务报表数据对应的财务指标;
所述智能决策单元用于通过数据可视化技术将所述指标分析单元的分析结果以图表和报表形式展示给用户。
作为本技术方案的进一步改进,所述云端架构单元包括云端构建模块、数据采集模块和数据存储模块;
所述云端构建模块用于根据业务需求选择云计算平台,部署云架构;
所述数据采集模块用于通过网络爬虫采集自不同财务系统的财务报表数据;
所述数据存储模块用于将所述数据采集模块采集到的财务报表数据存储到云端数据库中。
作为本技术方案的进一步改进,所述财务报表提取单元包括语言识别模块、关键字提取模块和输入提取模块;
所述语言识别模块用于识别用户的语音指令,将语音转化为文本;所述关键字提取模块用于对语言识别模块的文本进行分词、词性、标注和命名实体识别处理,提取文本关键词,所述输入提取模块用于将关键词与财务报表数据进行匹配,提取云端数据库中符合关键词的财务报表数据。
作为本技术方案的进一步改进,所述语言识别模块采用AI语音识别技术,包括以下步骤:
获取用户的语音指令;
提取音频的特征;
建立语音识别模型,使用训练集进行训练;
使用语音识别模型,对提取出来的特征进行语音指令的识别,并将识别结果转化为文本信息,将转化后的文本信息输出,作为语音指令的文本化表达形式。
作为本技术方案的进一步改进,所述输入提取模块采用词向量的相似度算法,表达式为:
;
其中,表示两个向量之间的夹角,/>表示向量/>和向量/>的点积,/>和/>分别表示向量/>和向量/>的模长。
作为本技术方案的进一步改进,所述数据处理单元包括数据去重、缺失值处理、格式规范化、错误值处理、数据类型转换和数据归一化处理。
作为本技术方案的进一步改进,所述指标分析单元包括特征选择模块、模型训练模块、模型评估模块和预测分析模块;
所述特征选择模块用于从分析数据处理单元处理后的财务报表数据中选择对应财务指标的相关特征;
所述模型训练模块用于利用财务报表特征和财务指标的历史数据对模型进行训练;
所述模型评估模块用于使用交叉验证方法对模型进行评估和优化;
所述预测分析模块用于使用训练好的模型对未来财务报表数据对应的财务指标进行预测,提供给用户做出决策。
作为本技术方案的进一步改进,所述指标分析单元还包括比对更新模块,所述比对更新模块用于将最终得到的财务指标预测结果与实际财务报表数据进行对比,输出模型的准确性。
作为本技术方案的进一步改进,所述智能决策单元的可视化技术包括条形图、折线图和散点图。
与现有技术相比,本发明的有益效果:
该基于云端AI技术的智能化财务报表分析系统中,通过云端架构单元构建云端存储财务报表数据,实现用户发出语音指令,使财务报表提取单元提取对应的财务报表数据,通过指标分析单元针对性的分析和计算用户语音指令对应的财务报表数据的财务指标,提高控制效果,方便针对性的进行分析,同时,通过智能决策单元可视化的展示财务报表数据,提高准确性。
附图说明
图1为本发明的整体结构原理框图;
图2为本发明的财务报表提取单元原理框图;
图3为本发明的指标分析单元原理框图。
图中各个标号意义为:
100、云端架构单元;110、云端构建模块;120、数据采集模块;130、数据存储模块;
200、财务报表提取单元;210、语言识别模块;220、关键字提取模块;230、输入提取模块;
300、数据处理单元;
400、指标分析单元;410、特征选择模块;420、模型训练模块;430、模型评估模块;440、预测分析模块;450、比对更新模块;
500、智能决策单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
财务报表分析,是通过收集、整理企业财务会计报告中的相关数据,对企业的财务状况、经营成果和现金流量情况进行综合比较和评价,即通过财务指标如净利率、财务比率等等来展现,而财务指标数据主要依赖于财务报表中的项目数据,传统的财务报表分析通常依赖于人工处理和手工计算,存在着效率低下、易出错、主观性较强等问题;
请参阅图1-图3所示,本实施例提供基于云端AI技术的智能化财务报表分析系统,包括云端架构单元100、财务报表提取单元200、数据处理单元300、指标分析单元400和智能决策单元500;
云端架构单元100用于基于云计算平台构建云端,通过云端实现财务报表数据的集中存储、处理和分析,提高数据处理效率和可扩展性。
云端架构单元100包括云端构建模块110、数据采集模块120和数据存储模块130;
云端构建模块110用于根据业务需求选择云计算平台,部署云架构,具体原理:根据业务需求和预算,选择合适的云计算平台,如亚马逊AWS、微软Azure、谷歌Cloud等,根据业务需求,设计云架构,包括云基础设施、网络、安全、数据等方面,以满足企业的需求,根据云架构设计方案,在云计算平台上部署云环境,包括云主机、存储、网络、数据库等资源的分配和设置,通过云控制台或其他管理工具,对云环境进行监控和管理,包括资源状态、性能指标、事件告警等,然后开发和部署应用程序,包括Web应用、移动应用、微服务、大数据分析和机器学习模型等,采用持续集成和交付的方式,使得应用程序的开发、测试和部署过程自动化,并获得更高的代码质量和生产力,也可以通过加密、认证、防火墙等安全控制措施,确保数据的安全性和隐私性,根据业务流量和负载情况,自动调整云资源,实现弹性伸缩和节约成本的目的,实现构建一个基于云计算平台的系统架构,有效提高企业的生产力和灵活性;
数据采集模块120用于通过网络爬虫采集自不同财务系统的财务报表数据,具体实现过程如下:根据业务需求和预算,确定需要采集财务报表数据的财务系统,例如ERP系统、会计软件、电子商务平台等,选择合适的爬虫框架,例如Scrapy、BeautifulSoup、Requests等,根据数据源的不同进行适配和配置,通过逆向工程和抓包分析等技术,获取目标财务系统的网站结构和数据源位置,设置相应的爬虫规则和数据抓取方式,通过自然语言处理、字符编码转换、数据格式验证等方法对爬取到的数据进行清洗和归一化处理,以保证数据质量和一致性,根据业务需求和数据更新频率,定期更新财务报表数据,以保证数据的实时性和准确性;
数据存储模块130用于将数据采集模块120采集到的财务报表数据存储到云端数据库中,以便后续处理和分析。
财务报表提取单元200用于通过AI语音识别技术输入云端架构单元100中,对企业提交的财务报表数据进行自动提取,实现对财务数据的结构化处理和准确提取。
在提取云端中的财务报表数据时,目前多采用检索的方式,导致检索时间长,操作复杂,导致提取数据效率低,因此,使财务报表提取单元200包括语言识别模块210、关键字提取模块220和输入提取模块230;
语言识别模块210用于识别用户的语音指令,将语音转化为文本;关键字提取模块220用于对语言识别模块210的文本进行分词、词性、标注和命名实体识别处理,提取文本关键词,具体原理:把一句话或者一个文本分割成若干个词;中文的分词可以采用常用的开源中文分词工具,如jieba、THULAC等;英文的分词可以使用空格、标点符号等来进行分割,或者使用专门的英文文本处理包,如NLTK等,词性标注:为每个分词标注词性,如名词n、动词v、形容词a等。可以通过使用开源的自然语言处理工具,如Stanford NLP、nltk、jieba等工具包进行处理;命名实体识别:对文本中的每个实体进行分类,如人名、组织机构、地名、日期等。 命名实体识别可以通过CRF条件随机场或者HMM隐马尔科夫模型等模型进行训练和识别,通过计算文本中的词频、文本主题等,提取出文本关键词;输入提取模块230用于将关键词与财务报表数据进行匹配,提取云端数据库中符合关键词的财务报表数据。
语言识别模块210采用AI语音识别技术,包括以下步骤:
获取用户的语音指令,例如通过麦克风输入或者上传已有的音频文件;
提取音频的特征,常见的特征提取方法包括MFCC、LPC以及PLP等;
建立语音识别模型,使用训练集进行训练,常用的模型包括HMM模型、深度学习模型等;
使用语音识别模型,对提取出来的特征进行语音指令的识别,并将识别结果转化为文本信息,将转化后的文本信息输出,作为语音指令的文本化表达形式。
值得说明的,输入提取模块230采用词向量的相似度算法,表达式为:
;
其中,表示两个向量之间的夹角,/>表示向量/>和向量/>的点积,/>和/>分别表示向量/>和向量/>的模长,对于两个文本A和B,分别用向量/>和向量/>表示,向量中每个元素表示对应词的词向量,通过计算两个文本的相似度,可以实现文本匹配、问答系统、自动摘要等任务。
具体的,数据处理单元300包括数据去重:检查每个数据片段是否存在重复或者相似的数据,对发现的重复数据进行去重处理;
缺失值处理:对缺失值进行处理,可以采用均值或者中位数填充缺失值,或者删除含有缺失值的数据,具体方法需要根据数据的实际情况确定;
格式规范化:将财务报表数据中的非标准化的格式进行标准化处理,如标准化数字格式,标准化日期格式等;
错误值处理:对于数据异常或者错误的数据,例如负数金额或者超过合理范围的金额,可以采用去除异常值、替换或者修正异常值等方法进行处理;
数据类型转换:将数据类型进行转换,例如将字符型转为数字型,确保数据的准确性和一致性;
数据归一化处理:将数据的范围缩放至0到1之间,保证每个要素对结果的影响相同,不会因为不同的范围影响结果的准确性,以达到更好的清洗效果。
数据处理单元300用于对财务报表提取单元200提取的财务报表数据进行清洗的预处理,确保数据质量和一致性。
指标分析单元400用于利用机器学习算法计算和分析数据处理单元300处理后的财务报表数据对应的财务指标,如盈利能力、偿债能力、经营能力等,为决策者提供全面的财务分析结果。
指标分析单元400包括特征选择模块410、模型训练模块420、模型评估模块430和预测分析模块440;
特征选择模块410用于从分析数据处理单元300处理后的财务报表数据中选择对应财务指标的相关特征,使用相关系数和特征间的相关性来进行选择;
模型训练模块420用于利用财务报表特征和财务指标的历史数据对模型进行训练,这可以使用监督学习算法,如回归分析或神经网络等;
模型评估模块430用于使用交叉验证方法对模型进行评估和优化,选择合适的算法、模型和参数,防止过拟合和欠拟合问题的出现;
预测分析模块440用于使用训练好的模型对未来财务报表数据对应的财务指标进行预测,提供给用户做出决策。
智能决策单元500用于通过数据可视化技术将指标分析单元400的分析结果以图表和报表形式展示给用户,提供直观的数据呈现和决策参考,同时根据用户需求和历史数据,为决策者提供智能化的决策建议和预测分析。
智能决策单元500的可视化技术包括条形图:用于对比不同财务指标在不同时间段的变化趋势,横坐标表示时间,纵坐标表示财务指标的数量,每个条形图的颜色可以用来表示不同的财务指标;
折线图:用于描绘财务指标随着时间的变化趋势,可以同时展示多个指标的变化情况,便于对比分析;
散点图:用于展示两个财务指标之间的相关性,每个散点的坐标可以表示两个财务指标的值或变化率,颜色和大小可以用来表示其他维度信息;
也可以通过智能化推荐分析财务报表数据,如下:
推荐财务指标:通过对用户的历史查询和浏览行为进行分析,自动推荐一些与用户关心的财务指标相关的指标;推荐时间范围:根据用户选择的财务指标和时间,自动推荐一些相邻的时间区间,方便用户进行更深入的分析和对比;推荐行业指标:将用户查询的财务指标与行业指标进行比较,提供与行业平均水平的对比分析结果。
综上,本发明现有技术进行智能化财务报表分析时,不方便直白的进行控制,导致输出的报表不具备针对性,并且,对大规模财务数据的处理效率有限,不方便准确提取关键指标,因此,通过云端架构单元100构建云端存储财务报表数据,实现用户发出语音指令,使财务报表提取单元200提取对应的财务报表数据,通过指标分析单元400针对性的分析和计算用户语音指令对应的财务报表数据的财务指标,提高控制效果,方便针对性的进行分析,同时,通过智能决策单元可视化的展示财务报表数据,提高准确性。
指标分析单元400还包括比对更新模块450,比对更新模块450用于将最终得到的财务指标预测结果与实际财务报表数据进行对比,输出模型的准确性,可以采用均方根误差RMSE:是衡量模型预测精度的一种指标,用于度量预测值与实际值之间的平均误差,计算公式:
;
其中,表示实际值,/>表示预测值,n表示样本数量,方便对机器学习模型的预测结果进行评估和优化,确定模型的准确性和稳定性。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (9)
1.基于云端AI技术的智能化财务报表分析系统,其特征在于:包括云端架构单元(100)、财务报表提取单元(200)、数据处理单元(300)、指标分析单元(400)和智能决策单元(500);
所述云端架构单元(100)用于基于云计算平台构建云端,通过云端实现财务报表数据的集中存储、处理和分析;所述财务报表提取单元(200)用于通过AI语音识别技术输入云端架构单元(100)中,对企业提交的财务报表数据进行自动提取;所述数据处理单元(300)用于对所述财务报表提取单元(200)提取的财务报表数据进行清洗的预处理;所述指标分析单元(400)用于利用机器学习算法计算和分析数据处理单元(300)处理后的财务报表数据对应的财务指标;所述智能决策单元(500)用于通过数据可视化技术将所述指标分析单元(400)的分析结果以图表和报表形式展示给用户。
2.根据权利要求1所述的基于云端AI技术的智能化财务报表分析系统,其特征在于:所述云端架构单元(100)包括云端构建模块(110)、数据采集模块(120)和数据存储模块(130);
所述云端构建模块(110)用于根据业务需求选择云计算平台,部署云架构;
所述数据采集模块(120)用于通过网络爬虫采集自不同财务系统的财务报表数据;
所述数据存储模块(130)用于将所述数据采集模块(120)采集到的财务报表数据存储到云端数据库中。
3.根据权利要求2所述的基于云端AI技术的智能化财务报表分析系统,其特征在于:所述财务报表提取单元(200)包括语言识别模块(210)、关键字提取模块(220)和输入提取模块(230);
所述语言识别模块(210)用于识别用户的语音指令,将语音转化为文本;所述关键字提取模块(220)用于对语言识别模块(210)的文本进行分词、词性、标注和命名实体识别处理,提取文本关键词,所述输入提取模块(230)用于将关键词与财务报表数据进行匹配,提取云端数据库中符合关键词的财务报表数据。
4.根据权利要求3所述的基于云端AI技术的智能化财务报表分析系统,其特征在于:所述语言识别模块(210)采用AI语音识别技术,包括以下步骤:
获取用户的语音指令;
提取音频的特征;
建立语音识别模型,使用训练集进行训练;
使用语音识别模型,对提取出来的特征进行语音指令的识别,并将识别结果转化为文本信息,将转化后的文本信息输出,作为语音指令的文本化表达形式。
5.根据权利要求4所述的基于云端AI技术的智能化财务报表分析系统,其特征在于:所述输入提取模块(230)采用词向量的相似度算法,表达式为:
;
其中,表示两个向量之间的夹角,/>表示向量/>和向量/>的点积,/>和/>分别表示向量/>和向量/>的模长。
6.根据权利要求1所述的基于云端AI技术的智能化财务报表分析系统,其特征在于:所述数据处理单元(300)包括数据去重、缺失值处理、格式规范化、错误值处理、数据类型转换和数据归一化处理。
7.根据权利要求1所述的基于云端AI技术的智能化财务报表分析系统,其特征在于:所述指标分析单元(400)包括特征选择模块(410)、模型训练模块(420)、模型评估模块(430)和预测分析模块(440);
所述特征选择模块(410)用于从分析数据处理单元(300)处理后的财务报表数据中选择对应财务指标的相关特征;
所述模型训练模块(420)用于利用财务报表特征和财务指标的历史数据对模型进行训练;
所述模型评估模块(430)用于使用交叉验证方法对模型进行评估和优化;
所述预测分析模块(440)用于使用训练好的模型对未来财务报表数据对应的财务指标进行预测,提供给用户做出决策。
8.根据权利要求7所述的基于云端AI技术的智能化财务报表分析系统,其特征在于:所述指标分析单元(400)还包括比对更新模块(450),所述比对更新模块(450)用于将最终得到的财务指标预测结果与实际财务报表数据进行对比,输出模型的准确性。
9.根据权利要求1所述的基于云端AI技术的智能化财务报表分析系统,其特征在于:所述智能决策单元(500)的可视化技术包括条形图、折线图和散点图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310779628.5A CN116542800A (zh) | 2023-06-29 | 2023-06-29 | 基于云端ai技术的智能化财务报表分析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310779628.5A CN116542800A (zh) | 2023-06-29 | 2023-06-29 | 基于云端ai技术的智能化财务报表分析系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116542800A true CN116542800A (zh) | 2023-08-04 |
Family
ID=87454501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310779628.5A Pending CN116542800A (zh) | 2023-06-29 | 2023-06-29 | 基于云端ai技术的智能化财务报表分析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116542800A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117726468A (zh) * | 2023-12-07 | 2024-03-19 | 深圳市电票科技有限公司 | 一种ai财税机器人的财税管理方法、系统及应用 |
CN117827462A (zh) * | 2024-01-16 | 2024-04-05 | 青海省交通建设管理有限公司 | 基于云计算的财务报告分析整合方法及系统 |
CN118093625A (zh) * | 2024-02-29 | 2024-05-28 | 浪潮通用软件有限公司 | 一种针对erp系统的财务数据查询方法、设备及介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109817217A (zh) * | 2019-01-17 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 基于语音识别的自助贩卖方法、装置、设备及介质 |
CN110348974A (zh) * | 2019-05-21 | 2019-10-18 | 深圳壹账通智能科技有限公司 | 财务报表处理方法和装置 |
CN110347784A (zh) * | 2019-05-23 | 2019-10-18 | 深圳壹账通智能科技有限公司 | 报表查询方法、装置、存储介质及电子设备 |
CN110674131A (zh) * | 2019-08-30 | 2020-01-10 | 深圳壹账通智能科技有限公司 | 财务报表数据处理方法、装置、计算机设备和存储介质 |
CN112488496A (zh) * | 2020-11-27 | 2021-03-12 | 山东浪潮通软信息科技有限公司 | 一种财务指标预测方法及装置 |
CN113609829A (zh) * | 2021-08-20 | 2021-11-05 | 广东电网有限责任公司 | 一种基于财务大数据的报表处理系统及方法 |
CN115526695A (zh) * | 2022-09-20 | 2022-12-27 | 暨南大学 | 一种基于自然语言处理的财务报告分析方法 |
CN116308470A (zh) * | 2023-05-24 | 2023-06-23 | 南京润典信息科技有限公司 | 基于数据分析的门店物品效期全生命周期管理系统 |
-
2023
- 2023-06-29 CN CN202310779628.5A patent/CN116542800A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109817217A (zh) * | 2019-01-17 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 基于语音识别的自助贩卖方法、装置、设备及介质 |
CN110348974A (zh) * | 2019-05-21 | 2019-10-18 | 深圳壹账通智能科技有限公司 | 财务报表处理方法和装置 |
CN110347784A (zh) * | 2019-05-23 | 2019-10-18 | 深圳壹账通智能科技有限公司 | 报表查询方法、装置、存储介质及电子设备 |
CN110674131A (zh) * | 2019-08-30 | 2020-01-10 | 深圳壹账通智能科技有限公司 | 财务报表数据处理方法、装置、计算机设备和存储介质 |
CN112488496A (zh) * | 2020-11-27 | 2021-03-12 | 山东浪潮通软信息科技有限公司 | 一种财务指标预测方法及装置 |
CN113609829A (zh) * | 2021-08-20 | 2021-11-05 | 广东电网有限责任公司 | 一种基于财务大数据的报表处理系统及方法 |
CN115526695A (zh) * | 2022-09-20 | 2022-12-27 | 暨南大学 | 一种基于自然语言处理的财务报告分析方法 |
CN116308470A (zh) * | 2023-05-24 | 2023-06-23 | 南京润典信息科技有限公司 | 基于数据分析的门店物品效期全生命周期管理系统 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117726468A (zh) * | 2023-12-07 | 2024-03-19 | 深圳市电票科技有限公司 | 一种ai财税机器人的财税管理方法、系统及应用 |
CN117726468B (zh) * | 2023-12-07 | 2024-10-11 | 深圳市电票科技有限公司 | 一种ai财税机器人的财税管理方法、系统及应用 |
CN117827462A (zh) * | 2024-01-16 | 2024-04-05 | 青海省交通建设管理有限公司 | 基于云计算的财务报告分析整合方法及系统 |
CN117827462B (zh) * | 2024-01-16 | 2024-06-21 | 青海省交通建设管理有限公司 | 基于云计算的财务报告分析整合方法及系统 |
CN118093625A (zh) * | 2024-02-29 | 2024-05-28 | 浪潮通用软件有限公司 | 一种针对erp系统的财务数据查询方法、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738564A (zh) | 贷后风险评估方法及装置、存储介质 | |
CN112836509B (zh) | 一种专家系统知识库构建方法及系统 | |
CN116542800A (zh) | 基于云端ai技术的智能化财务报表分析系统 | |
CN117271767A (zh) | 基于多智能体的运维知识库的建立方法 | |
CN116663664A (zh) | 一种基于nlp算法的客户营销场景数据分析系统及方法 | |
CN112671985A (zh) | 基于深度学习的坐席质检方法、装置、设备及存储介质 | |
CN117764724A (zh) | 一种智能化的信用评级报告构建方法及系统 | |
CN118861381A (zh) | 招聘信息数据的处理方法及系统 | |
Ao | Sentiment analysis based on financial tweets and market information | |
CN116955534A (zh) | 投诉工单智能处理方法、装置、设备及存储介质 | |
CN117540004B (zh) | 基于知识图谱和用户行为的工业领域智能问答方法及系统 | |
CN112380321A (zh) | 基于票据知识图谱的主次数据库分配方法及相关设备 | |
CN117875706A (zh) | 一种基于ai的评级工艺数字化管理方法 | |
CN116596662A (zh) | 基于企业舆情信息的风险预警的方法、装置、电子设备和介质 | |
Ilkhani et al. | Extraction test cases by using data mining; reducing the cost of testing | |
CN111274404B (zh) | 一种基于人机协同的小样本实体多领域分类方法 | |
CN117852553B (zh) | 基于聊天记录提取元器件交易场景信息的语言处理系统 | |
CN117436453B (zh) | 基于专利数据变化的技术线路变化趋势分析方法及系统 | |
CN118377854B (zh) | 一种创新全链条科技情报服务集成方法及平台 | |
CN118171645B (zh) | 一种基于文本分类的商业信息分析方法及系统 | |
CN117973872B (zh) | 供应链风险识别方法、装置、电子设备及存储介质 | |
CN115687632B (zh) | 一种刑事量刑情节分解分析的方法和系统 | |
CN112115705B (zh) | 一种电子简历的筛选方法及装置 | |
Agarwal et al. | An Exploration of the Effectiveness of Machine Learning Algorithms for Text Classification | |
CN118820985A (zh) | 基于大数据的业务订单分析预测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230804 |