RU2571407C1 - Method to generate map of connections of converted structured data array components - Google Patents
Method to generate map of connections of converted structured data array components Download PDFInfo
- Publication number
- RU2571407C1 RU2571407C1 RU2014126199/08A RU2014126199A RU2571407C1 RU 2571407 C1 RU2571407 C1 RU 2571407C1 RU 2014126199/08 A RU2014126199/08 A RU 2014126199/08A RU 2014126199 A RU2014126199 A RU 2014126199A RU 2571407 C1 RU2571407 C1 RU 2571407C1
- Authority
- RU
- Russia
- Prior art keywords
- logical
- elements
- data structure
- semantic
- grammatically
- Prior art date
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
Группа изобретений относится к решениям в области обработки массивов данных, в частности, к решениям в области формирования карты связей компонентов структурированных массивов данных, содержащих текст на естественном языке, и может быть использовано для формирования карты связей компонентов предварительно преобразованных структурированных массивов данных, содержащих текст на естественном языке.The group of inventions relates to solutions in the field of processing data arrays, in particular, to solutions in the field of forming a map of links of components of structured data arrays containing natural language text, and can be used to form a map of relations of components of previously transformed structured data arrays natural language.
УРОВЕНЬ ТЕХНИКИBACKGROUND
Из патента ЕА 002016 B1, G06F 17/30, 22.10.2001 (МАТВЕЕВ ЛЕВ ЛАЗАРЕВИЧ И ДР.) известен способ поиска похожих по текстовому и/или смысловому содержимому фрагментов в электронных документах, хранимых на устройствах хранения данных, заключающийся в индексировании каждого сохраняемого в архиве документа, разбиении упомянутых документов на фрагменты и формировании тематик из одного и более фрагмента, определении параметров поиска, проведении поиска, ранжировании полученного в результате поиска списка фрагментов документов, причем в качестве параметров поиска определяют множество входящих в выбранный фрагмент документа уникальных блоков информации и расширяют его посредством предварительной обработки каждого из упомянутых уникальных блоков информации, где под уникальным блоком информации понимают блок информации, встретившийся в выбранном фрагменте документа один и более раз, где в качестве предварительной обработки используют операцию получения, по меньшей мере, из одного уникального блока информации, одного или нескольких блоков информации, связанных с уникальным блоком информации заданным соотношением.From patent EA 002016 B1, G06F 17/30, 10.22.2001 (MATVEEV LEV LAZAREVICH AND OTHERS) a method is known for searching for fragments similar in text and / or semantic content in electronic documents stored on data storage devices, which consists in indexing each stored in document archive, dividing the mentioned documents into fragments and forming topics from one or more fragments, determining search parameters, conducting a search, ranking the list of document fragments obtained as a result of a search, moreover, as parameters claims are determined by the set of unique blocks of information included in the selected fragment of the document and are expanded by preliminary processing of each of the mentioned unique blocks of information, where a unique block of information refers to the block of information that occurs one or more times in the selected fragment of the document, where the operation is used as preliminary processing receiving at least one unique block of information, one or more blocks of information associated with a unique block of information ii predetermined ratio.
Из патента RU 2476927 С2, G06F 17/30, 27.02.2013 (АНШУКОВ СЕРГЕЙ АЛЕКСАНДРОВИЧ И ДР.) известен способ позиционирования текстов в пространстве знаний, заключающийся в том, что из входных данных выделяют элементы, соответствующие паттернам, входящим в таксоны, образующие таксономии, объединенные в онтологии; определяют значимые таксоны, которые взвешивают с учетом условий, приписанных паттернам; составляют набор взвешенных векторов, позиционирующих входной документ в пространстве знаний, отличающийся тем, что в нем для позиционирования используют множество онтологии, а также тем, что при составлении наборов векторов рассматривают только те элементы, которые соответствуют паттернам, входящим в один таксой или в таксоны, имеющие общие родительские таксоны.From patent RU 2476927 C2, G06F 17/30, 02.27.2013 (ANSHUKOV SERGEY ALEXANDROVICH AND OTHERS), a method for positioning texts in the knowledge space is known, which consists in distinguishing elements from the input data that correspond to patterns that are included in taxa forming taxonomies combined in ontology; significant taxa are determined that are weighted based on the conditions assigned to the patterns; make up a set of weighted vectors that position the input document in the knowledge space, characterized in that it uses a lot of ontologies for positioning, and also in that when compiling sets of vectors, only those elements that correspond to patterns included in one tax or in taxa are considered, having common parent taxa.
Из патента RU 2210809 С2, G06F 17/28, 20.08.2003 (ОТКРЫТОЕ АКЦИОНЕРНОЕ ОБЩЕСТВО «МОСКОВСКАЯ ТЕЛЕКОММУНИКАЦИОННАЯ КОРПОРАЦИЯ») известен способ автоматического преобразования исходного текста в совокупность взаимосвязанных объектов на основе таблицы настроек, содержащей знания о структуре исследуемой системы в виде совокупности образующих ее классов, включающих определенный набор атрибутов (в том числе взаимосвязи и отношения между объектами заданных классов) и установленные для каждого атрибута правила распознавания атрибута в тексте. Предусматривается возможность определения формата исходного текста и автоматического перевода его фрагментов в ходе формирования объектов.From patent RU 2210809 C2, G06F 17/28, 08/20/2003 (OPEN JOINT-STOCK COMPANY “MOSCOW TELECOMMUNICATION CORPORATION”), a method is known for automatically converting the source text into a set of interconnected objects based on a settings table containing knowledge about the structure of the system under study in the form of the set forming it classes that include a specific set of attributes (including relationships and relationships between objects of given classes) and rules for recognizing an attribute in the text established for each attribute. It is possible to determine the format of the source text and automatically translate its fragments during the formation of objects.
Из патента RU 2292078 C1, G06F 17/30, 20.01.2007 (ЗАКРЫТОЕ АКЦИОНЕРНОЕ ОБЩЕСТВО «МЕДИАЛИНГВА») известен способ поиска, разметки и отображения информации, включающий ввод искомых объектов данных исходных электронных документов, подлежащих поиску по информационным сетям с терминала абонента сети, осуществляющего функцию источника запроса искомых объектов данных, сравнение искомых объектов данных исходных электронных документов с контрольными объектами данных ассоциированной информации в информационной сети, а при совпадении искомых объектов с контрольными преобразование объектов данных исходных электронных документов посредством разметки объектов данных исходных электронных документов гиперссылками, визуализацию на терминале абонента сети электронных документов с гиперссылками и вызов на терминал абонента сети данных ассоциированной информации информационной сети, отличающийся тем, что перед разметкой создают, по меньшей мере, две области данных, по меньшей мере, одна из которых является резидентной областью для источника запроса искомых объектов данных и обеспечивает привязку к объектам данных первичных гиперссылок, содержащих дополнительные параметры, для адресации, по меньшей мере, к одной другой области, а, по меньшей мере, одна другая область является нерезидентной для источника запроса искомых объектов данных и обеспечивает привязку к объектам данных вторичных гиперссылок для адресации, по меньшей мере, к одному ресурсу данных ассоциированной информации для доступа к ней с терминалов абонентов, по меньшей мере, одной резидентной области являющейся источником первичной гиперссылки, при этом в резидентной области создают массив контрольных объектов данных с соответствующими каждому указанному объекту первичными гиперссылками в качестве связанных данных, а в нерезидентной области создают массив контрольных объектов данных ассоциированной информации с соответствующей каждому указанному объекту, по меньшей мере, одной вторичной гиперссылкой в качестве связанных данных ассоциированной информации информационной сети.From patent RU 2292078 C1, G06F 17/30, 20.01.2007 (MEDIA LINGUA CLOSED JOINT-STOCK COMPANY), a method for searching, marking and displaying information is known, including entering the desired data objects of the source electronic documents to be searched on information networks from a network subscriber terminal, performing the function of the request source of the desired data objects, comparing the desired data objects of the source electronic documents with the control data objects of the associated information in the information network, and if the desired objects coincide with the control conversion of data objects of source electronic documents by marking data objects of source electronic documents with hyperlinks, visualization of electronic documents with hyperlinks at the subscriber terminal and calling to the subscriber terminal of the data network of associated information of the information network, characterized in that at least two are created before marking data areas, at least one of which is a resident area for the request source of the desired data objects and provides a link access to data objects of primary hyperlinks containing additional parameters for addressing at least one other region, and at least one other region is non-resident for the query source of the desired data objects and provides binding to data objects of secondary hyperlinks for addressing at least one data resource of associated information for access to it from subscriber terminals of at least one resident area which is the source of the primary hyperlink, while in the In this area, an array of control data objects is created with primary hyperlinks corresponding to each specified object as related data, and in a non-resident area, an array of control data objects of associated information is created with at least one secondary hyperlink corresponding to each specified object as information associated information network.
Из патента RU 2386166 С2, G06F 17/30, 10.04.2010 (ОТКРЫТОЕ АКЦИОНЕРНОЕ ОБЩЕСТВО ТАГАНРОГСКИЙ АВИАЦИОННЫЙ НАУЧНО-ТЕХНИЧЕСКИЙ КОМПЛЕКС ИМ. Г.М. БЕРИЕВА) известен способ формирования базы знаний, которую формируют в виде трехмерного информационного пространства, в котором данные о документе или его части определяют в кластер или кластеры, образованные единичными отрезками (ортами) характеристических признаков. Полный идентификационный номер документа формируют из кодов орт составляющих характеристических признаков и идентификационного номера документа. Производят анализ каждого кластера на полноту определения ограниченной им сферы деятельности содержащимися в кластере документами. Результат анализа заносят в этот же кластер. Поиск и анализ данных производят как с помощью формирования и обработки запроса, так и в обратном направлении с помощью подготовки базы данных для ожидаемого пользователя. В системе также предусмотрены средства для работы с базой данных, для поиска, контроля и анализа информации, документов, областей деятельности, для создания и корректировки документов системными администраторами, экспертами и пользователями в соответствии с правами доступа.From patent RU 2386166 C2, G06F 17/30, 04/10/2010 (OPEN JOINT STOCK COMPANY TAGANROG AVIATION SCIENTIFIC AND TECHNICAL COMPLEX NAMED AFTER G.M. BERIEV), a method for generating a knowledge base is known which is formed in the form of a three-dimensional information space in which data about a document or its parts are defined in a cluster or clusters formed by single segments (orts) of characteristic features. The full identification number of the document is formed from the codes orth component characteristic features and the identification number of the document. Each cluster is analyzed for the completeness of the definition of the limited scope of activity contained in the documents contained in the cluster. The result of the analysis is recorded in the same cluster. Search and analysis of data is carried out both by means of the formation and processing of the request, and in the opposite direction by preparing the database for the expected user. The system also provides tools for working with the database, for searching, controlling and analyzing information, documents, areas of activity, for creating and updating documents by system administrators, experts and users in accordance with access rights.
Из патента RU 2253893 С2, G06F 17/27, 10.06.2005 (ЧЕРНИКОВ БОРИС ВАСИЛЬЕВИЧ) известен способ автоматизированного лексикологического синтеза документов, включающий создание и сохранение унифицированной формы документа, классификацию содержания документа путем выделения унифицированной постоянной информации и переменной информации, сохранения постоянной информации в базах данных, внесения постоянной информации в унифицированную форму документа и введения переменной информации в документ, при котором в переменной информации выделяют переменную унифицированную информацию, связанную с устойчивыми формулировками, переменную вводимую информацию, представляющую собой конкретизирующие сведения, и переменную неунифицированную информацию, содержащую свободные формулировки, причем переменную унифицированную информацию выделяют путем формирования совокупности опорных слов, однозначно определяющих конкретные формулировки в документе и составляющих лексикологический скелет документа, и сохраняют в машинной базе данных с избытком по отношению к отдельно взятому экземпляру документа, формируют лексикологическое дерево документа путем определения взаимозависимости отдельных опорных слов и затем формируют информационный контур управления документом путем установления способа внедрения формулировок переменной унифицированной и неунифицированной информации в зависимости от характера связи опорного слова с фрагментом документа.From patent RU 2253893 C2, G06F 17/27, 06/10/2005 (CHERNIKOV BORIS VASILIEVICH) a method for automated lexicological synthesis of documents is known, including the creation and preservation of a unified form of a document, classification of the contents of a document by highlighting unified constant information and variable information, storing constant information in databases, entering constant information into a unified form of the document and introducing variable information into the document, in which the variable un fictitious information associated with stable formulations, variable input information representing concretizing information, and variable non-standardized information containing free formulations, the variable unified information being distinguished by forming a set of support words that uniquely identify specific formulations in the document and constitute the lexicological skeleton of the document, and save the document in excess with respect to a single copy in a machine database a, the lexicological tree of the document is formed by determining the interdependence of the individual supporting words and then the information management loop of the document is formed by establishing a method for introducing formulations of the variable of unified and unified information depending on the nature of the relationship between the supporting word and the document fragment.
Из заявки WO 2013043160 A1, G06F 17/21, 28.03.2013 (HEWLETT PACKARD DEVELOPMENT CO ET AL.) известен способ обработки текстового массива данных, который заключается в построении графа, представляющему микромодель сущностей, образующих тело обрабатываемого документа. Разбиение такого текста на узлы графа, причем каждый узел относится к своей особенности выделенного фрагмента из текста, причем упомянутые узлы графа связываются между собой отношениями, аналогично связи фрагментов текста, соответствующего упомянутым узлам. В дальнейшем выстроенные узлы графа ранжируются для определения релевантных данных относительно запроса пользователя.From WO 2013043160 A1, G06F 17/21, 03/28/2013 (HEWLETT PACKARD DEVELOPMENT CO ET AL.), A method for processing a text data array is known, which consists in constructing a graph representing a micromodel of entities that form the body of the processed document. The division of such text into nodes of the graph, with each node referring to its own particulars of the selected fragment from the text, and the said nodes of the graph are interconnected by relations, similar to the connection of fragments of text corresponding to the said nodes. Subsequently, the constructed nodes of the graph are ranked to determine the relevant data regarding the user's request.
Из заявки WO 2001001289 A1, G06F 17/27, 04.01.2001 (INV MACHINE CORP INC) известен способ, который заключается в семантической обработке данных, представленных на естественном языке, причем способ включает ввод и хранение пользовательских условий, которые в дальнейшем используются для поиска в массивах данных, содержащих данные на естественном языке, представлений текста, содержащих релевантную пользовательскому вводу информацию, форматирование упомянутых представлений, извлечение из отформатированных представлений текста отношений типа субъект-действие-объект (СДО) и их сохранение в удаленном месте хранения, например, базе данных, реструктуризация выявленных СДО в нормализованный вид, назначение частей СДО, таких как действие-объект (ДО) в качестве наименования папок, в которых содержаться части СДО и назначение с указанными папками одного или более идентичных ассоциированных частей субъекта (S1, S2 … Sn), которые ассоциированы с соответствующими ДО частями. Способ позволяет также ассоциировать предложения, содержащие соответствующие элементы субъектов S1, S2 … Sn, и выделять в них релевантные СДО с их последующей маркировкой на фоне общего массива данных.From the application WO 2001001289 A1, G06F 17/27, 01/04/2001 (INV MACHINE CORP INC) a method is known which consists in semantic processing of data presented in a natural language, the method including entering and storing user conditions, which are then used for searching in data arrays containing natural language data, text representations containing information relevant to user input, formatting the aforementioned representations, extracting subject-action-object relationships from formatted text representations CT (LMS) and their storage in a remote storage location, for example, a database, restructuring the identified LMS into a normalized form, assigning parts of the LMS, such as an action-object (BO), as the name of the folders that contain parts of the LMS and the destination with the indicated folders of one or more identical associated parts of the subject (S1, S2 ... Sn), which are associated with the corresponding TO parts. The method also allows you to associate sentences containing the corresponding elements of the subjects S1, S2 ... Sn, and select relevant SDOs in them with their subsequent labeling against the background of a common data array.
Из патента US 8229730 В2, G06F 17/30, 24.07.2012 (MICROSOFT CORP ET AL.) известен способ поиска данных по запросу пользователя, представленного на естественном языке, причем способ заключается в том, что производят парсинг текстового массива данных с назначением грамматических ролей терминам и их последующей индексацией, которые находятся в семантической связи с терминами поискового запроса, причем упомянутые роли содержат доминантную и второстепенные роли, которые выявляются при анализе пользовательского запроса. Данный способ позволяет определять релевантные части документа, содержащие термины с ролями, совпадающими с ролями текста запроса пользователя.From the patent US 8229730 B2, G06F 17/30, 24.07.2012 (MICROSOFT CORP ET AL.) A method is known for searching data at the request of a user presented in natural language, the method being that the text data array is parsed with assignment of grammatical roles terms and their subsequent indexation, which are in semantic connection with the terms of the search query, and the mentioned roles contain dominant and secondary roles that are identified in the analysis of the user query. This method allows you to determine the relevant parts of the document containing terms with roles that match the roles of the text of the user’s request.
Из заявки ЕР 2400400 A1, G06F 17/27, 28.12.2011 (INBENTA PROFESSIONAL SERVICES S L) известен способ семантического поиска релевантной информации, заключающийся в том, что с помощью лексических функций и критерия значения текста в массиве данных, представленных на естественном языке, формируют фразы или выражения, полученные из базы данных содержания, и выбирают ответ, обладающий нависшим показателем семантического соответствия, причем способ заключается в трансформации контентов и запроса самостоятельных слов или групп слов с присвоенными им токенами, которые преобразовываются в семантические представления, тем самым применяя правила критерия значения текста посредством лексических функций, причем каждое из таких семантических представлений состоит из леммы и семантической категории.From the application EP 2400400 A1, G06F 17/27, 12.28.2011 (INBENTA PROFESSIONAL SERVICES SL), a method for semantic search for relevant information is known, which consists in the fact that using lexical functions and a criterion, the values of the text in the data array presented in natural language are formed phrases or expressions obtained from the content database, and select an answer that has an impending indicator of semantic correspondence, and the method consists in transforming the content and requesting independent words or groups of words with the tokens assigned to them that prevail azovyvayutsya in semantic representations, thereby applying the rules of the meaning of the text by means of the criterion of lexical functions, each of these semantic representations consists of a lemma and a semantic category.
Из заявки WO 2010105216 А2, G06F 17/20, 16.09.2010 (INVENTION MACHINE CORP) известен способ маркировки текстовых данных документа, заключающийся в том, что осуществляют лингвистический анализ документа, сравнивают документ после его анализа с шаблоном требуемых семантических отношений между объектами, формируют семантически размеченный текст с помощью применения семантических связей основанный на лингвистическом анализе текста и сравнения с шаблоном семантических связей, причем семантические метки ассоциированы со словами или фразами предложений текста, и идентифицируют компоненты определенных семантических отношений с последующим сохранением в базе данных семантически размеченного текста для последующего поиска релевантной информации по полученной структуре данных.From the application WO 2010105216 A2, G06F 17/20, 09/16/2010 (INVENTION MACHINE CORP), a method for marking text data of a document is known, which consists in linguistically analyzing a document, comparing the document after its analysis with a template of the required semantic relations between objects, forming semantically marked-up text using semantic links based on linguistic analysis of the text and comparison with the template of semantic links, with semantic labels associated with words or phrases of text sentences, and ide components of certain semantic relations are identified, with the subsequent storage of semantically marked-up text in the database for the subsequent search for relevant information on the obtained data structure.
Из заявки ЕР 2105847 A1, G06F 17/30, 30.09.2009 (ALCATEL LUCENT) известен способ автоматического формирования онтологии, заключающийся в том, что принимают термин, для которого необходимо сформировать онтологию, определяют значение упомянутого термина с помощью словаря, извлекают подходящие определения для упомянутого термина, определяют значение каждого из извлеченных определений с помощью упомянутого словаря, выполняют построение для каждого из определенных значений термина и каждого подходящего термина для термина начального запроса на создание онтологии, по меньшей мере, один логический пункт, описывающий взаимоотношение между парой упомянутых подходящих терминов, причем упомянутые логические пункты определяют онтологию термина ввода.From the application EP 2105847 A1, G06F 17/30, 09/30/2009 (ALCATEL LUCENT), a method for automatically generating an ontology is known, which consists in accepting a term for which it is necessary to form an ontology, determining the meaning of the term using a dictionary, and extracting suitable definitions for the said term, determine the meaning of each of the extracted definitions using the aforementioned dictionary, build for each of the defined meanings of the term and each suitable term for the term of the initial ontol creation request ogy, at least one logical paragraph describing the relationship between said pair of suitable terms, said logic input points define the ontology term.
Все указанные выше решения не позволяют формировать семантически и логически верно структурированный массив данных из исходного массива данных, содержащего текст на естественном языке, что не позволяет формировать карту связи компонентов структурированного массива данных.All of the above solutions do not allow the formation of a semantically and logically correctly structured data array from the original data array containing natural language text, which does not allow the formation of a communication map of the components of the structured data array.
Ближайшим аналогом (прототипом) заявленного решения принят способ отображения документа, описанный в патенте US 8335754 В2, G06F 17/00, 18.12.2012 (TAGGED INC ET AL.). Известный способ заключается в обращении к массиву данных, содержащему текстовые данные; извлечения, по меньшей мере, одного предложения из упомянутого массива; построения дерева связей, идентифицирующих части речи и грамматические отношения в структуре упомянутого дерева; формирования семантических структур, каждая из которых содержит три элемента из упомянутой структуры дерева - субъект-предикат-объект; сохранении семантической сети упомянутой древовидной структуры со связями; и отображения релевантных данных, которое может быть выполнено в виде: карты концепций, списка фактов, фрагментов текста, меток, тэгов или аннотаций.The closest analogue (prototype) of the claimed solution is the method for displaying the document described in US 8335754 B2, G06F 17/00, 12/18/2012 (TAGGED INC ET AL.). A known method is to access a data array containing text data; extracting at least one sentence from said array; constructing a tree of relations identifying parts of speech and grammatical relations in the structure of the tree; the formation of semantic structures, each of which contains three elements from the aforementioned tree structure - subject-predicate-object; preserving the semantic network of said tree structure with connections; and displaying relevant data, which can be made in the form of: a concept map, a list of facts, text fragments, labels, tags or annotations.
Недостатком известного способа является то, что при формировании упомянутой древовидной структуры отношений субъект-предикат-объект не производят формирование логических конструкций, состоящих из логических разделов, содержащих грамматически и орфографически верные элементы, что делает невозможным построение корректной карты связей компонентов и терминов логических конструкций.The disadvantage of this method is that when forming the aforementioned tree structure of relations, the subject-predicate-object relationships do not generate logical structures consisting of logical sections containing grammatically and spelling-correct elements, which makes it impossible to construct a correct map of the connections of components and terms of logical structures.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION
Исходя из этого, задачей, на решение которой направлено заявленное изобретение, является обеспечение карты связей компонентов логических конструкций преобразованного структурированного массива данных, которая в дальнейшем может быть подвергнута анализу.Based on this, the task to which the claimed invention is directed is to provide a map of the connections of the components of the logical structures of the transformed structured data array, which can be further analyzed.
Техническим результатом является создание карты связей компонентов логических конструкций преобразованного структурированного массива данных.The technical result is the creation of a map of the connections of the components of the logical structures of the transformed structured data array.
Заявленный технический результат достигается за счет того, что выполняют способ формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, причем упомянутый способ включает, по меньшей мере, этапы, на которых:The claimed technical result is achieved due to the fact that the method of forming a map of the components of the grammatically and spelling correct semantic parts of the logical sections of the logical structures of the transformed structured source data array is performed, said method comprising at least the steps of:
идентифицируют компоненты грамматически и орфографически верных семантических частей логических разделов логических конструкций из упомянутого преобразованного структурированного исходного массива данных, причем каждая упомянутая грамматически и орфографически верная семантическая часть, содержащая упомянутые компоненты, содержит, по меньшей мере, один упомянутый компонент, причем упомянутый компонент содержит не более одного значения компонента, и формируют таблицу компонентов, содержащую, по меньшей мере, упомянутые идентифицированные компоненты и их значения;the components of the grammatically and spelling-correct semantic parts of the logical sections of the logical constructs from said transformed structured source data array are identified, each grammatically and spelling-correct semantic part containing said components containing at least one said component, said component containing no more than one component value, and form a component table containing at least the mentioned identifiers ized components and their meanings;
идентифицируют грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащие упомянутые идентифицированные компоненты, и грамматически и орфографически верные семантические части логических разделов логических конструкций, не содержащие упомянутые идентифицированные компоненты;identify grammatically and orthographically correct semantic parts of logical sections of logical constructions containing said identified components, and grammatically and spelling correct semantic parts of logical sections of logical constructions that do not contain said identified components;
идентифицируют компоненты, содержащиеся в количестве более одного в упомянутых грамматически и орфографически верных семантических частях, и идентифицируют сочетания компонентов, содержащихся в количестве более одного в каждой отдельной упомянутой грамматически и орфографически верной семантической части, и формируют карту сочетаний компонентов, содержащую, по меньшей мере, упомянутые компоненты, содержащиеся в количестве более одного в каждой отдельной упомянутой грамматически и орфографически верной семантической части, и их сочетания;identify components contained in an amount of more than one in the aforementioned grammatically and spelling correct semantic parts, and identify combinations of components contained in an amount of more than one in each of the aforementioned grammatically and spelling correct semantic parts, and form a map of combinations of components containing at least said components contained in an amount of more than one in each separate grammatically and spelling-correct semantic part, and their etaniya;
идентифицируют значения компонентов, содержащихся в упомянутой карте сочетаний компонентов;identifying the values of the components contained in said combination map of the components;
в грамматически и орфографически верных семантических частях логических разделов логических конструкций, не содержащих упомянутых идентифицированных компонентов, идентифицируют понятия, семантически совпадающие с упомянутыми значениями компонентов, содержащихся в упомянутой карте сочетаний компонентов, и формируют таблицу семантически совпадающих понятий, содержащую, по меньшей мере, значения компонентов, содержащихся в упомянутой карте сочетаний компонентов, и семантически совпадающие с ними понятия;in the grammatically and spelling-correct semantic parts of the logical sections of logical constructions that do not contain the identified components identified, the concepts are identified that semantically coincide with the mentioned component values contained in the component combination map, and a table of semantically matching concepts containing at least the component values is formed contained in the aforementioned map of combinations of components, and semantically coinciding concepts with them;
идентифицируют, по меньшей мере, одну грамматически и орфографически верную семантическую часть логического раздела логической конструкции, не содержащую упомянутые идентифицированные компоненты и содержащую более одного упомянутого понятия;identify at least one grammatically and orthographically correct semantic part of the logical section of the logical structure that does not contain the identified components and contains more than one of the mentioned concepts;
идентифицируют грамматически и орфографически верную семантическую часть логического раздела логической конструкции, содержащую более одного упомянутого идентифицированного компонента, значения которых семантически совпадают с упомянутыми понятиями, содержащимися в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, не содержащей упомянутых идентифицированных компонентов и содержащей более одного упомянутого понятия;identify the grammatically and orthographically correct semantic part of the logical section of the logical structure, containing more than one identified component mentioned, the values of which semantically coincide with the mentioned concepts, contained in one grammatically and spelling correct semantic part of the logical section of the logical structure, not containing the identified identified components and containing more than one the mentioned concept;
формируют карту сочетаний семантически совпадающих понятий, содержащую, по меньшей мере, упомянутые понятия, содержащиеся в количестве более одного в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, не содержащей упомянутых идентифицированных компонентов, семантически совпадающие со значениями упомянутых идентифицированных компонентов, содержащихся в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, содержащей более одного упомянутого идентифицированного компонента;form a map of combinations of semantically matching concepts, containing at least the mentioned concepts, containing more than one in one grammatically and spelling correct semantic part of the logical section of the logical structure that does not contain the identified components, semantically matching the values of the identified components contained in one grammatically and spelling-correct semantic part of a logical section of a logical construction containing olee one of said identified component;
формируют карту связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую карту сочетаний компонентов и упомянутую карту сочетаний семантически совпадающих понятий.form a map of the relationships of the components of the grammatically and spelling-correct semantic parts of the logical sections of the logical constructions of the transformed structured source data array containing at least the said map of combinations of components and the mentioned map of combinations of semantically identical concepts.
Варианты осуществления настоящего изобретения относятся к, способу, устройству, системе и машиночитаемому носителю для обеспечения формирования карты связей компонентов логических конструкций преобразованного структурированного массива данных, содержащего, по меньшей мере, текст на естественном языке.Embodiments of the present invention relate to a method, apparatus, system, and computer-readable medium for providing formation of a map of links of components of logical structures of a transformed structured data array containing at least natural language text.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS
Иллюстративные варианты осуществления настоящего изобретения описываются далее подробно со ссылкой на прилагаемые чертежи, которые включены в данный документ посредством ссылки, и на которых:Illustrative embodiments of the present invention are described below in detail with reference to the accompanying drawings, which are incorporated herein by reference, and in which:
На фиг. 1 изображена общая схема выполнения этапов заявленного способа преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке, в соответствии с первым вариантом осуществления настоящего изобретения.In FIG. 1 depicts a general flowchart of the inventive method for converting a structured source data array containing at least natural language text in accordance with a first embodiment of the present invention.
На фиг. 2 изображена общая схема выполнения этапов заявленного способа преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке, в соответствии с третьим вариантом осуществления настоящего изобретения.In FIG. 2 depicts a general flowchart for the steps of the claimed method for converting a structured source data array containing at least natural language text in accordance with a third embodiment of the present invention.
На фиг. 3 изображена общая схема этапа формирования первой структуры данных.In FIG. 3 shows a general diagram of the step of generating the first data structure.
На фиг. 4 изображена общая структура исходной структуры данных, из которой сформирована первая структура данных.In FIG. 4 shows the general structure of the original data structure from which the first data structure is formed.
На фиг. 5 изображена общая схема этапа формирования базы данных логических связей логических разделов.In FIG. 5 shows a general diagram of the stage of forming a database of logical connections of logical partitions.
На фиг. 6 изображен общий принцип формирования базы данных логических связей логических разделов.In FIG. 6 shows the general principle of forming a database of logical connections of logical partitions.
На фиг. 7 изображена общая схема этапа формирования второй структуры данных.In FIG. 7 shows a general diagram of a step for generating a second data structure.
На фиг. 8 изображена общая структура второй структуры данных.In FIG. 8 shows the general structure of a second data structure.
На фиг. 9 изображена общая схема этапа формирования базы данных семантических частей.In FIG. 9 shows the general scheme of the stage of formation of the database of semantic parts.
На фиг. 10 изображен общий принцип формирования базы данных семантических частей.In FIG. 10 depicts the general principle of forming a database of semantic parts.
На фиг. 11 изображена общая схема этапа формирования грамматически и орфографически верных семантических частей.In FIG. 11 shows a general diagram of the stage of formation of grammatically and spelling-correct semantic parts.
На фиг. 12 изображена общая схема второй структуры данных, полученной после выполнения этапа формирования грамматически и орфографически верных семантических частей.In FIG. 12 shows a general diagram of a second data structure obtained after the step of forming grammatically and spelling-correct semantic parts.
На фиг. 13 изображена общая схема этапа формирования результирующей структуры данных.In FIG. 13 shows a general diagram of the step of generating the resulting data structure.
На фиг. 14 изображена общая схема результирующей структуры данных.In FIG. 14 shows a general diagram of the resulting data structure.
На фиг. 15 изображена общая структура элементов результирующей структуры данных.In FIG. 15 shows the general structure of the elements of the resulting data structure.
На фиг. 16 изображена общая схема выполнения этапов заявленного способа формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных.In FIG. 16 depicts a general flowchart of the steps of the claimed method of forming a map of links of components of grammatically and spelling-correct semantic parts of logical sections of logical structures of a transformed structured source data array.
На фиг. 17-18 изображена общая схема выполнения этапов заявленного способа поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций.In FIG. 17-18 depict a general diagram of the steps of the claimed method for searching for relevant information in a transformed structured source data array containing at least logical constructions containing grammatically and spelling-correct semantic parts of logical sections of logical constructions.
На фиг. 19 изображена общая схема системы, содержащей устройство, предназначенной для реализации заявленных способов преобразования структурированного исходного массива данных, способов формирования карты связей компонентов преобразованного структурированного исходного массива данных и способов поиска релевантной информации в преобразованном структурированном исходном массиве данных.In FIG. 19 shows a general diagram of a system containing a device for implementing the claimed methods for converting a structured source data array, methods for generating a map of the components of a transformed structured source data array, and methods for finding relevant information in a converted structured source data array.
ВАРИАНТЫ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯMODES FOR CARRYING OUT THE INVENTION
Далее приводятся варианты осуществления настоящего изобретения, раскрывающие примеры его реализации в частных исполнениях. Тем не менее, само описание не предназначено для ограничения объема прав, предоставляемых данным патентом. Скорее, следует исходить из того, что заявленное изобретение также может быть осуществлено другими способами таким образом, что будет включать в себя отличающиеся этапы или комбинации этапов, аналогичных этапам, описанным в данном документе, в сочетании с другими существующими и будущими технологиями.The following are embodiments of the present invention, revealing examples of its implementation in private versions. However, the description itself is not intended to limit the scope of the rights granted by this patent. Rather, it should be assumed that the claimed invention can also be carried out in other ways in such a way that it will include different steps or combinations of steps similar to the steps described herein, in combination with other existing and future technologies.
Заявленный способ будет рассмотрен на примере обработки структурированного массива данных, содержащего текст на естественном языке, представляющего собой, не ограничиваясь, нормативные правовые акты (НПА). Для специалиста должно быть очевидно, что, несмотря на то, что в данном конкретном примере реализации настоящего изобретения, осуществляется преобразование НПА, такой способ преобразования может быть применен в отношении любого структурированного массива данных, схожего с НПА.The claimed method will be considered on the example of processing a structured data array containing natural language text, which is, without limitation, regulatory legal acts (NPA). It should be obvious to a person skilled in the art that despite the fact that in this particular implementation example of the present invention, the conversion of NLA is carried out, such a conversion method can be applied to any structured data array similar to NLA.
НПА - это документ, характеризующийся следующими признаками:NLA is a document characterized by the following features:
1) НПА имеют правотворческий характер: в них нормы права либо устанавливаются, либо изменяются, либо отменяются. Нормативные правовые акты - это носители правовых норм;1) NLAs are of a law-making nature: in them, the rules of law are either established, changed or canceled. Normative legal acts are carriers of legal norms;
2) НПА содержит правовые инструменты, с помощью которых осуществляется правовое регулирующее воздействие.2) the regulatory legal act contains legal instruments with the help of which the legal regulatory influence is implemented.
3) НПА издается только в пределах компетенции правотворческого органа;3) NPA is published only within the competence of the law-making body;
4) НПА облекается в документальную форму и имеет следующие реквизиты: вид нормативного акта, его наименование, орган, его принявший, дату, место принятия акта, номер;4) NPA is clothed in documentary form and has the following details: type of regulatory act, its name, authority that adopted it, date, place of adoption of the act, number;
5) НПА не является хаотичным набором положений (предложений), а имеет определенную структуру;5) NPA is not a chaotic set of provisions (proposals), but has a certain structure;
6) НПА должен соответствовать конституции или иному вышестоящему НПА, имеющему большую юридическую силу.6) The NLA must be consistent with the constitution or another higher NLA, which has greater legal force.
7) НПА обязательно подлежит доведению до сведения граждан и организаций, т.е. опубликованию, и лишь только после этого государство имеет право требовать его неукоснительного исполнения, исходя из презумпции знания закона, и налагать санкции за его неисполнение.7) NPA must be brought to the attention of citizens and organizations, i.e. publication, and only after that, the state has the right to demand its rigorous execution, based on the presumption of knowledge of the law, and impose sanctions for its failure.
Необходимо отметить, что под термином «структурированный массив данных» в рамках заявленного изобретения может рассматриваться не только совокупность НПА, но и отдельный самостоятельный НПА, представляющий собой, например: Конституцию, закон, указ, постановление и т.п. Отдельный НПА может состоять, например, из частей, глав, разделов, статей. При этом инструментом правового регулирующего воздействия НПА является юридическое правило, обличенное в структуру нормативного предписания, которое в свою очередь является элементом (частью) нормы права (правовой нормы).It should be noted that the term “structured data array” within the framework of the claimed invention can be considered not only a set of legal acts, but also a separate independent legal acts, which is, for example: the Constitution, law, decree, regulation, etc. A separate LA can, for example, consist of parts, chapters, sections, articles. At the same time, the instrument of the legal regulatory impact of the legal acts is the legal rule, denounced in the structure of the regulatory requirement, which in turn is an element (part) of the rule of law (legal norm).
Структурированным исходным массивом данных, содержащем, по меньшей мере, текст на естественном языке является, в частности, НПА, который представляет собой текст, состоящий из структурно-простых и структурно-сложных языковых конструкций.A structured source data array containing at least natural language text is, in particular, a legal entity, which is a text consisting of structurally simple and structurally complex language constructs.
Под языковой конструкцией для целей настоящего изобретения понимается синтаксически связанное сочетание слов, словесное построение.Under the language construct for the purposes of the present invention refers to a syntactically related combination of words, verbal construction.
Для целей настоящего изобретения под структурно-простой языковой конструкцией понимаются завершенные фрагменты текста - грамматически организованные соединения слов, т.е. предложения. При этом каждое предложение обязательно характеризуется смысловой законченностью.For the purposes of the present invention, a structurally simple linguistic construction is understood to mean complete text fragments — grammatically organized word combinations, i.e. offers. Moreover, each sentence is necessarily characterized by semantic completeness.
Для целей настоящего изобретения под структурно-сложной языковой конструкцией понимаются конструкции типа «рубрики перечисления».For the purposes of the present invention, structurally complex linguistic construction is understood as constructions of the “listing category” type.
Примером языковой конструкции, относящейся к «рубрикам перечисления» является следующая языковая конструкция:An example of a language construct related to “listing headings” is the following language construct:
«Потребитель в случае обнаружения в товаре недостатков, если они не были оговорены продавцом, по своему выбору вправе:“The consumer, if defects are found in the product, if they have not been agreed upon by the seller, have the right to choose:
- потребовать замены на товар этой же марки (этих же модели и (или) артикула);- require replacement of goods of the same brand (of the same model and (or) article);
- потребовать замены на такой же товар другой марки (модели, артикула) с соответствующим перерасчетом покупной цены;- require replacement for the same product of another brand (model, article) with the corresponding recalculation of the purchase price;
- потребовать соразмерного уменьшения покупной цены;- demand a commensurate reduction in the purchase price;
- потребовать незамедлительного безвозмездного устранения недостатков товара или возмещения расходов на их исправление потребителем или третьим лицом;- require immediate gratuitous elimination of defects in the goods or reimbursement of expenses for their correction by the consumer or a third party;
- отказаться от исполнения договора купли-продажи и потребовать возврата уплаченной за товар суммы.».- refuse to fulfill the contract of sale and demand the return of the amount paid for the goods. ”.
Главной целью предварительного преобразования структурированного исходного массива данных является формирование структурированного массива данных, состоящего только из предложений. Эта цель реализуется за счет преобразования структурно-сложных языковых конструкций в структурно-простые языковые конструкции - предложения.The main goal of the preliminary transformation of a structured source data array is the formation of a structured data array consisting only of sentences. This goal is realized by converting structurally complex linguistic constructions into structurally simple linguistic constructions - sentences.
Другой целью предварительного преобразования является прояснение контекстных терминов и упрощение предложений, содержащих контекстные термины.Another purpose of the preliminary conversion is to clarify contextual terms and simplify sentences containing contextual terms.
Для целей настоящего изобретения под контекстными терминами понимаются условные именования таких терминов, которые либо не имеют самостоятельного смыслового значения вне контекста, либо имеют множество смысловых значений в контексте.For the purposes of the present invention, contextual terms are understood to mean the conditional naming of such terms that either do not have an independent semantic meaning outside the context, or have many semantic meanings in the context.
При этом для целей настоящего изобретения под контекстом понимается относительно законченный по смыслу отрывок текста, в пределах которого наиболее точно и ясно выявлен смысл и значение отдельного входящего в него слова, словосочетания или совокупности словосочетаний, а также группа из минимум двух предложений, в двух различных отрывках текста, при условии наличия в одном из предложений ссылки на другое предложение.Moreover, for the purposes of the present invention, the context refers to a relatively finished meaningful passage of text within which the meaning and meaning of a single word, phrase or combination of phrases, as well as a group of at least two sentences, in two different passages are most accurately and clearly identified. text, provided that in one of the sentences there is a link to another sentence.
В первом варианте осуществления настоящего изобретения обеспечивается способ преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке, причем упомянутый способ содержит, по меньшей мере, этапы, на которых:In a first embodiment of the present invention, there is provided a method for converting a structured source data array containing at least natural language text, said method comprising at least the steps of:
А) формируют исходную структуру данных структурированного исходного массива данных, содержащую исходные элементы исходной структуры данных, причем упомянутые исходные элементы представляют собой:A) form the initial data structure of a structured source data array containing the source elements of the original data structure, and the said source elements are:
структурно-сложные языковые конструкции, представляющие собой структурно-сложные языковые конструкции, содержащие контекстные термины и структурно-сложные языковые конструкции, не содержащие контекстные термины; иstructurally complex linguistic constructions, which are structurally complex linguistic constructions containing contextual terms and structurally complex linguistic constructions that do not contain contextual terms; and
структурно-простые языковые конструкции, представляющие собой структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;structurally simple language constructs, which are structurally simple language constructs containing contextual terms, and structurally simple language constructs that do not contain contextual terms;
Б) идентифицируют в упомянутых исходных элементах контекстные термины и формируют базу данных контекстных терминов, содержащую упомянутые идентифицированные контекстные термины;B) identify context terms in said source elements and form a database of context terms containing said identified context terms;
В) используя информацию, содержащуюся в упомянутой сформированной базе данных контекстных терминов, в упомянутой исходной структуре данных идентифицируют структурно-сложные языковые конструкции, содержащие контекстные термины, структурно-сложные языковые конструкции, не содержащие контекстные термины, структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;C) using the information contained in said generated database of contextual terms, structurally complex linguistic constructs containing contextual terms, structurally complex linguistic constructs not containing contextual terms, structurally simple linguistic constructs containing contextual terms are identified in said initial data structure , and structurally simple language constructs that do not contain contextual terms;
Г) осуществляют преобразование первого типа над упомянутыми структурно-сложными языковыми конструкциями, не содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;D) carry out the conversion of the first type on the above-mentioned structurally complex language constructs that do not contain contextual terms, to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms;
Д) осуществляют преобразование второго типа над упомянутыми структурно-простыми языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;E) carry out the conversion of the second type over the mentioned structurally simple language constructs containing contextual terms, to obtain grammatically and spelling correct structurally simple language constructs that do not contain contextual terms;
Е) осуществляют преобразование третьего типа над упомянутыми структурно-сложными языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;E) carry out the conversion of the third type over the above-mentioned structurally complex language constructs containing contextual terms, to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms;
Ж) формируют итоговую структуру данных структурированного исходного массива данных, содержащую элементы итоговой структуры данных, причем элементы итоговой структуры данных представляют собой структурно-простые языковые конструкции, не содержащие контекстные термины, и полученные за счет преобразований первого, второго и третьего типов грамматически и орфографически верные структурно-простые языковые конструкции, не содержащие контекстные термины.G) form the final data structure of the structured initial data array containing the elements of the final data structure, and the elements of the final data structure are structurally simple language constructs that do not contain contextual terms and are grammatically and spelling correct due to transformations of the first, second and third types structurally simple language constructs that do not contain contextual terms.
Во втором варианте осуществления настоящего изобретения обеспечивается способ преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке, причем упомянутый способ содержит, по меньшей мере, этапы, на которых:In a second embodiment of the present invention, there is provided a method for converting a structured source data array containing at least natural language text, said method comprising at least the steps of:
А) формируют исходную структуру данных структурированного исходного массива данных, содержащую исходные элементы исходной структуры данных, причем упомянутые исходные элементы представляют собой:A) form the initial data structure of a structured source data array containing the source elements of the original data structure, and the said source elements are:
структурно-сложные языковые конструкции, представляющие собой структурно-сложные языковые конструкции, содержащие контекстные термины и структурно-сложные языковые конструкции, не содержащие контекстные термины; иstructurally complex linguistic constructions, which are structurally complex linguistic constructions containing contextual terms and structurally complex linguistic constructions that do not contain contextual terms; and
структурно-простые языковые конструкции, представляющие собой структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;structurally simple language constructs, which are structurally simple language constructs containing contextual terms, and structurally simple language constructs that do not contain contextual terms;
Б) идентифицируют в упомянутых исходных элементах контекстные термины и формируют базу данных контекстных терминов, содержащую упомянутые идентифицированные контекстные термины;B) identify context terms in said source elements and form a database of context terms containing said identified context terms;
В) используя информацию, содержащуюся в упомянутой сформированной базе данных контекстных терминов, в упомянутой исходной структуре данных идентифицируют структурно-сложные языковые конструкции, содержащие контекстные термины, структурно-сложные языковые конструкции, не содержащие контекстные термины, структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;C) using the information contained in said generated database of contextual terms, structurally complex linguistic constructs containing contextual terms, structurally complex linguistic constructs not containing contextual terms, structurally simple linguistic constructs containing contextual terms are identified in said initial data structure , and structurally simple language constructs that do not contain contextual terms;
Г) осуществляют преобразование первого типа над упомянутыми структурно-сложными языковыми конструкциями, не содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;D) carry out the conversion of the first type on the above-mentioned structurally complex language constructs that do not contain contextual terms, to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms;
Д) осуществляют преобразование второго типа над упомянутыми структурно-простыми языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;E) carry out the conversion of the second type over the mentioned structurally simple language constructs containing contextual terms, to obtain grammatically and spelling correct structurally simple language constructs that do not contain contextual terms;
Е) осуществляют преобразование третьего типа над упомянутыми структурно-сложными языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;E) carry out the conversion of the third type over the above-mentioned structurally complex language constructs containing contextual terms, to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms;
Ж) формируют итоговую структуру данных структурированного исходного массива данных, содержащую элементы итоговой структуры данных, причем элементы итоговой структуры данных представляют собой структурно-простые языковые конструкции, не содержащие контекстные термины, и полученные за счет преобразований первого, второго и третьего типов грамматически и орфографически верные структурно-простые языковые конструкции, не содержащие контекстные термины; причемG) form the final data structure of the structured initial data array containing the elements of the final data structure, and the elements of the final data structure are structurally simple language constructs that do not contain contextual terms and are grammatically and spelling correct due to transformations of the first, second and third types structurally simple language constructs that do not contain contextual terms; moreover
преобразование первого типа включает форматное преобразование и лингвистическое преобразование;the first type conversion includes format conversion and linguistic conversion;
преобразование второго типа включает контекстное преобразование и лингвистическое преобразование;a second type conversion includes contextual conversion and linguistic conversion;
преобразование третьего типа включает форматное преобразование, контекстное преобразование и лингвистическое преобразование.a third type conversion includes format conversion, contextual conversion, and linguistic conversion.
В третьем варианте осуществления настоящего изобретения, обеспечивается способ по любому из первого или второго вариантов осуществления настоящего изобретения, дополнительно содержащий, по меньшей мере, этапы на которых:In a third embodiment of the present invention, there is provided a method according to any one of the first or second embodiments of the present invention, further comprising at least the steps of:
З) на основании полученной итоговой структуры данных формируют первую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных содержат первые логические разделы и вторые логические разделы;C) on the basis of the resulting final data structure form the first data structure of the structured source data array containing the elements of the said first data structure, said elements of the first data structure containing the first logical partitions and second logical partitions;
И) формируют базу данных логических связей логических разделов упомянутых элементов первой структуры данных;I) form a database of logical connections of logical sections of the mentioned elements of the first data structure;
К) формируют вторую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой второй структуры данных, причем упомянутые элементы второй структуры данных содержат логические конструкции логических разделов упомянутых элементов первой структуры данных, сформированные с использованием информации из упомянутой базы данных логических связей логических разделов, причем упомянутые логические разделы содержат первые семантические части и вторые семантические части;K) form a second data structure of a structured source data array containing the elements of said second data structure, said elements of the second data structure containing logical structures of logical partitions of said elements of the first data structure formed using information from said logical linking database of logical partitions, said logical sections contain the first semantic parts and the second semantic parts;
Л) формируют базу данных семантических частей логических разделов из упомянутых вторых семантических частей, причем упомянутые вторые семантические части исключаются из соответствующих упомянутых логических разделов;K) form a database of semantic parts of logical sections from said second semantic parts, wherein said second semantic parts are excluded from the corresponding mentioned logical sections;
М) формируют грамматически и орфографически верные семантические части упомянутых логических разделов путем лингвистических преобразований над упомянутыми семантическими частями;M) form grammatically and orthographically correct semantic parts of the mentioned logical sections by linguistic transformations over the mentioned semantic parts;
Н) формируют результирующую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой результирующей структуры данных, причем упомянутые элементы результирующей структуры данных содержат логические конструкции, содержащие, по меньшей мере, упомянутые грамматически и орфографически верные семантические части логических разделов.H) form the resulting data structure of the structured source data array containing the elements of the said resulting data structure, said elements of the resulting data structure containing logical constructs containing at least the grammatically and spelling-correct semantic parts of logical sections.
В четвертом варианте осуществления настоящего изобретения обеспечивается способ по третьему варианту осуществления настоящего изобретения, характеризующийся тем, что на этапе 3) осуществляют, по меньшей мере, этапы, на которых:In a fourth embodiment of the present invention, there is provided a method according to a third embodiment of the present invention, characterized in that, in step 3), at least the steps are carried out in which:
идентифицируют итоговую структуру данных структурированного исходного массива данных;identify the final data structure of the structured source data array;
идентифицируют элементы итоговой структуры данных;identify elements of the resulting data structure;
идентифицируют первые логические разделы упомянутых элементов итоговой структуры данных и вторые логические разделы упомянутых элементов итоговой структуры данных; иidentifying the first logical sections of said elements of the resulting data structure and the second logical sections of said elements of the resulting data structure; and
формируют первую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных содержат первые логические разделы и вторые логические разделы.form the first data structure of the structured source data array containing the elements of said first data structure, said elements of the first data structure containing first logical partitions and second logical partitions.
В пятом варианте осуществления настоящего изобретения обеспечивается способ по третьему варианту осуществления настоящего изобретения, характеризующийся тем, что на этапе И) осуществляют, по меньшей мере, этапы, на которых:In a fifth embodiment of the present invention, there is provided a method according to a third embodiment of the present invention, characterized in that in step I), at least the steps are carried out in which:
идентифицируют элементы первой структуры данных, содержащие один упомянутый первый логический раздел, и элементы первой структуры данных, содержащие один упомянутый второй логический раздел;identifying elements of a first data structure containing one of said first logical partitions and elements of a first data structure containing one of said second logical partition;
идентифицируют элементы первой структуры данных, содержащие более одного упомянутого первого логического раздела, и элементы первой структуры данных, содержащие более одного упомянутого второго логического раздела;identifying elements of a first data structure containing more than one of said first logical partitions, and elements of a first data structure containing more than one of said second logical partition;
среди элементов первой структуры данных, содержащих более одного упомянутого первого логического раздела, и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела, идентифицируют логические связи между упомянутыми первыми логическими разделами или между упомянутыми вторыми логическими разделами;among the elements of the first data structure containing more than one of said first logical partitions, and in the elements of the first data structure containing more than one of said second logical partitions, logical relationships between said first logical partitions or between said second logical partitions are identified;
среди элементов первой структуры данных, содержащих более одного упомянутого первого логического раздела, и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела, идентифицируют элементы первой структуры данных, не имеющие логической связи между логическими разделами; иamong the elements of the first data structure containing more than one of said first logical partitions, and in the elements of the first data structure containing more than one of said second logical partitions, elements of the first data structure that do not have a logical connection between logical partitions are identified; and
формируют базу данных логических связей логических разделов элементов первой структуры данных.form a database of logical relationships of logical sections of the elements of the first data structure.
В шестом варианте осуществления настоящего изобретения обеспечивается способ по третьему варианту осуществления настоящего изобретения, характеризующийся тем, что на этапе К) осуществляют, по меньшей мере, этапы, на которых:In a sixth embodiment of the present invention, there is provided a method according to a third embodiment of the present invention, characterized in that, in step K), at least the steps are carried out in which:
формируют логические конструкции логических разделов элементов первой структуры данных, используя информацию из базы данных логических связей логических разделов элементов первой структуры данных и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый первый логический раздел, и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый второй логический раздел; иform logical constructions of logical partitions of elements of the first data structure using information from a database of logical relationships of logical partitions of elements of the first data structure and logical partitions of said elements of the first data structure containing one of the first logical partitions and logical partitions of said elements of the first data structure containing one said second logical section; and
формируют вторую структуру данных структурированного исходного массива данных, содержащую элементы второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой сформированные логические конструкции логических разделов первой структуры данных.form a second data structure of a structured source data array containing elements of a second data structure, said elements of the second data structure being formed logical structures of logical partitions of the first data structure.
В седьмом варианте осуществления настоящего изобретения обеспечивается способ по третьему варианту осуществления настоящего изобретения, характеризующийся тем, что на этапе Л) осуществляют, по меньшей мере, этапы, на которых:In a seventh embodiment of the present invention, there is provided a method according to a third embodiment of the present invention, characterized in that at step A), at least the steps are carried out in which:
идентифицируют первые логические разделы элементов второй структуры данных и вторые логические разделы элементов второй структуры данных;identify the first logical partitions of the elements of the second data structure and the second logical partitions of the elements of the second data structure;
в упомянутых первых логических разделах и вторых логических разделах элементов второй структуры данных идентифицируют первые семантические части и вторые семантические части; иin said first logical sections and second logical sections of the elements of the second data structure, the first semantic parts and the second semantic parts are identified; and
в упомянутых первых и вторых логических разделах элементов второй структуры данных идентифицируют, по меньшей мере, особые семантические части первых логических разделов элементов второй структуры данных и особые семантические части вторых логических разделов элементов второй структуры данных и формируют базу данных особых семантических частей логических разделов элементов второй структуры данных путем перемещения упомянутых особых семантических частей в упомянутую формируемую базу данных особых семантических частей логических разделов элементов второй структуры данных.in said first and second logical sections of the elements of the second data structure, at least the special semantic parts of the first logical sections of the elements of the second data structure and the special semantic parts of the second logical sections of the elements of the second data structure are identified and form a database of special semantic parts of the logical sections of the elements of the second structure data by moving said special semantic parts to said generated database of special semantic logical parts sections of the elements of the second data structure.
В восьмом варианте осуществления настоящего изобретения обеспечивается способ по третьему варианту осуществления настоящего изобретения, характеризующийся тем, что на этапе М) осуществляют, по меньшей мере, этапы, на которых:In an eighth embodiment of the present invention, there is provided a method according to a third embodiment of the present invention, characterized in that at step M), at least the steps are carried out in which:
в упомянутых вторых семантических частях упомянутых вторых логических разделов элементов второй структуры данных идентифицируют, по меньшей мере, уточняющие структуры вторых семантических частей вторых логических разделов; иin said second semantic parts of said second logical sections of the elements of the second data structure, at least the refinement structures of the second semantic parts of the second logical sections are identified; and
осуществляют лингвистические преобразования над всеми семантическими частями, за исключением упомянутых особых семантических частей упомянутых первых и вторых логических разделов, для формирования грамматически и орфографически верных семантических частей логических разделов элементов второй структуры данных.carry out linguistic transformations over all semantic parts, with the exception of the mentioned special semantic parts of the mentioned first and second logical sections, to form grammatically and spelling-correct semantic parts of logical sections of the elements of the second data structure.
В девятом варианте осуществления настоящего изобретения обеспечивается способ по третьему варианту осуществления настоящего изобретения, характеризующийся тем, что на этапе Н) осуществляют, по меньшей мере, этапы, на которых:In a ninth embodiment of the present invention, there is provided a method according to a third embodiment of the present invention, characterized in that, in step H), at least the steps are carried out in which:
формируют из первых грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных и упомянутых грамматически и орфографически верных уточняющих структур вторых семантических частей вторых логических разделов элементов второй структуры данных смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных; иform semantic combinations of grammatically and spelling-correct semantic parts of the second logical sections of the elements of the second data structure from the first grammatically and spelling-correct semantic parts of the second logical sections of the elements of the second data structure; and the grammatically and orthographically correct semantic parts of the second logical sections of the elements of the second data structure; and
формируют результирующую структуру данных структурированного исходного массива данных, содержащую элементы результирующей структуры данных, причем упомянутые элементы результирующей структуры данных представляют собой логические конструкции, содержащие упомянутые грамматически и орфографически верные семантические части логических разделов элементов второй структуры данных.form the resulting data structure of the structured source data array containing the elements of the resulting data structure, and said elements of the resulting data structure are logical constructs containing the grammatically and spelling-correct semantic parts of the logical sections of the elements of the second data structure.
В десятом варианте осуществления настоящего изобретения обеспечивается способ по девятому варианту осуществления настоящего изобретения, характеризующийся тем, что упомянутые логические конструкции из упомянутой результирующей структуры данных дополнительно могут содержать упомянутые сформированные смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных.In a tenth embodiment of the present invention, there is provided a method according to the ninth embodiment of the present invention, characterized in that said logical structures from said resultant data structure may further comprise said semantic combinations of grammatically and spelling-correct semantic parts of second logical sections of elements of the second data structure.
В одиннадцатом варианте осуществления настоящего изобретения обеспечивается способ по любому из первого или второго вариантов осуществления настоящего изобретения, характеризующийся тем, что дополнительно содержит, по меньшей мере, этапы, на которых:In an eleventh embodiment of the present invention, there is provided a method according to any one of the first or second embodiments of the present invention, characterized in that it further comprises at least the steps of:
З) идентифицируют исходную структуру данных исходного структурированного массива данных; идентифицируют элементы исходной структуры данных; идентифицируют первые логические разделы упомянутых элементов исходной структуры данных и вторые логические разделы упомянутых элементов исходной структуры данных; и формируют первую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных содержат первые логические разделы и вторые логические разделы;H) identify the original data structure of the original structured data array; identify elements of the original data structure; identifying the first logical partitions of said elements of the original data structure and the second logical partitions of said elements of the original data structure; and form the first data structure of the structured source data array containing the elements of said first data structure, said elements of the first data structure containing first logical partitions and second logical partitions;
И) идентифицируют элементы первой структуры данных, содержащие один упомянутый первый логический раздел, и элементы первой структуры данных, содержащие один упомянутый второй логический раздел; идентифицируют элементы первой структуры данных, содержащие более одного упомянутого первого логического раздела, и элементы первой структуры данных, содержащие более одного упомянутого второго логического раздела; в элементах первой структуры данных, содержащих более одного упомянутого первого логического раздела и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела, идентифицируют логические связи между упомянутыми первыми логическими разделами или между упомянутыми вторыми логическими разделами; в элементах первой структуры данных, содержащих более одного упомянутого первого логического раздела и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела идентифицируют элементы первой структуры данных, не имеющие логической связи между логическими разделами; и формируют базу данных логических связей логических разделов элементов первой структуры данных;I) identify elements of the first data structure containing one mentioned first logical partition, and elements of the first data structure containing one mentioned second logical partition; identifying elements of a first data structure containing more than one of said first logical partitions, and elements of a first data structure containing more than one of said second logical partition; in the elements of the first data structure containing more than one of said first logical partitions and in the elements of the first data structure containing more than one of said second logical partitions, logical relationships between said first logical partitions or between said second logical partitions are identified; in the elements of the first data structure containing more than one of the first logical partitions and in the elements of the first data structure containing more than one of the second logical partitions, elements of the first data structure that do not have a logical connection between logical partitions are identified; and form a database of logical relationships of logical partitions of the elements of the first data structure;
К) формируют логические конструкции логических разделов элементов первой структуры данных, используя информацию из базы данных логических связей логических разделов элементов первой структуры данных и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый первый логический раздел, и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый второй логический раздел; и формируют вторую структуру данных структурированного исходного массива данных, содержащую элементы второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой сформированные логические конструкции логических разделов первой структуры данных;K) form logical structures of logical partitions of elements of the first data structure using information from a database of logical connections of logical partitions of elements of the first data structure and logical partitions of said elements of the first data structure containing one of the first logical partitions and logical partitions of said elements of the first data structure, containing one said second logical partition; and form a second data structure of the structured source data array containing elements of the second data structure, said elements of the second data structure being formed logical structures of logical partitions of the first data structure;
Л) идентифицируют первые логические разделы элементов второй структуры данных и вторые логические разделы элементов второй структуры данных; в упомянутых первых логических разделах и вторых логических разделах элементов второй структуры данных идентифицируют первые семантические части и вторые семантические части; и в упомянутых первых и вторых логических разделах элементов второй структуры данных идентифицируют, по меньшей мере, особые семантические части первых логических разделов элементов второй структуры данных и особые семантические части вторых логических разделов элементов второй структуры данных и формируют базу данных особых семантических частей логических разделов элементов второй структуры данных путем перемещения упомянутых особых семантических частей в упомянутую формируемую базу данных особых семантических частей логических разделов элементов второй структуры данных;K) identify the first logical partitions of the elements of the second data structure and the second logical partitions of the elements of the second data structure; in said first logical sections and second logical sections of the elements of the second data structure, the first semantic parts and the second semantic parts are identified; and in said first and second logical partitions of the elements of the second data structure, at least special semantic parts of the first logical partitions of the elements of the second data structure and the special semantic parts of the second logical partitions of the elements of the second data structure are identified and form a database of special semantic parts of the logical partitions of the elements of the second data structures by moving said special semantic parts to said logically generated database of special semantic parts x sections of the elements of the second data structure;
М) в упомянутых вторых семантических частях упомянутых вторых логических разделов элементов второй структуры данных идентифицируют, по меньшей мере, уточняющие структуры вторых семантических частей вторых логических разделов; и осуществляют лингвистические преобразования над всеми семантическими частями, за исключением упомянутых особых семантических частей упомянутых первых и вторых логических разделов, для формирования грамматически и орфографически верных семантических частей логических разделов элементов второй структуры данных;M) in said second semantic parts of said second logical sections of the elements of the second data structure, at least the refinement structures of the second semantic parts of the second logical sections are identified; and carry out linguistic transformations over all semantic parts, with the exception of the mentioned special semantic parts of the mentioned first and second logical sections, to form grammatically and spelling-correct semantic parts of logical sections of the elements of the second data structure;
Н) формируют из первых грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных и упомянутых грамматически и орфографически верных уточняющих структур вторых семантических частей вторых логических разделов элементов второй структуры данных смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов третьей структуры данных; и формируют результирующую структуру данных структурированного исходного массива данных, содержащую элементы результирующей структуры данных, причем упомянутые элементы результирующей структуры данных представляют собой логические конструкции, содержащие упомянутые грамматически и орфографически верные семантические части логических разделов элементов второй структуры данных.H) form semantic combinations of grammatically and spelling-correct semantic parts of the second logical sections of the elements of the third structure from the first grammatically and spelling-correct semantic parts of the second logical sections of the elements of the second data structure and the grammatically and spelling-correcting refining structures of the second semantic parts of the second logical sections of the elements of the second data structure data; and form the resulting data structure of the structured source data array containing the elements of the resulting data structure, said elements of the resulting data structure being logical constructs containing the grammatically and spelling-correct semantic parts of the logical sections of the elements of the second data structure.
В двенадцатом варианте осуществления настоящего изобретения обеспечивается способ по одиннадцатому варианту осуществления настоящего изобретения, характеризующийся тем, что упомянутые логические конструкции из упомянутой результирующей структуры данных дополнительно могут содержать упомянутые сформированные смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных.In a twelfth embodiment of the present invention, there is provided a method according to the eleventh embodiment of the present invention, characterized in that said logical constructs from said resultant data structure may further comprise said semantic combinations of grammatically and spelling-correct semantic parts of second logical sections of elements of the second data structure.
При этом для специалиста в области техники, к которой относится настоящее изобретение, должно быть очевидным, что варианты осуществления изобретения со второго по двенадцатый характеризуют уточненные этапы способа, охарактеризованного первым вариантом осуществления изобретения, и иные варианты осуществления изобретения могут быть реализованы, причем такие иные варианты осуществления изобретения будут включать различные комбинации уточненных этапов способа.In this case, for a person skilled in the technical field to which the present invention relates, it should be obvious that the second to twelfth embodiments describe the specified steps of the method described by the first embodiment of the invention, and other embodiments of the invention can be implemented, and such other options embodiments of the invention will include various combinations of the specified process steps.
В тринадцатом варианте осуществления настоящего изобретения обеспечивается устройство преобразования структурированного исходного массива данных, содержащее, по меньшей мере:In a thirteenth embodiment of the present invention, there is provided a device for converting a structured source data array, comprising at least:
один или более процессоров;one or more processors;
один или более модулей ввода/вывода (I/O); иone or more input / output (I / O) modules; and
память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с первого по двенадцатый, и содержащую подлежащие преобразованию один или несколько структурированных исходных массивов данных, содержащих, по меньшей мере, текст на естественном языке.a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform the actions of the method according to any one of the first to twelfth embodiments of the present invention and containing one or more structured ones to be converted source data arrays containing at least natural language text.
В четырнадцатом варианте осуществления настоящего изобретения обеспечивается устройство преобразования исходного структурированного массива данных, содержащее, по меньшей мере:In a fourteenth embodiment of the present invention, there is provided a device for converting an initial structured data array, comprising at least:
один или более процессоров;one or more processors;
один или более модулей ввода/вывода (I/O); иone or more input / output (I / O) modules; and
память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с первого по двенадцатый, и содержащую подлежащие преобразованию один или несколько структурированных исходных массивов данных, содержащих, по меньшей мере, текст на естественном языке, причем упомянутые подлежащие преобразованию один или несколько структурированных исходных массивов данных являются загружаемыми, а упомянутое устройство выполнено с возможностью соединения с базой данных, в которой хранятся упомянутые загружаемые подлежащие преобразованию один или несколько структурированных исходных массивов данных, для осуществления загрузки в упомянутую память устройства, по меньшей мере, одного загружаемого подлежащего преобразованию структурированного исходного массива данных.a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform the actions of the method according to any one of the first to twelfth embodiments of the present invention and containing one or more structured ones to be converted source data arrays containing at least natural language text, said one or more structured ones to be converted the source data arrays are downloadable, and said device is configured to connect to a database in which said downloadable one or more structured source data arrays to be converted are stored to load at least one loadable structured source transformable an array of data.
В пятнадцатом варианте осуществления настоящего изобретения обеспечивается система преобразования структурированного исходного массива данных, содержащая, по меньшей мере:In a fifteenth embodiment of the present invention, there is provided a system for converting a structured source data array comprising at least:
одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с тринадцатого по четырнадцатый;one or more devices made in the form of devices according to any one of the thirteenth to fourteenth embodiments of the present invention;
один или несколько серверов, обеспечивающих регулирование обменом данных в упомянутой системе;one or more servers providing regulation of data exchange in said system;
одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;
одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных.one or more data transmission networks through which said devices, servers and databases interact.
В шестнадцатом варианте осуществления настоящего изобретения обеспечивается система преобразования структурированного исходного массива данных, содержащая, по меньшей мере:In a sixteenth embodiment of the present invention, there is provided a system for converting a structured source data array comprising at least:
одно или более устройств, выполненных в виде устройств по любому из тринадцатого или четырнадцатого вариантов осуществления настоящего изобретения;one or more devices made in the form of devices according to any one of the thirteenth or fourteenth embodiments of the present invention;
один или несколько серверов, обеспечивающих регулирование обменом данных в системе;one or more servers providing regulation of data exchange in the system;
одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;
одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных; причемone or more data transmission networks through which said devices, servers and databases interact; moreover
способ по любому из вариантов осуществления настоящего изобретения с первого по двенадцатый осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент.the method according to any one of the first to twelfth embodiments of the present invention is carried out by one or more of said servers, and said devices are a thin client.
В семнадцатом варианте осуществления настоящего изобретения обеспечивается система преобразования структурированного исходного массива данных, содержащая, по меньшей мере:In a seventeenth embodiment of the present invention, there is provided a system for converting a structured source data array comprising at least:
одно или более устройств, выполненных в виде устройств по любому из тринадцатого или четырнадцатого вариантов осуществления настоящего изобретения;one or more devices made in the form of devices according to any one of the thirteenth or fourteenth embodiments of the present invention;
один или несколько серверов, обеспечивающих регулирование обменом данных в системе;one or more servers providing regulation of data exchange in the system;
одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;
одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных; причемone or more data transmission networks through which said devices, servers and databases interact; moreover
способ по любому из вариантов осуществления настоящего изобретения с первого по двенадцатый осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент; причемthe method according to any one of the first to twelfth embodiments of the present invention is carried out by one or more of said servers, and said devices are a thin client; moreover
упомянутая база данных служит для хранения данных, представляющих собой, по меньшей мере, одно из: код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с первого по двенадцатый, подлежащие преобразованию один или несколько структурированных исходных массивов данных, содержащих, по меньшей мере, текст на естественном языке.said database is used to store data representing at least one of: a program code, which upon execution causes said one or more processors of said device and / or device associated with said device, to perform the actions of the method according to any one of the embodiments first to twelfth of the present invention, one or more structured source data arrays to be converted containing at least natural language text to be converted.
В восемнадцатом варианте осуществления настоящего изобретения обеспечивается система по любому из вариантов осуществления настоящего изобретения с пятнадцатого по семнадцатый, причем упомянутая сеть передачи данных представляет собой одно из локальная сеть (LAN), глобальная сеть (WAN), информационно-телекоммуникационная сеть Интернет, виртуальная частная сеть (VPN).In an eighteenth embodiment of the present invention, there is provided a system according to any one of the fifteenth to seventeenth embodiments of the present invention, said data network being one of a local area network (LAN), wide area network (WAN), telecommunications network Internet, virtual private network (VPN).
В девятнадцатом варианте осуществления настоящего изобретения обеспечивается машиночитаемый носитель данных, содержащий код программы, который при выполнении побуждает процессор или процессоры устройства, с которым взаимодействует машиночитаемый носитель данных, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с первого по двенадцатый.In a nineteenth embodiment of the present invention, there is provided a computer-readable storage medium comprising program code that, upon execution, causes a processor or processors of a device with which the computer-readable storage medium interacts to perform the steps of a method as in any of the first to twelfth embodiments of the present invention.
В двадцатом варианте осуществления настоящего изобретения обеспечивается способ формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, причем упомянутый способ включает, по меньшей мере, этапы, на которых:In a twentieth embodiment of the present invention, there is provided a method of forming a map of links of components of grammatically and orthographically correct semantic parts of logical sections of logical structures of a converted structured source data array, said method comprising at least the steps of:
идентифицируют компоненты грамматически и орфографически верных семантических частей логических разделов логических конструкций из упомянутого преобразованного структурированного исходного массива данных, причем каждая упомянутая грамматически и орфографически верная семантическая часть, содержащая упомянутые компоненты, содержит, по меньшей мере, один упомянутый компонент, причем упомянутый компонент содержит не более одного значения компонента, и формируют таблицу компонентов, содержащую, по меньшей мере, упомянутые идентифицированные компоненты и их значения;the components of the grammatically and spelling-correct semantic parts of the logical sections of the logical constructs from said transformed structured source data array are identified, each grammatically and spelling-correct semantic part containing said components containing at least one said component, said component containing no more than one component value, and form a component table containing at least the mentioned identifiers ized components and their meanings;
идентифицируют грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащие упомянутые идентифицированные компоненты, и грамматически и орфографически верные семантические части логических разделов логических конструкций, не содержащие упомянутые идентифицированные компоненты;identify grammatically and orthographically correct semantic parts of logical sections of logical constructions containing said identified components, and grammatically and spelling correct semantic parts of logical sections of logical constructions that do not contain said identified components;
идентифицируют компоненты, содержащиеся в количестве более одного в упомянутых грамматически и орфографически верных семантических частях, и идентифицируют сочетания компонентов, содержащихся в количестве более одного в каждой отдельной упомянутой грамматически и орфографически верной семантической части, и формируют карту сочетаний компонентов, содержащую, по меньшей мере, упомянутые компоненты, содержащиеся в количестве более одного в каждой отдельной упомянутой грамматически и орфографически верной семантической части, и их сочетания;identify components contained in an amount of more than one in the aforementioned grammatically and spelling correct semantic parts, and identify combinations of components contained in an amount of more than one in each of the aforementioned grammatically and spelling correct semantic parts, and form a map of combinations of components containing at least said components contained in an amount of more than one in each separate grammatically and spelling-correct semantic part, and their etaniya;
идентифицируют значения компонентов, содержащихся в упомянутой карте сочетаний компонентов;identifying the values of the components contained in said combination map of the components;
в грамматически и орфографически верных семантических частях логических разделов логических конструкций, не содержащих упомянутых идентифицированных компонентов, идентифицируют понятия, семантически совпадающие с упомянутыми значениями компонентов, содержащихся в упомянутой карте сочетаний компонентов, и формируют таблицу семантически совпадающих понятий, содержащую, по меньшей мере, значения компонентов, содержащихся в упомянутой карте сочетаний компонентов, и семантически совпадающие с ними понятия;in the grammatically and spelling-correct semantic parts of the logical sections of logical constructions that do not contain the identified components identified, the concepts are identified that semantically coincide with the mentioned component values contained in the component combination map, and a table of semantically matching concepts containing at least the component values is formed contained in the aforementioned map of combinations of components, and semantically coinciding concepts with them;
идентифицируют, по меньшей мере, одну грамматически и орфографически верную семантическую часть логического раздела логической конструкции, не содержащую упомянутые идентифицированные компоненты и содержащую более одного упомянутого понятия;identify at least one grammatically and orthographically correct semantic part of the logical section of the logical structure that does not contain the identified components and contains more than one of the mentioned concepts;
идентифицируют грамматически и орфографически верную семантическую часть логического раздела логической конструкции, содержащую более одного упомянутого идентифицированного компонента, значения которых семантически совпадают с упомянутыми понятиями, содержащимися в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, не содержащей упомянутых идентифицированных компонентов и содержащей более одного упомянутого понятия;identify the grammatically and orthographically correct semantic part of the logical section of the logical structure, containing more than one identified component mentioned, the values of which semantically coincide with the mentioned concepts, contained in one grammatically and spelling correct semantic part of the logical section of the logical structure, not containing the identified identified components and containing more than one the mentioned concept;
формируют карту сочетаний семантически совпадающих понятий, содержащую, по меньшей мере, упомянутые понятия, содержащиеся в количестве более одного в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, не содержащей упомянутых идентифицированных компонентов, семантически совпадающие со значениями упомянутых идентифицированных компонентов, содержащихся в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, содержащей более одного упомянутого идентифицированного компонента;form a map of combinations of semantically matching concepts, containing at least the mentioned concepts, containing more than one in one grammatically and spelling correct semantic part of the logical section of the logical structure that does not contain the identified components, semantically matching the values of the identified components contained in one grammatically and spelling-correct semantic part of a logical section of a logical construction containing olee one of said identified component;
формируют карту связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую карту сочетаний компонентов и упомянутую карту сочетаний семантически совпадающих понятий.form a map of the relationships of the components of the grammatically and spelling-correct semantic parts of the logical sections of the logical constructions of the transformed structured source data array containing at least the said map of combinations of components and the mentioned map of combinations of semantically identical concepts.
В двадцать первом варианте осуществления настоящего изобретения обеспечивается способ формирования карты связей компонентов по двадцатому варианту осуществления настоящего изобретения, дополнительно содержащий этап, на котором формируют отчет, демонстрирующий, по меньшей мере, количество связей и значения упомянутых компонентов, содержащихся в карте сочетаний компонентов.In a twenty-first embodiment of the present invention, there is provided a method for generating a component link map according to the twentieth embodiment of the present invention, further comprising a step of generating a report showing at least the number of links and values of said components contained in the component combination map.
В двадцать втором варианте осуществления настоящего изобретения обеспечивается устройство формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащее, по меньшей мере:In a twenty-second embodiment of the present invention, there is provided a device for generating a map of links of components of grammatically and spelling-correct semantic parts of logical sections of logical structures of a transformed structured source data array, comprising at least:
один или более процессоров;one or more processors;
один или более модулей ввода/вывода (I/O); иone or more input / output (I / O) modules; and
память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцатого по двадцать первый, и содержащую один или несколько преобразованных структурированных исходных массивов данных.a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform the actions of the method according to any of the embodiments of the present invention from twenty to twenty-first, and containing one or more transformed structured source data arrays.
В двадцать третьем варианте осуществления настоящего изобретения обеспечивается устройство формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащее, по меньшей мере:In a twenty-third embodiment of the present invention, there is provided a device for generating a map of links of components of grammatically and spelling correct semantic parts of logical sections of logical structures of a transformed structured source data array, comprising at least:
один или более процессоров;one or more processors;
один или более модулей ввода/вывода (I/O); иone or more input / output (I / O) modules; and
память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцатого по двадцать первый, и содержащую один или несколько преобразованных структурированных исходных массивов данных, причем упомянутые один или несколько преобразованных структурированных исходных массивов данных являются загружаемыми, а упомянутое устройство выполнено с возможностью соединения с базой данных, в которой хранятся упомянутые загружаемые один или несколько преобразованных структурированных исходных массивов данных, для осуществления загрузки в упомянутую память устройства, по меньшей мере, одного загружаемого преобразованного структурированного исходного массива данных.a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform the actions of the method according to any of the embodiments of the present invention from twenty to twenty-first, and containing one or more transformed structured source data arrays, wherein said one or more transformed structured source data arrays are downloadable, and said device in is configured to connect to a database in which said downloadable one or more transformed structured source data arrays are stored to load at least one loadable converted structured source data array into said device memory.
В двадцать четвертом варианте осуществления настоящего изобретения обеспечивается система формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащая, по меньшей мере:In a twenty-fourth embodiment of the present invention, there is provided a system for generating a map of links of components of grammatically and spelling-correct semantic parts of logical sections of logical structures of a transformed structured source data array, comprising at least:
одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с двадцать второго по двадцать третий;one or more devices made in the form of devices according to any one of the embodiments of the present invention from twenty-second to twenty-third;
один или несколько серверов, обеспечивающих регулирование обменом данных в упомянутой системе;one or more servers providing regulation of data exchange in said system;
одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;
одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных.one or more data transmission networks through which said devices, servers and databases interact.
В двадцать пятом варианте осуществления настоящего изобретения обеспечивается система формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащая, по меньшей мере:In a twenty-fifth embodiment of the present invention, there is provided a system for generating a map of relationships of components of grammatically and spelling-correct semantic parts of logical sections of logical structures of a transformed structured source data array, comprising at least:
одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с двадцать второго по двадцать третий;one or more devices made in the form of devices according to any one of the embodiments of the present invention from twenty-second to twenty-third;
один или несколько серверов, обеспечивающих регулирование обменом данных в системе;one or more servers providing regulation of data exchange in the system;
одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;
одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных; причемone or more data transmission networks through which said devices, servers and databases interact; moreover
способ по любому из вариантов осуществления настоящего изобретения с двадцатого по двадцать первый осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент.the method according to any one of the twenty to twenty first embodiments of the present invention is carried out by one or more of said servers, and said devices are a thin client.
В двадцать шестом варианте осуществления настоящего изобретения обеспечивается система формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащая, по меньшей мере:In a twenty-sixth embodiment of the present invention, there is provided a system for generating a map of links of components of grammatically and spelling-correct semantic parts of logical sections of logical structures of a transformed structured source data array, comprising at least:
одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с двадцать второго по двадцать третий;one or more devices made in the form of devices according to any one of the embodiments of the present invention from twenty-second to twenty-third;
один или несколько серверов, обеспечивающих регулирование обменом данных в системе;one or more servers providing regulation of data exchange in the system;
одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;
одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных; причемone or more data transmission networks through which said devices, servers and databases interact; moreover
способ по любому из вариантов осуществления настоящего изобретения с двадцатого по двадцать первый осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент; причемthe method according to any one of the twenty to twenty first embodiments of the present invention is carried out by one or more of said servers, and said devices are a thin client; moreover
упомянутая база данных служит для хранения данных, представляющих собой, по меньшей мере, одно из: код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцатого по двадцать первый, один или несколько преобразованных структурированных исходных массивов данных.said database is used to store data representing at least one of: a program code, which upon execution causes said one or more processors of said device and / or device associated with said device, to perform the actions of the method according to any one of the embodiments twenty to twenty first, one or more transformed structured source data arrays of the present invention.
В двадцать седьмом варианте осуществления настоящего изобретения обеспечивается система по любому из вариантов осуществления настоящего изобретения с двадцать четвертого по двадцать шестой, причем упомянутая сеть передачи данных представляет собой одно из локальная сеть (LAN), глобальная сеть (WAN), информационно-телекоммуникационная сеть Интернет, виртуальная частная сеть (VPN).In a twenty-seventh embodiment of the present invention, there is provided a system according to any one of the embodiments of the present invention from the twenty-fourth to the twenty-sixth, said data transmission network being one of a local area network (LAN), wide area network (WAN), telecommunications network Internet, virtual private network (VPN).
В двадцать восьмом варианте осуществления настоящего изобретения обеспечивается машиночитаемый носитель данных, содержащий код программы, который при выполнении побуждает процессор или процессоры устройства, с которым взаимодействует машиночитаемый носитель данных, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцатого по двадцать первый.In a twenty-eighth embodiment of the present invention, there is provided a computer-readable storage medium comprising program code that, upon execution, causes a processor or processors of a device with which the computer-readable storage medium interacts to perform method steps according to any one of embodiments twenty to twenty-first.
В двадцать девятом варианте осуществления настоящего изобретения обеспечивается способ поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций, причем упомянутый способ включает, по меньшей мере, этапы, на которых:In a twenty-ninth embodiment of the present invention, there is provided a method of searching for relevant information in a transformed structured source data array containing at least logical constructs containing grammatically and spelling-correct semantic parts of logical sections of logical constructs, said method comprising at least the steps , where:
формируют поисковый запрос, содержащий, по меньшей мере, один поисковый термин;form a search query containing at least one search term;
идентифицируют массив данных в упомянутом преобразованном структурированном исходном массиве данных, соответствующий упомянутому поисковому термину;identifying the data array in said transformed structured source data array corresponding to said search term;
идентифицируют, по меньшей мере, одну грамматически и орфографически верную семантическую часть логических разделов логических конструкций упомянутого преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутый поисковый термин;identifying at least one grammatically and spelling-correct semantic part of the logical sections of the logical constructs of said transformed structured source data array containing at least said search term;
идентифицируют, по меньшей мере, одну логическую конструкцию упомянутого преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую идентифицированную грамматически и орфографически верную семантическую часть;at least one logical construction of said transformed structured source data array is identified, comprising at least said grammatically and spelling-correct semantic part;
демонстрируют, по меньшей мере, упомянутую идентифицированную логическую конструкцию упомянутого преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую идентифицированную грамматически и орфографически верную семантическую часть.demonstrate at least said identified logical construction of said transformed structured source data array containing at least said identified grammatically and spelling-correct semantic part.
В тридцатом варианте осуществления настоящего изобретения обеспечивается способ поиска по двадцать девятому варианту осуществления настоящего изобретения, дополнительно содержащий этап назначения, по меньшей мере, одного критерия поиска.In a thirtieth embodiment of the present invention, there is provided a search method according to a twenty-ninth embodiment of the present invention, further comprising the step of assigning at least one search criterion.
В тридцать первом варианте осуществления настоящего изобретения обеспечивается способ поиска по тридцатому варианту осуществления настоящего изобретения, характеризующийся тем, что критерием поиска является, по меньшей мере, одно из: поиск по первым и вторым семантическим частям первых логических разделов логических конструкций и вторым семантическим частям вторых логических разделов логических конструкций; поиск по первым семантическим частям вторых логических разделов логических конструкций и вторым семантическим частям вторых логических разделов логических конструкций.In the thirty-first embodiment of the present invention, there is provided a search method according to the thirtieth embodiment of the present invention, characterized in that the search criterion is at least one of: search in the first and second semantic parts of the first logical sections of logical structures and the second semantic parts of the second logical sections of logical constructions; search in the first semantic parts of the second logical sections of logical constructions and the second semantic parts of the second logical sections of logical constructions.
В тридцать втором варианте осуществления настоящего изобретения обеспечивается способ поиска по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать первый, характеризующийся тем, что формируемый поисковый запрос представляет собой, по меньшей мере, одно из: терминологический поисковый запрос; компонентный поисковый запрос; компонентно-терминологический поисковый запрос.In the thirty-second embodiment of the present invention, there is provided a search method according to any one of the embodiments of the present invention from the twenty-ninth to the thirty-first, characterized in that the generated search query is at least one of: a terminological search query; component search query; component terminological search query.
В тридцать третьем варианте осуществления настоящего изобретения обеспечивается способ поиска по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать первый, дополнительно содержащий, по меньшей мере, этапы, на которых:In a thirty-third embodiment of the present invention, there is provided a search method according to any one of the embodiments of the present invention from the twenty-ninth to the thirty-first, further comprising at least the steps of:
выбирают, по меньшей мере, одну из упомянутых идентифицированных логических конструкций, содержащую, по меньшей мере, упомянутую идентифицированную грамматически и орфографически верную семантическую часть;selecting at least one of said identified logical constructs comprising at least said identified grammatically and spelling-correct semantic part;
идентифицируют, по меньшей мере, связанные с упомянутой грамматически и орфографически верной семантической частью грамматически и орфографически верные семантические части, содержащиеся в других логических конструкциях преобразованного структурированного массива данных, причем упомянутая идентификация осуществляется на основании сведений из карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций;at least grammatically and spelling-correct semantic parts associated with said grammatically and spelling-correct semantic parts are contained in other logical constructions of the transformed structured data array, said identification being carried out on the basis of information from the communications map of components of grammatically and spelling-correct semantic logical parts sections of logical constructions;
идентифицируют, по меньшей мере, одну или более логические конструкции, содержащие упомянутые идентифицированные связанные грамматически и орфографически верные семантические части или идентифицируют отсутствие логических конструкций, содержащих упомянутые идентифицированные связанные грамматически и орфографически верные семантические части;identify at least one or more logical constructs containing said identified grammatically and spelling-related semantic parts; or identify the absence of logical constructs containing said identified grammatically and spelling-related semantic parts;
демонстрируют, по меньшей мере, одну или более логические конструкции, содержащие упомянутые идентифицированные связанные грамматически и орфографически верные семантические части или демонстрируют отсутствие логических конструкций, содержащих упомянутые идентифицированные связанные грамматически и орфографически верные семантические части.demonstrate at least one or more logical constructs containing said identified grammatically and spelling-related correct semantic parts or demonstrate no logical constructs containing said identified grammatically and spelling-related semantic parts.
В тридцать четвертом варианте осуществления настоящего изобретения обеспечивается способ поиска по тридцать третьему варианту осуществления настоящего изобретения, характеризующийся тем, что формируемый поисковый запрос представляет собой, по меньшей мере, одно из: терминологический поисковый запрос; компонентный поисковый запрос; компонентно-терминологический поисковый запрос.In a thirty-fourth embodiment of the present invention, there is provided a search method according to a thirty-third embodiment of the present invention, characterized in that the generated search query is at least one of: a terminological search query; component search query; component terminological search query.
В тридцать пятом варианте осуществления настоящего изобретения обеспечивается устройство поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащее, по меньшей мере:In a thirty-fifth embodiment of the present invention, there is provided a device for searching for relevant information in a transformed structured source data array containing at least logical constructs containing grammatically and spelling-correct semantic parts of logical sections of logical constructs containing at least:
один или более процессоров;one or more processors;
один или более модулей ввода/вывода (I/O); иone or more input / output (I / O) modules; and
память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать четвертый, и содержащую один или несколько преобразованных структурированных исходных массивов данных.a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform the actions of the method according to any one of the embodiments of the present invention from the twenty-ninth to the thirty-fourth, and containing one or more converted structured source data arrays.
В тридцать шестом варианте осуществления настоящего изобретения обеспечивается устройство поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащее, по меньшей мере:In a thirty-sixth embodiment of the present invention, there is provided a device for searching for relevant information in a transformed structured source data array containing at least logical constructs containing grammatically and spelling-correct semantic parts of logical sections of logical constructs containing at least:
один или более процессоров;one or more processors;
один или более модулей ввода/вывода (I/O); иone or more input / output (I / O) modules; and
память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать четвертый, и содержащую один или несколько преобразованных структурированных исходных массивов данных, причем упомянутые один или несколько преобразованных структурированных исходных массивов данных являются загружаемыми, а упомянутое устройство выполнено с возможностью соединения с базой данных, в которой хранятся упомянутые загружаемые один или несколько преобразованных структурированных исходных массивов данных, для осуществления загрузки в упомянутую память устройства, по меньшей мере, одного загружаемого преобразованного структурированного исходного массива данных.a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform the actions of the method according to any one of the embodiments of the present invention from the twenty-ninth to the thirty-fourth, and containing one or more converted structured source data arrays, said one or more converted structured source data arrays being downloadable, and said The e device is configured to connect to a database in which said downloadable one or more transformed structured source data arrays are stored for loading at least one loadable transformed structured source data array into said device memory.
В тридцать седьмом варианте осуществления настоящего изобретения обеспечивается система поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащая, по меньшей мере:In a thirty-seventh embodiment of the present invention, there is provided a system for searching for relevant information in a transformed structured source data array containing at least logical constructs containing grammatically and spelling-correct semantic parts of logical sections of logical constructs containing at least:
одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с тридцать пятого по тридцать шестой;one or more devices made in the form of devices according to any one of the embodiments of the present invention from thirty-fifth to thirty-sixth;
один или несколько серверов, обеспечивающих регулирование обменом данных в упомянутой системе;one or more servers providing regulation of data exchange in said system;
одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;
одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных.one or more data transmission networks through which said devices, servers and databases interact.
В тридцать восьмом варианте осуществления настоящего изобретения обеспечивается система поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащая, по меньшей мере:In a thirty-eighth embodiment of the present invention, there is provided a system for searching for relevant information in a transformed structured source data array containing at least logical constructs containing grammatically and spelling-correct semantic parts of logical sections of logical constructs containing at least:
одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с тридцать пятого по тридцать шестой;one or more devices made in the form of devices according to any one of the embodiments of the present invention from thirty-fifth to thirty-sixth;
один или несколько серверов, обеспечивающих регулирование обменом данных в системе;one or more servers providing regulation of data exchange in the system;
одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;
одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных; причемone or more data transmission networks through which said devices, servers and databases interact; moreover
способ по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать четвертый осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент.the method according to any one of the embodiments of the present invention from the twenty-ninth to the thirty-fourth is carried out by one or more of said servers, and said devices are a thin client.
В тридцать девятом варианте осуществления настоящего изобретения обеспечивается система поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащая, по меньшей мере:In a thirty-ninth embodiment of the present invention, there is provided a system for searching for relevant information in a transformed structured source data array containing at least logical constructs containing grammatically and spelling-correct semantic parts of logical sections of logical constructs containing at least:
одно или более устройств, выполненных в виде устройств по любому из вариантов осуществления настоящего изобретения с тридцать пятого по тридцать шестой;one or more devices made in the form of devices according to any one of the embodiments of the present invention from thirty-fifth to thirty-sixth;
один или несколько серверов, обеспечивающих регулирование обменом данных в системе;one or more servers providing regulation of data exchange in the system;
одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;one or more databases for storing data configured to interact with said one or more devices;
одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных; причемone or more data transmission networks through which said devices, servers and databases interact; moreover
способ по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать четвертый осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент; причемthe method according to any one of the embodiments of the present invention from the twenty-ninth to the thirty-fourth is carried out by one or more of said servers, and said devices are a thin client; moreover
упомянутая база данных служит для хранения данных, представляющих собой, по меньшей мере, одно из: код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать четвертый, один или несколько преобразованных структурированных исходных массивов данных.said database is used to store data representing at least one of: a program code, which upon execution causes said one or more processors of said device and / or device associated with said device, to perform the actions of the method according to any one of the embodiments twenty-ninth to thirty-fourth of the present invention, one or more transformed structured source data arrays.
В сороковом варианте осуществления настоящего изобретения обеспечивается система по любому из вариантов осуществления настоящего изобретения с тридцать седьмого по тридцать девятый, причем упомянутая сеть передачи данных представляет собой одно из локальная сеть (LAN), глобальная сеть (WAN), информационно-телекоммуникационная сеть Интернет, виртуальная частная сеть (VPN).In the fortieth embodiment of the present invention, there is provided a system according to any one of the embodiments of the present invention from thirty-seventh to thirty-ninth, said data network being one of a local area network (LAN), wide area network (WAN), information and telecommunication network Internet, virtual private network (VPN).
В сорок первом варианте осуществления настоящего изобретения обеспечивается машиночитаемый носитель данных, содержащий код программы, который при выполнении побуждает процессор или процессоры устройства, с которым взаимодействует машиночитаемый носитель данных, выполнять действия способа по любому из вариантов осуществления настоящего изобретения с двадцать девятого по тридцать четвертый.In a forty-first embodiment of the present invention, there is provided a computer-readable storage medium comprising program code that, upon execution, causes a processor or processors of a device with which the computer-readable storage medium is interacting to perform method steps according to any one of embodiments of the present invention from twenty-ninth to thirty-fourth.
ДЕТАЛЬНОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙDETAILED DESCRIPTION OF THE DRAWINGS
Описанные в данном разделе возможные осуществления вариантов настоящего изобретения представлены на неограничивающих объем правовой охраны примерах, применительно к конкретным вариантам осуществления настоящего изобретения, которые во всех их аспектах предполагаются иллюстративными и не накладывающими ограничения. Альтернативные варианты реализации настоящего изобретения, не выходящие за пределы объема его правовой охраны, являются очевидными специалистам в данной области, имеющим обычную квалификацию, на которых это изобретение рассчитано.The possible implementations of the embodiments of the present invention described in this section are presented in non-limiting examples, with reference to specific embodiments of the present invention, which in all their aspects are assumed to be illustrative and not limiting. Alternative embodiments of the present invention, not beyond the scope of its legal protection, are obvious to experts in this field with the usual qualifications on which this invention is intended.
На фиг. 1 в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 100 преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке. Заявленный способ 100 преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке характеризуется выполнением этапа 101 формирования исходной структуры данных структурированного исходного массива данных, на котором формируют исходную структуру данных структурированного исходного массива данных, содержащую исходные элементы исходной структуры данных, причем упомянутые исходные элементы представляют собой структурно-сложные языковые конструкции, состоящие из структурно-сложных языковых конструкций, содержащих контекстные термины, и структурно-сложных языковых конструкции, не содержащих контекстные термины, и структурно-простые языковые конструкции, содержащие структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины. На этапе 101 формирования исходной структуры данных структурированного исходного массива данных осуществляют анализ элементов структурированного исходного массива данных для выявления наличия в нем исходных элементов исходной структуры данных структурированного исходного массива данных. В результате проведенного анализа осуществляется формирование исходной структуры данных структурированного исходного массива данных, состоящей из структурно-сложных и структурно-простых языковых конструкций - предложений и рубрик перечисления. Идентификация структурно-сложных языковых конструкций осуществляется в соответствии с первым критерием идентификации, который представляет собой критерий идентификации по первому типу комбинации знаков препинания. Первый тип комбинации знаков препинания характеризуется наличием следующих признаков структурно-сложной языковой конструкции:In FIG. 1, by way of example, but not limitation, a general flowchart of the steps of the claimed
а) структурно-сложная языковая конструкция состоит из нескольких текстовых фрагментов;a) structurally complex linguistic construction consists of several text fragments;
б) в первом текстовом фрагменте имеется последний символ первого текстового фрагмента - знак пунктуации «:» («двоеточие»);b) in the first text fragment there is the last character of the first text fragment - the punctuation mark “:” (“colon”);
в) после знака пунктуации «:» расположен знак форматирования (знак типографики) - «¶» («абзац»);c) after the punctuation mark “:” there is a formatting character (typographic character) - “¶” (“paragraph”);
г) после знака пунктуации «:» первого текстового фрагмента расположены вторые текстовые фрагменты, каждый из которых расположен на новой строке - красной строке абзаца;d) after the punctuation mark “:” of the first text fragment, the second text fragments are located, each of which is located on a new line - the red line of the paragraph;
д) каждый из вторых текстовых фрагментов начинается с прописной буквы;e) each of the second text fragments begins with a capital letter;
ж) каждый из вторых текстовых фрагментов может начинаться с маркера списка - знака форматирования (знака типографики), используемого для выделения элементов списка (рубрик перечисления);g) each of the second text fragments can begin with a list marker - a formatting character (typographic sign) used to highlight list items (listing headings);
з) каждый из вторых текстовых фрагментов может начинаться с маркера нумерации - цифры или буквы, с круглой скобкой или точкой;h) each of the second text fragments may begin with a numbering marker - numbers or letters, with a parenthesis or period;
и) количество вторых текстовых фрагментов, располагающихся на красных строках абзацев, должно быть не менее двух.i) the number of second text fragments located on the red lines of paragraphs should be at least two.
При этом структурно-простыми языковыми конструкциями являются такие элементы исходной структуры данных, в которых комбинация знаков препинания не соответствует первому критерию, т.е. такие элементы исходной структуры данных удовлетворяют критерию идентификации по второму типу комбинации знаков препинания, причем второй тип комбинации знаков препинания представляет собой все комбинации знаков препинания, за исключением комбинаций знаков препинания первого типа. Идентификация структурно-простых языковых конструкций производится путем выявления в тексте на естественном языке признаков окончания предложения - знаков препинания «.» («точка»), «…» («многоточие») и т.п., - в совокупности с признаками начала следующего предложения - заглавной буквы, цифры и т.п., учитывая также наличие и определенные сочетания знаков препинаний, а именно - знаков пунктуации («.» («точка»), «;» («точка с запятой»), «…» («многоточие»), «,» («запятая»), «(» («открывающая скобка»), «)» («закрывающая скобка»), «:» («двоеточие») и т.п.), словоразделителей (« » («пробел»), «-» («тире»), и т.п.) и типографики «¶» («абзац»), номер, «°» («градус») и т.п.).At the same time, structurally simple language constructs are those elements of the initial data structure in which the combination of punctuation marks does not meet the first criterion, i.e. such elements of the original data structure satisfy the identification criterion for the second type of punctuation mark combination, the second type of punctuation mark combination being all punctuation mark combinations, except for punctuation mark combinations of the first type. The identification of structurally simple linguistic constructions is carried out by identifying in the natural language text the signs of the end of the sentence - punctuation marks “.” (“Dot”), “...” (“ellipsis”), etc., in conjunction with the signs of the beginning of the next sentences - capital letters, numbers, etc., taking into account the presence and certain combinations of punctuation marks, namely punctuation marks (“.” (“dot”), “;” (“semicolon”), “...” (“Ellipsis”), “,” (“comma”), “(” (“opening bracket”), “)” (“closing bracket”), “:” (“colon”), etc.), from water separators (“” (“space”), “-” (“dash”), etc.) and typography “¶” (“paragraph”), number, “°” (“degree”), etc. .).
Также способ 100 преобразования структурированного исходного массива данных характеризуется выполнением этапа 102 идентификации контекстных терминов и формирования базы данных контекстных терминов, на котором идентифицируют в упомянутых исходных элементах контекстные термины и формируют базу данных контекстных терминов, содержащую упомянутые идентифицированные контекстные термины. На данном этапе идентифицируется комбинации контекстных терминов первого типа, контекстных терминов второго типа, контекстных терминов третьего типа, которые в результате идентифицируются как контекстные понятия, контекстно-обобщенные понятия и контекстные ссылки. Идентификация по критерию комбинации контекстных терминов первого типа позволяет идентифицировать контекстные понятия. Контекстные понятия - это однословный или многословный термин, не имеющий самостоятельного смыслового значения, истинный смысл которого проясняется с помощью другого, синонимичного или ассоциативного термина (группы терминов), находящегося в том же предложении, что и контекстное понятие, или в предыдущих предложениях. Идентификация по критерию комбинации контекстных терминов второго типа позволяет идентифицировать контекстно-обобщенные понятия. Контекстно-обобщенные понятия - это однословные или многословные термины, один из которых является обобщающим словом, а другие - обобщенными словами, - при этом термин, являющийся обобщающим словом, включает в себя лексическое значение ряда однородных членов (обобщенных слов) и отвечающих на тот же вопрос, что и однородные члены. Идентификация по критерию комбинации контекстных терминов третьего типа позволяет идентифицировать контекстные ссылки. Контекстные ссылки - это многословный термин, не имеющий самостоятельного смыслового значения, который явно или неявно ссылается на другие предложения, в которых содержатся смысловое значение данного термина. При этом явной контекстной ссылкой считается ссылка, в которой указано точное местонахождение смыслового значения (например - требования, указанные в Статье 12 п. 2 Закона РФ от 07.02.1992 г. N 2300-1 «О защите прав потребителей» - «Продавец (исполнитель), не предоставивший покупателю полной и достоверной информации о товаре (работе, услуге), несет ответственность, предусмотренную пунктами 1-4 статьи 18 или пунктом 1 статьи 29 настоящего Закона, за недостатки товара (работы, услуги), возникшие после его передачи потребителю вследствие отсутствия у него такой информации.»). Если в контекстной ссылке нет точного указания места нахождения смыслового значения, то такая ссылка является неявной контекстной ссылкой, причем «степень неявности» неявной контекстной ссылки является величиной обратно пропорциональной величине «степени точности» указания на место нахождения смыслового значения. Примером неявной контекстной ссылки, обладающей «максимальной степенью неявности» может служить контекстная ссылка вида «указанные требования». В результате идентификации контекстных терминов выявляются, собственно, контекстные термины и термины, проясняющие их смысловое значение. Между контекстными терминами и терминами, проясняющими их смысловое значение, регистрируется контекстная связь, которая является причиной формирования соответствующих записей в базе данных контекстных терминов. На основании информации, содержащейся в базе данных контекстных терминов, становится возможным осуществление специальных преобразований (лингвистических и иных преобразований) над предложениями, содержащими контекстные термины, с целью обеспечения ясности и однозначности понимания контекстных терминов. Контекстные термины, идентифицированные в предложениях, при этом не обязательно удаляются из предложений и могут остаться в них, но при этом их смысловое значение будет ясным и однозначным, т.к. это значение будет прояснено в соответствующих контекстных справочниках (справочнике контекстных понятий, справочнике контекстно-обобщенных понятий, справочнике контекстных ссылок).Also, the
Также способ 100 преобразования структурированного исходного массива данных характеризуется выполнением этапа 103 идентификации элементов исходной структуры данных, на котором, используя информацию, содержащуюся в упомянутой сформированной базе данных контекстных терминов, в упомянутой исходной структуре данных идентифицируют структурно-сложные языковые конструкции, содержащие контекстные термины, структурно-сложные языковые конструкции, не содержащие контекстные термины, структурно-простые языковые конструкции, содержащие контекстные термины и структурно-простые языковые конструкции, не содержащие контекстные термины. На основании информации, содержащейся в базе данных контекстных терминов, идентифицируются исходные элементы исходной структуры данных структурированного исходного массива данных. На данном этапе, осуществляется однозначная идентификация исходных элементов и их группировка по признакам наличия или отсутствия в них контекстных терминов и типу исходного элемента. Таким образом, однозначно идентифицируются структурно-сложные языковые конструкции, содержащие контекстные термины, структурно-сложные языковые конструкции, не содержащие контекстные термины, структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины.Also, the
Также способ 100 преобразования структурированного исходного массива данных характеризуется выполнением этапа 104 преобразования первого типа, на котором осуществляют преобразование первого типа над упомянутыми структурно-сложными языковыми конструкциями, не содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины. Структурно-сложные языковые конструкции, не содержащие контекстные термины, подвергаются преобразованиям с целью преобразования рубрик перечисления в предложения. В процессе таких преобразований осуществляется преобразование структурно-сложных языковых конструкций, не содержащих контекстные термины, в структурно-простые языковые конструкции, являющиеся предложениями в обычном понимании этого термина. Данное преобразование носит изначально форматный характер, т.е. неформатный текст структурно-сложной языковой конструкции преобразуется в форматный, т.е. соответствующий грамматическому понятию предложения. Для устранения грамматических и орфографических ошибок, связанных с преобразованием структурно-сложных языковых конструкций, не содержащих контекстные термины, в структурно-простые языковые конструкции, осуществляются лингвистические преобразования. Лингвистические преобразования над созданными структурно-простыми языковыми конструкциями связаны с восстановлением правильной грамматики и орфографии. Под указанными лингвистическими преобразованиями понимается: а) согласование родов, чисел, падежей; б) правка (замена и удаление) несоответствующих знаков препинания. Все вышеуказанные преобразования, производимые над структурно-сложными языковыми конструкциями, не содержащими контекстные термины, являются преобразованиями первого типа.Also, the
Также способ 100 преобразования структурированного исходного массива данных характеризуется выполнением этапа 105 преобразования второго типа, на котором осуществляют преобразование второго типа над упомянутыми структурно-простыми языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины. Структурно-простые языковые конструкции, содержащие контекстные термины, подвергаются преобразованиям с целью структурирования и прояснения смыслового содержания контекстных терминов. В процессе таких преобразований осуществляется преобразование структурно-простых языковых конструкций, содержащих контекстные термины, в грамматически и орфографически верные структурно-простые языковые конструкции, не содержащие контекстные термины. Данное преобразование носит структурно-лингвистический характер, т.е. оно связано с фактической заменой или удалением из текста структурно-простой языковой конструкции, содержащей контекстные термины, всех или части контекстных терминов и фактической заменой удаленных терминов другими терминами, которые являются смысловым содержанием контекстных терминов. Кроме этого упомянутое преобразование может быть связано с дополнением текста структурно-простой языковой конструкции, содержащей контекстные термины, формированием новой записи в соответствующем контекстном справочнике. Для каждого типа контекстных терминов применяется свой тип преобразования. Так для контекстных понятий применяется первое преобразование второго типа, для контекстно-обобщенных понятий - второе преобразование второго типа, для контекстных ссылок - третье преобразование второго типа. По результатам преобразований контекстных терминов осуществляется лингвистическое преобразование для устранения грамматических и орфографических ошибок, связанных с преобразованием структурно-простых языковых конструкций, содержащих контекстные термины, в структурно-простые языковые конструкции, не содержащие контекстных терминов. Лингвистические преобразования над созданными структурно-простыми языковыми конструкциями, не содержащими контекстные термины, связаны с восстановлением правильной грамматики и орфографии. Под указанными лингвистическими преобразованиями понимается: а) согласование родов, чисел, падежей; б) правка (замена и удаление) несоответствующих знаков препинания. Все вышеуказанные преобразования являются преобразованиями второго типа. Первые преобразования второго типа осуществляются над контекстными понятиями и выявленными терминами, проясняющими смысловое значение контекстных понятий. Указанные выявленные термины могут являться либо контекстными синонимами, либо контекстными ассоциациями. Контекстный синоним - это синоним, который может употребляться как синоним только в данном контексте. Например, в предложении: «Изготовитель - это организация независимо от ее организационно-правовой формы», - контекстный термин «ее» является, собственно, контекстным понятием, а выявленный термин «организация» является его контекстным синонимом. Первое преобразование второго типа обеспечивает формирование справочника контекстных понятий, который, в свою очередь, обеспечивает ясность смыслового значения контекстных понятий. Также за счет первого преобразования второго типа обеспечивается лингвистическая корректировка текста путем замещения контекстных понятий контекстным синонимом или контекстной ассоциацией. Например, предложение: «Изготовитель - это организация независимо от ее организационно-правовой формы», - посредством осуществления над ним первого преобразования второго типа будет преобразовано в предложение: «Изготовитель - это организация независимо от организационно-правовой формы организации». Контекстные ассоциации отличаются от контекстных синонимов тем, что они, как правило, представляют собой более сложную текстовую конструкцию, состоят из нескольких терминов и редко встречаются в одном предложении с контекстным понятием, но чаще в других предложениях. Вторые преобразования второго типа осуществляются над контекстно-обобщенными понятиями. При этом под контекстно-обобщенными понятиями понимают обобщающее слово (обобщающий термин) и однородные слова (однородные термины), а также группу однородных слов (группу слов без обобщающего слова). Обобщающее слово - это слово или словосочетание, которое является общим для расположенных вблизи обобщающего слова однородных слов или словосочетаний. При этом однородными словами (словосочетаниями) в контексте настоящего изобретения называются такие члены предложения, которые зависят от одного и того же слова и отвечают на один и тот же вопрос (т.е. являются однородными членами предложения). При этом обобщающее слово является тем же типом членов предложения, что и однородные с ним слова или словосочетания. Значительная часть предложений, осложненных однородными членами, может быть представлена как результат «сочинительного сокращения» ряда самостоятельных предложений. Второе преобразование второго типа обеспечивает удаление всех однородных с обобщающим словом терминов из анализируемого предложения, за счет чего в предложении остается только тот термин, который является обобщающим термином. При этом формируется справочник контекстно-обобщенных понятий, который содержит выявленный обобщающий термин и все соответствующие ему однородные слова - обобщенные слова (обобщенные понятия). Помимо этого, второе преобразование второго типа обеспечивает лингвистическую корректировку предложения путем создания новых предложений, в которых используются обобщенные понятия вместо обобщающего термина. Например, в предложении: «Исполнитель - это организация, выполняющая работы или оказывающая услуги потребителям по возмездному договору», - присутствуют однородные слова (однородные термины) - термин «выполняющая работы» и термин «оказывающая услуги». В данном примере, за счет второго преобразования второго типа обеспечится формирование записи в справочнике контекстно-обобщенных понятий, содержащей указание на то, что термин «выполняющая работы» является обобщающим термином, и термин «оказывающая услуги» является «обобщенным понятием». При этом из предложения будет удалено обобщенное понятие, т.е. термин «оказывающая услуги». Таким образом, преобразуемое предложение будет упрощено и преобразовано в предложение: «Исполнитель - это организация, выполняющая работы потребителям по возмездному договору». Посредством второго преобразования второго типа формируется дополнительное предложение, в котором вместо термина «выполняющая работы» присутствует термин «оказывающая услуги». Таким образом, вместо одного предложения с контекстно-обобщенными терминами формируется два предложения без контекстных терминов, а именно - предложение «Исполнитель - это организация, выполняющая работы потребителям по возмездному договору» и предложение «Исполнитель - это организация, оказывающая услуги потребителям по возмездному договору». Третье преобразование второго типа осуществляется над контекстными ссылками. Методологически третье преобразование второго типа аналогично первому преобразованию второго типа, осуществляемому над контекстными понятиями. Однако при этом, смысловое значение контекстной ссылки определяется иным образом. Принципиальная разница между первым преобразованием второго типа и третьим преобразованием второго типа заключается в том, что в предложении, в котором содержится контекстная ссылка, как правило, очевидно, что именно является предметом контекстной ссылки. Например, для предложения с неявной контекстной ссылкой - «указанные требования», - очевидно, что предметом контекстной ссылки являются, некоторые «требования». При этом зачастую предложения содержат и более подробную информацию о предмете контекстной ссылки (смысловом значении). Посредством третьего преобразования второго типа, как и в случае с первым преобразованием второго типа, обеспечивается формирование справочника контекстных ссылок, который позволяет уяснить смысловое значение контекстной ссылки. Однако в отличие от первого преобразования второго типа посредством третьего преобразования второго типа не может быть осуществлена лингвистическая корректировка предложения путем замещения контекстной ссылки ее смысловым значением главным образом по причине того, что смысловое значение по объему символов существенно превышает контекстную ссылку.Also, the
Также способ 100 преобразования структурированного исходного массива данных характеризуется выполнением этапа 106 преобразования третьего типа, на котором осуществляют преобразование третьего типа над упомянутыми структурно-сложными языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины. Преобразование третьего типа - это совокупность преобразований первого типа и преобразований второго типа, применяемая к структурно-сложным языковым конструкциям, содержащим контекстные термины. Преобразование третьего типа при этом является двухэтапным преобразованием. На первом этапе над структурно-сложными языковыми конструкциями, содержащими контекстные термины, осуществляется преобразование первого типа, за счет которого осуществляется преобразование структурно-сложной языковой конструкции, содержащей контекстные термины, в структурно-простую языковую конструкцию, содержащую контекстные термины. На втором этапе над структурно-простыми языковыми конструкциями, содержащими контекстные термины, осуществляется соответствующее преобразование второго типа. В результате двухэтапного преобразования структурно-сложные языковые конструкции, содержащие контекстные термины, преобразуются в грамматически и орфографически верные структурно-простые языковые конструкции, не содержащие контекстные термины.Also, the
Также способ 100 преобразования структурированного исходного массива данных характеризуется выполнением этапа 107 формирования итоговой структуры данных структурированного исходного массива данных, на котором формируют итоговую структуру данных структурированного исходного массива данных, содержащую элементы итоговой структуры данных, причем элементы итоговой структуры данных представляют собой структурно-простые языковые конструкции, не содержащие контекстные термины, и полученные за счет преобразований первого, второго и третьего типов грамматически и орфографически верные структурно-простые языковые конструкции, не содержащие контекстные термины. Итоговая структура данных формируется из: структурно-простых языковых конструкций, не содержащих контекстные термины; структурно-простых языковых конструкций, не содержащих контекстные термины, полученных путем преобразования структурно-сложных языковых конструкций, не содержащих контекстные термины; структурно-простых языковых конструкций, не содержащих контекстные термины, полученных путем преобразования структурно-простых языковых конструкций, содержащих контекстные термины; структурно-простых языковых конструкций, не содержащих контекстные термины, полученных путем преобразования структурно-сложных языковых конструкций, содержащих контекстные термины. Фактически итоговая структура данных состоит из элементов - грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины, которые с лингвистической точки зрения являются предложениями, не содержащими контекстные термины.Also, the
На фиг. 2 в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 200 преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке. Заявленный способ 200 преобразования структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке, в отличие от способа 100 преобразования структурированного исходного массива данных, дополнительно характеризуется выполнением этапа 201 формирования первой структуры данных, на котором на основании полученной на этапе 107 формирования итоговой структуры данных структурированного исходного массива данных формируют первую структуру данных структурированного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных, представляющие собой элементы итоговой структуры данных структурированного исходного массива данных, содержат первые логические разделы и вторые логические разделы; выполнением этапа 202 формирования базы данных логических связей логических разделов, на котором формируют базу данных логических связей логических разделов упомянутых элементов первой структуры данных; выполнением этапа 203 формирования второй структуры данных, на котором формируют вторую структуру данных структурированного массива данных, содержащую элементы упомянутой второй структуры данных, причем упомянутые элементы второй структуры данных содержат логические конструкции логических разделов упомянутых элементов первой структуры данных, сформированные с использованием информации из упомянутой базы данных логических связей логических разделов, причем упомянутые логические разделы содержат первые семантические части и вторые семантические части; выполнением этапа 204 формирования базы данных семантических частей логических разделов, на котором формируют базу данных семантических частей логических разделов из упомянутых вторых семантических частей, причем упомянутые вторые семантические части исключаются из соответствующих упомянутых логических разделов; выполнением этапа 205 формирования грамматически и орфографически верных семантических частей, на котором формируют грамматически и орфографически верные семантические части упомянутых логических разделов путем лингвистических преобразований над упомянутыми семантическими частями; и выполнением этапа 206 формирования результирующей структуры данных, на котором формируют результирующую структуру данных структурированного массива данных, содержащую элементы упомянутой результирующей структуры данных, причем упомянутые элементы результирующей структуры данных содержат логические конструкции, содержащие, по меньшей мере, упомянутые грамматически и орфографически верные семантические части логических разделов.In FIG. 2 as an example, but not limitation, depicts a General diagram of the steps of the claimed
На фиг. 3 в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 201 формирования первой структуры данных. Этап 201 характеризуется выполнением этапа 2011 идентификации исходной структуры, на котором идентифицируют итоговую структуру данных 1 структурированного массива данных; выполнением этапа 2012 идентификации элементов, на котором идентифицируют элементы 11 итоговой структуры данных 1; выполнением этапа 2013 идентификации логических разделов, на котором идентифицируют первые логические разделы 111 элементов 11 итоговой структуры данных 1 и вторые логические разделы 112 элементов 11 итоговой структуры данных 1; и выполнением этапа 2013 формирования первой структуры данных, на котором формируют первую структуру данных 2 структурированного исходного массива данных, содержащую элементы 21 первой структуры данных, которые являются элементами 11 итоговой структуры данных 1, причем элементы 21 первой структуры данных 2 содержат первые логические разделы 111 элементов 11 итоговой структуры данных 1, и содержащую элементы 22 первой структуры данных, причем элементы 22 первой структуры данных 2 содержат вторые логические разделы 112, элементов 11 итоговой структуры данных 1.In FIG. 3, by way of example, but not limitation, a general flowchart of the steps of
На фиг. 4 в качестве примера, но не ограничения, изображена общая структура итоговой структуры данных 1, из которой формируется первая структура данных 2. Итоговая структура данных 1 представляет собой полученную на этапе 107 итоговую структуру данных, которая, в свою очередь, представляет собой структуру данных структурированного исходного массива данных, содержащего, по меньшей мере, текст на естественном языке. Как уже упоминалось выше, такой массив данных может представлять собой, в частности, нормативный правовой акт (НПА). Итоговая структура данных 1 содержит элементы 11, которые представляют собой положения, являющиеся предложениями - грамматически организованными соединениями слов. При этом каждое предложение характеризуется смысловой законченностью, т.к. является элементом итоговой структуры данных, полученной на этапе 107. Идентификация предложений на этапе 2012 идентификации элементов производится путем выявления в тексте на естественном языке признаков окончания предложения. Признаками окончания предложения при этом являются: точка, точка с запятой, многоточие и т.п. Идентификация предложений осуществляется в совокупности с выявлением признаков начала предложения. Признаками начала предложения являются: заглавная буква, цифра, цифра с закрывающей скобкой, цифра с точкой и т.п. При этом при идентификации также учитывается наличие определенных сочетаний знаков препинаний, а именно знаков пунктуации - точки, запятой, скобки, двоеточия и т.п., - словоразделителей, а именно - пробела и т.п., - и типографики - абзаца, номера, градуса и т.п. На этапе 2012 идентификации элементов осуществляется выявление элементарных смысловых единиц - предложений, являющихся суждениями. Простое суждение - это суждение, никакая часть которого не является суждением. Языковой формой выражения суждения являются повествовательные предложения. Идентификация элементов 11 итоговой структуры данных 1 осуществляется путем выявления и дефрагментации предложения на первичные составляющие предложения, а именно - на слова, частицы, союзы, предлоги и т.п., и знаки препинания. После чего из первичных элементов формируются понятия, выраженные в отдельных словах и/или словосочетаниях на основании различных справочников и словарей. Затем из сформированных понятий формируются простые суждения, которые представляют собой группы взаимосвязанных понятий, при этом взаимосвязанность понятий определяется на основании синтаксических или иных связей между понятиями. Для формирования простых суждений осуществляется лингвистическо-семантический анализ элементов 11 итоговой структуры данных 1, посредством чего в элементах 11 осуществляется выявление структурных элементов простых суждений. Под структурными элементами простых суждений понимаются субъект суждения, предикат суждения, связка и кванторное слово. Субъектом суждения (S) является понятие, выражающее предмет суждения, т.е. то, о чем говорится в данном суждении. Предикатом суждения (Р) является понятие, выражающее ту или иную информацию о предмете суждения. Субъект суждения и предикат суждения - основные структурные элементы суждения, являющиеся терминами суждения. Связь между субъектом суждения и предикатом суждения, отражающая реальные отношения между мыслимыми в понятиях объектами, раскрывается посредством логической связки. В русском языке связка выражается словами: «есть» («не есть»), «является» («не является»), «имеется» («не имеется») и т.д., обозначается тире, двоеточием, а также может подразумеваться, выражаясь согласованием слов («Идет дождь», «Собака лает»). Связка - это логическая постоянная, поскольку в ней заключено неизменное содержание - она всякий раз служит показателем наличия или отсутствия чего-либо у предмета мысли. Кванторное слово (например, «каждый», «все», «ни один», «некоторый» и т.д.) указывает, относится ли информация о предикате суждения ко всему объему понятия, выражающему субъект суждения, или к его части. Например, в суждении «Всякое преступление - противоправное деяние» субъектом суждения является понятие «преступление», предикатом суждения - «противоправное деяние», - связка выражена знаком тире, а кванторное слово «всякое» указывает, на то, что характеристика «противоправное деяние» относится ко всему объему (к каждому элементу) понятия «преступление». В самом общем виде простое суждение можно выразить формулой: «S есть (не есть) Р». Таким образом, в результате идентификации итоговой структуры данных 1 элементы 11 разделяются на то количество суждений, которое в них заложено, т.е. число суждений равно количеству логических разделов в предложении. Далее осуществляется идентификация первых логических разделов 111 и вторых логических разделов 112 элементов 11 итоговой структуры данных 1. Идентификация осуществляется на основании результатов идентификации выявленных суждений, определенных как сложные суждения. Сложные суждения - это группа простых суждений, в которых присутствует связь между отдельными суждениями, установленная с помощью логических союзов «и», «или», «если…, то…», «тогда и только тогда…, когда», «неверно, что…». Виды связей между отдельными суждениями выражаются соответствующими логическими связками и приведены в Таблице 1.In FIG. 4, by way of example, but not limitation, the general structure of the
Характер связи определяется смыслом логических союзов, который состоит в ответе на вопрос: «При каких условиях сложное суждение будет истинно, а при каких - ложно?». Иначе говоря - при каких сочетаниях истинности и ложности простых суждений, из которых состоит сложное суждение, логический союз определяет истинную связь, а при каких - ложную. Суждение рассматривается как истинное, если даваемое им описание соответствует действительности (реальной ситуации), и как ложное, если не соответствует ей. «Истина» и «ложь» называются истинностными значениями суждения и являются основной логической характеристикой суждений. Смысл логических союзов можно определить с помощью истинностной таблицы (Таблица 2), в которой в столбцах 1 и 2 содержатся все возможные комбинации истинностных значений простых суждений, а в столбцах 3-9 содержатся значения сложного суждения, образованного из простых суждений с помощью соответствующего логического союза. При этом исходные простые суждения обозначают буквами «А», «В», а значения истинности символами: «и» - истинно, «л» - ложно.The nature of the connection is determined by the meaning of logical alliances, which consists in answering the question: “Under what conditions will a complex judgment be true, and under which it will be false?” In other words, under what combinations of truth and falsity of simple judgments that make up a complex proposition, a logical union determines the true connection, and in which - the false one. A judgment is considered true if the description it gives is true (a real situation), and false if it does not. “Truth” and “false” are called truth values of judgment and are the main logical characteristic of judgments. The meaning of logical alliances can be determined using the truth table (Table 2), in which
Для выявления первых логических разделов 111 и вторых логических разделов 112 элементов 11 упомянутой итоговой структуры данных 1 необходимо в предложениях текста выявить простые суждения, имеющие между собой импликативную (условную) логическую связь и взаимную (двойную) импликативную (условную) связь. Условное суждение (импликативное суждение) - это сложное суждение, в котором простые суждения объединяются логическим союзом «если…, то…». Например: «Если гражданин нарушает закон, то это порождает ответственность за нарушение» или «Если число делится на 2 без остатка, то оно четное». Условное суждение состоит из двух составляющих его видов суждений. Суждение, записанное после слова «если» называется основанием (предыдущим). Суждение, записанное после слова «то» называется следствием (последующим). Формула условного суждения может быть представлена как «А→В», где А - основание, В - следствие. При этом основания и следствия сами по себе могут быть как простыми суждениями, так и сложными суждениями. Образованное из предыдущего и последующего суждений условное суждение, прежде всего, подразумевает, что не может быть так, чтобы то, о чем говорится в основании, имело место, а то, о чем говорится в следствии - отсутствовало. Иными словами, если основание будет истинным, а следствие - ложным, то такое условное суждение будет ложным. Это условие определяет то, что условное суждение истинно во всех случаях, кроме одного: когда предшествующее есть, а последующего нет, т.е. - суждение по формуле «А→В» - ложно только в одном случае, когда А - истинно, а В - ложно (см. таблицу 2, столбец 6). В форме условных суждений могут быть выражены как объективные зависимости одних объектов от других, так и права и обязанности субъектов правоотношений, связанные с теми или иными условиями. Эквивалентное суждение (двойная импликация) - это сложное суждение, в котором объединяются суждения с взаимной условной зависимостью. Эквивалентные суждения образуются с помощью логического союза «если и только если…, то…», который обозначается символом «↔». Формула эквивалентности: «А↔В», где А, В - суждения, из которых образуется эквивалентное суждение, например: «Человек имеет право на пенсию по возрасту, если и только если он достиг пенсионного возраста». В естественном языке, в том числе, в экономических и юридических текстах, для выражения эквивалентных суждений используются грамматические союзы: «лишь при условии, что…, то…», «только тогда, когда…, то…», «в том и только в том случае, когда…, тогда…». Условия истинности эквивалентных суждений представлены в столбце 7 таблицы 2. Эквивалентное суждение истинно в двух случаях -когда оба составляющих его суждения истинны или, когда оба ложны. Иными словами, связь между элементами эквивалентного суждения можно охарактеризовать как необходимую: «истинность А достаточна для признания истинности В и наоборот» и «ложность А служит показателем ложности В и наоборот». По причине того, что в двойных импликативных суждениях отсутствуют четко выраженные основания и следствия, главным фактором в идентификации первых и вторых логических разделов 111, 112 является наличие в суждениях, находящихся во взаимной импликативной зависимости признаков юридического факта. На примере упомянутого импликативного суждения «Человек имеет право на пенсию по возрасту, если и только если он достиг пенсионного возраста» можно установить, что суждение «Человек имеет право на пенсию по возрасту» не содержит таких признаков, а суждение «если и только если он достиг пенсионного возраста» имеет признак юридического факта, которым является событие - «достижение пенсионного возраста». Таким образом, именно суждение, содержащее признаки юридического факта признается для целей идентификации основанием (А). Другое суждение признается следствием (В). Термин «юридический факт» означает определенное жизненное обстоятельство, с которым норма права связывает возникновение, изменение или прекращение правоотношения или правоотношений. Если предложение содержит одно простое суждение (или несколько простых суждений) или одно сложное суждение (или несколько сложных суждений), которое не идентифицировано как условное суждение, то в результате лингвистическо-семантического анализа текста, «окружающего» такое предложение, может быть выявлен фактический контекстный вид данного простого суждения - первый логический раздел 111 или второй логический раздел 112. Формируемая на этапе 201 первая структура данных 2 содержит такие элементы, как предложения (элемент 11 исходной структуры данных 1) и суждения (логические разделы 111 или 112 элементов 11 исходной структуры данных 1). При этом суждения дополнительно идентифицированы по упомянутой логической связи как основания, т.е. как первый логический раздел 111 элемента исходной структуры данных 11, имеющий логическую связь 1-го типа и являющийся суждением «А», и как следствия, т.е. как второй логический раздел 112 элемента 11 исходной структуры данных 1, имеющий логическую связь 1-го типа и являющийся суждением «В». В первой структуре данных 2 все элементы исходной структуры данных 1 сепарированы по признаку наличия в них упомянутых первых логических разделов 111 или вторых логических разделов 112 исходной структуры данных 1, за счет чего сформированы элементы 21 первой структуры данных 2, имеющие первые логические разделы 111 и элементы 22 первой структуры данных 2, имеющие вторые логические разделы 112.In order to identify the first
На фиг. 5 в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 202 формирования базы данных 3 логических связей логических разделов. Этап 202 формирования базы данных 3 логических связей логических разделов характеризуется выполнением этапа 2021 идентификации элементов первой структуры данных 2, на котором идентифицируют элементы 21 первой структуры данных 2, содержащие один упомянутый первый логический раздел 111, представляющие собой элементы 31 первой структуры данных 2, и элементы 22 первой структуры данных 2, содержащие один упомянутый второй логический раздел 112, представляющие собой элементы 32 первой структуры данных 2; выполнением этапа 2022 идентификации элементов первой структуры данных 2, на котором идентифицируют элементы 21 первой структуры данных, содержащие более одного упомянутого первого логического раздела 111, представляющие собой элементы 33 первой структуры данных 2 и элементы 22 первой структуры данных, содержащие более одного упомянутого второго логического раздела, представляющие собой элементы 34 первой структуры данных 2; выполнением этапа 2023 идентификации логических связей, на котором среди элементов 33 первой структуры данных 2, содержащих более одного упомянутого первого логического раздела 111, и элементов 34 первой структуры данных 2, содержащих более одного упомянутого второго логического раздела 112, идентифицируют логические связи между упомянутыми первыми логическими разделами 111 или логические связи между упомянутыми вторыми логическими разделами 112; выполнением этапа 2024 идентификации отсутствия логических связей, на котором среди элементов 33 первой структуры данных 2, содержащих более одного упомянутого первого логического раздела 111, и среди элементов 34 первой структуры данных 2, содержащих более одного упомянутого второго логического раздела 112, идентифицируют элементы 35 первой структуры данных *, не имеющие логических связей между своими логическими разделами; и выполнением этапа 2025 формирования базы данных, на котором формируют базу данных 3 логических связей логических разделов элементов первой структуры данных. Для уточнения всех дополнительных (не только импликагивных) имеющихся логических связей между логическими разделами (суждениями) все элементы первой структуры данных 2, а именно массивы элементов 21 предложений, содержащих первые логические разделы 111 и элементов 22 предложений, содержащих вторые логические разделы 112 необходимо сепарировать на группы элементов 31, 33 и 32, 34, содержащих либо только первые логические разделы 111, либо только вторые логические разделы 112, соответственно. При этом каждый элемент, входящий в массивы элементов 31, 33, содержащий первый логический раздел 111 идентифицируется как элемент 31, имеющий только один логический раздел 111, или как элемент 33, имеющий более одного логического раздела 111. При этом в случае наличия в идентифицированных элементах 31, 33 вторых логических разделов 112, вторые логические разделы 112 удаляются из идентифицированных элементов 31, 33, Полученные в итоге массивы элементов 31, 33 по-прежнему связаны с тем элементом, из которого они выделены и по этому основанию идентифицированы как отдельные элементы данного массива элементов. В свою очередь, каждый элемент, входящий в массивы элементов 32, 34, содержащий второй логический раздел 112 идентифицируется как элемент 32, имеющий только один логический раздел 112, или как элемент 34, имеющий более одного логического раздела 112. При этом в случае наличия в идентифицированных элементах 32, 34 первых логических разделов 111, первые логические разделы 111 удаляются из идентифицированных элементов 32, 34. Полученные в итоге массивы элементов 32, 34 так же по-прежнему связаны с тем элементом, из которого они выделены и по этому основанию идентифицированы как отдельные элементы данного массива элементов. Далее устанавливается характер логических связей между однотипными суждениями в элементах двух созданных массивов элементов 31, 33 и элементов 32, 34. В однотипных элементах массивов элементов 33, 34 выявляются логические связи между суждениями, указанные в таблицах 1 и 2, а именно - соединительные связи (конъюнкция), разделительные связи (дизъюнкция, строгая дизъюнкция), эквивалентные связи (эквиваленция). Конъюнктивное (соединительное) суждение - это сложное суждение, образованное из исходных суждений посредством логического союза «и», обозначаемого символом «^». Например, суждение: «Сегодня я пойду на лекцию по логике и в кино», -является «конъюнктивным суждением», состоящим из двух простых суждений (обозначим их А и В, соответственно) - «Сегодня я пойду на лекцию по логике» (А), «Сегодня я пойду в кино» (В). Данное сложное суждение можно представить формулой: «А^B», где А, В - элементы конъюнкции; «^» - символ логического союза - конъюнкция. В русском языке конъюнктивный логический союз выражается многими грамматическими союзами: «и», «а», «но», «да», «хотя», «однако», «а также…». Нередко подобные грамматические союзы заменяются знаками препинания - запятой, двоеточием, точкой с запятой. Дизъюнктивное (разделительное) суждение - это сложное суждение, образованное из «исходных» суждений посредством логического союза «или», обозначаемого символом «V». Например, суждение: «Право может способствовать экономическому развитию или препятствовать ему», - является дизъюнктивным суждением, состоящим из двух простых суждений: «Право может способствовать экономическому развитию» и «Право может препятствовать экономическому развитию». Соответственно, обозначив их через буквы А, В, такое суждение можно представить через формулу: «А V В». Поскольку связка «или» употребляется в двух разных значениях - неисключающем и исключающем, то различают слабую и сильную (строгую) дизъюнкции. Слабая дизъюнкция является истинной в тех случаях, когда истинно, по крайней мере, одно из составляющих ее суждений (или оба вместе) и ложна, когда оба составляющих ее суждения ложны (см. таблицу 2, столбец 4). Сильная дизъюнкция (символ «VV») отличается от слабой дизъюнкции тем, что ее составляющие исключают друг друга. Например, «Преступление может быть умышленным или по неосторожности». Для того, чтобы подчеркнуть строго разделительный, исключающий характер связи, в естественном языке используется усиленная двойная форма разделения: «…либо…, либо…», «…или…, или…», например: «Либо я найду путь, либо я проложу его». Строгая дизъюнкция истинна лишь тогда, когда одно из составляющих ее суждений истинно, а другое - ложно (см. таблицу 2, столбец 5). В результате выявляются все логические связи между элементами (суждениями) массивов элементов 33, 34. При этом допускается, что часть элементов данных массивов может не иметь логических связей друг с другом. Далее для уточнения вида суждений, которые не были до сих пор идентифицированы как сложные суждения, элементы массивов элементов должны быть подвергнуты идентификации на их соответствие отрицаемому суждению. Этому анализу должны быть подвергнуты массивы элементов 31, 32 и, частично, массивы элементов 33, 34, в которых остались суждения, не имеющие логических связей с другими суждениями. Отрицаемое суждение - это сложное суждение, образованное с помощью логического союза «неверно, что…» (или просто «не»), который, как правило, представлен знаком отрицания (символ «~»). В отличие от упомянутых выше бинарных союзов, такой союз относится к одному суждению. Прибавление этого союза к какому-либо суждению означает образование нового суждения, которое находится в определенной зависимости от исходного суждения - отрицаемое суждение истинно, если исходное суждение ложно, и наоборот (см. таблицу 2, столбцы 8, 9). Например, если исходное суждение: «Все свидетели правдивы», - то отрицаемое: «Неверно, что все свидетели правдивы». Если отдельный логический раздел (простое суждение) остается не идентифицированным с точки зрения логического характера суждения, то в результате лингвистическо-семантического анализа текста, окружающего предложения, в котором содержится такой раздел, может быть выявлен фактический контекстный вид данного простого суждения. Таким образом, первая структура данных содержит логические разделы предложений, формирующих исходную структуру данных. По итогам идентификации всех элементов первой структуры данных выявляются все логические разделы предложений (суждения), с точки зрения их наличия и характера связей суждений, формирующих сложные суждения. На основании выявленных характеров связей суждений (в том числе, их отсутствия) формируется база данных 3 логических связей логических разделов (фиг. 6).In FIG. 5, by way of example, but not limitation, a general flowchart of the steps of
На фиг. 7 в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 203 формирования второй структуры данных 4. Этап 203 формирования второй структуры данных 4 характеризуется выполнением этапа 2031 формирования логических конструкций, на котором формируют логические конструкции 41 логических разделов 111, 112 элементов 31, 32, 33, 34 первой структуры данных 2, используя информацию из базы данных 3 логических связей логических разделов элементов 31, 32, 33, 34 первой структуры данных 2 и логические разделы упомянутых элементов 31 первой структуры данных 2, содержащих один упомянутый первый логический раздел 111, и логические разделы упомянутых элементов 32 первой структуры данных 2, содержащих один упомянутый второй логический раздел 112; и выполнением этапа 2032 формирования второй структуры данных 4, на котором формируют вторую структуру данных 4, содержащую элементы 41 второй структуры данных 4, причем упомянутые элементы второй структуры данных 4 представляют собой сформированные логические конструкции 41 логических разделов 111, 112 элементов 31, 32, 33, 34 первой структуры данных 2. Логические конструкции 41 - это результат преобразования данных преобразуемого структурированного массива данных. Логические конструкции 41 формируются в соответствии со спецификой преобразуемого текста на естественном языке, в частности НПА. Специфика НПА состоит в том, что он содержит нормы права (правовые нормы). Также специфика НПА состоит в том, что в теории нормы права существуют понятия логической нормы права и юридической нормы права. Эти понятия не тождественны. Разница заключается в том, что логическая норма права включает в себя содержание всех элементов нормы права, установленных в юридической науке, включая гипотезу, диспозицию и санкцию, а юридическая норма права отражает конкретные нормативные предписания, содержащиеся в конкретных предложениях конкретных НПА. Фактически разница состоит в том, что одна конкретная логическая норма права может содержаться в конкретном множестве юридических норм права, т.е. в множестве нормативных предписаний. Логическая конструкция - это основа (каркас) основного нормативного предписания, содержащая два основных элемента конструкции, - «ситуацию» и «правило». Основное нормативное предписание (далее - нормативное предписание) является инструментом правового регулирования и включает в себя регулятивные и охранительные нормативные предписания. При этом под ситуацией в нормативных предписаниях понимается любая обусловленность правила, а под правилом понимаются любые правила, включая правила (модель) поведения субъектов правоотношений. Иными словами, ситуация - это суждения, имеющие логическую импликагивную связь и являющиеся основаниями, а правила - это суждения, имеющие логическую импликагивную связь и являющиеся следствиями. При формировании логических конструкций 41, т.е. нормативных предписаний также необходимо учитывать, что каждый из элементов этой конструкции (и ситуация и правило) могут состоять как из одного суждения, так и из группы суждений. Для формирования логических конструкций необходимо использовать Базу данных логических связей логических разделов. Кроме выявленных логических связей между логическими разделами для формирования логической конструкции необходимо обратиться к правилам формирования логических конструкций. Правила формирования логических конструкций отражают требования юридической науки и юридической практики в отношении состава и структуры нормативного предписания (предписания). Например, условие того, что одно предписание не может содержать двух разных правил, приводит к тому, что в правилах устанавливается, что если в одном предложении содержатся два следствия, которые имеют логически слабую дизъюнктивную связь, то это значит, что эти суждения входят в разные правила и соответственно разные предписания. При этом если эти же два следствия имеют логически сильную дизъюнктивную связь, то это их объединяет в рамках одного сложного правила в рамках одного предписания. По существу, правила формирования логических конструкций 41 сводятся к допустимым сочетаниям логических связей между однотипными суждениями в рамках одного нормативного предписания.In FIG. 7, by way of example, but not limitation, a general flowchart is shown of the steps of
При этом если в предложении имеются несколько ситуаций, объединенных логикой «ИЛИ» (слабая дизъюнктивная связь), то это означает, что каждая из таких ситуаций формирует собственные отдельные предписания с те ми же правилами, которые использовались в первом предписании. Это означает, что несколько ситуаций с такой логикой «ИЛИ» не могут быть в одном предписании. Кроме того, в предложении имеются несколько правил, объединенных логикой «ИЛИ» (слабая дизъюнктивная связь). Это означает, что каждое из таких правил формирует собственные отдельные предписания с те ми же ситуациями, которые использовались в первом предписании. Это означает, что несколько «правил» с такой логикой «ИЛИ» не могут быть в одном предписании. Сформированная вышеуказанным образом вторая структура данных содержит такие элементы как суждения (логический раздел элемента исходной структуры данных) и нормативные предписания (логическая конструкция 41 логических разделов элемента исходной структуры данных) (фиг. 8). При этом суждения идентифицированы по наличию импликативной логической связи на как два основных логических раздела:Moreover, if a sentence contains several situations united by the logic “OR” (weak disjunctive connection), then this means that each of these situations forms its own separate prescriptions with the same rules that were used in the first prescription. This means that several situations with such “OR” logic cannot be in the same prescription. In addition, the proposal has several rules, united by the logic “OR” (weak disjunctive connection). This means that each of these rules forms its own separate prescriptions with the same situations that were used in the first prescription. This means that several “rules” with such “OR” logic cannot be in one prescription. The second data structure formed in the above manner contains such elements as judgments (logical section of the element of the original data structure) and regulatory requirements (
1) основания (первый логический раздел элемента исходной структуры данных, содержащий логическую импликативную связь, связь 1-го типа, вида А);1) foundations (the first logical section of the element of the original data structure containing a logical implicative connection, a connection of the 1st type, type A);
2) следствия (второй логический раздел элемента исходной структуры данных, содержащий логическую импликативную связь, связь 1-го типа, вида В).2) consequences (the second logical section of the element of the original data structure, containing a logical implicative connection, a connection of the 1st type, type B).
При этом основания и следствия дополнительно идентифицированы также по факту выявления иных логических связей между однотипными импликативными суждениями в рамках одного предложения как дополнительные логические разделы:In this case, the grounds and consequences are additionally identified also by the fact of identifying other logical connections between the same implicative judgments within the framework of one sentence as additional logical sections:
1) суждения «И» (логический раздел элемента исходной структуры данных, содержащий логическую конъюнктивную (соединительную) связь, связь 2-го типа);1) judgments “AND” (the logical section of the element of the original data structure containing the logical conjunctive (connecting) connection, the connection of the 2nd type);
2) суждения «ИЛИ» (логический раздел элемента исходной структуры данных, содержащий логическую слабую дизъюнктивную (разделительную) связь, связь 3-го типа);2) “OR” judgments (the logical section of the element of the original data structure containing the logical weak disjunctive (dividing) connection,
3) суждения «ИЛИ*» (логический раздел элемента исходной структуры данных, содержащий логическую сильную дизъюнктивную (разделительную) связь, связь 4-го типа).3) “OR *” judgments (a logical section of an element of the original data structure containing a logical strong disjunctive (separation) connection, a
Кроме того, вышеуказанные разделы могут быть отдельно идентифицированы как «отрицаемые суждения» (логический раздел элемента исходной структуры данных, содержащий отрицаемую логическую связь, связь 5-го типа).In addition, the above sections can be separately identified as “denied judgments” (a logical section of an element of the original data structure containing a denied logical link, a
На фиг. 9 в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 204 формирования базы данных 5 семантических частей. Этап 204 формирования базы данных 5 семантических частей характеризуется выполнением этапа 2041 идентификации логических разделов, на котором идентифицируют первые логические разделы 411 элементов 41 второй структуры данных 4 и вторые логические разделы 412 элементов второй структуры данных 4; выполнением этапа 2042 идентификации семантических частей, на котором в упомянутых первых логических разделах 411 и вторых логических разделах 412 элементов второй структуры данных 4 идентифицируют первые семантические части 4110 и вторые семантические части 4120; и выполнением этапа 2043 идентификации особых семантических частей, на котором в упомянутых первых и вторых логических разделах 411, 412 элементов 41 второй структуры данных 4 идентифицируют, по меньшей мере, особые семантические части 4111 первых логических разделов 411 элементов 41 второй структуры данных 4 и особые семантические части 4121 вторых логических разделов 412 элементов 41 второй структуры данных 4 и формируют базу данных 5 особых семантических частей логических разделов элементов 41 второй структуры данных 4 путем перемещения упомянутых особых семантических частей 4111, 4121 в упомянутую формируемую базу данных 5 особых семантических частей логических разделов элементов 41 второй структуры данных 4 (фиг. 10). Сформированные во второй структуре данных логические конструкции 41 являются каркасом и основой нормативного предписания, но по-прежнему не соответствуют ему полностью. Для достижения максимального соответствия структуры логических конструкций 41 структуре нормативного предписания необходимо провести комплексный семантический анализ логических разделов 411, 412, включающий как минимум синтаксический и логический разборы терминов и понятий, выявление взаимосвязей между понятиями суждения и между терминами сложных понятий. Целью данного семантического анализа является выявление и идентификация в логических разделах 411, 412 логических конструкций 41 второй структуры данных 4 ряда специфических частей (вторых частей) логических разделов, которые приводят к:In FIG. 9 as an example, but not limitation, depicts a General diagram of the steps of
1) смешению основных понятий правовой нормы - к смешению ситуаций и правил путем включения в суждение различных обусловленностей;1) a mixture of the basic concepts of a legal norm - to a mixture of situations and rules by including various conditions in the judgment;
2) размытию - расфокусированию смысла суждений путем включения в суждение различных качественных и количественных уточнений и детализаций.2) blurring - defocusing the meaning of judgments by including various qualitative and quantitative refinements and details into the judgment.
На данном этапе осуществляется выявление специфических частей, т.е. выявление в логических разделах 411, 412 логических конструкций 41 второй структуры данных первых и вторых семантических частей 4110, 4120 логических разделов 411, 412. Причем первые семантические части !110 формируются путем удаления из логических разделов 411, 412 вторых семантических частей 4120 (специфических частей). Первая семантическая часть 4110 логического раздела - это смысловое ядро суждения, т.е. суждение, очищенное от специфических частей. Смысловым ядром суждения являются основные элементы суждения такие, как субъект суждения, предикат суждения и связка. Особенность связки состоит в том, что связки является частью смыслового ядра суждения только тогда, когда она не может быть истолкована в «объемном плане», в случаях, когда связка раскрывает включение (или исключение) подкласса в класс объектов или принадлежность (непринадлежность) элемента классу. Например, в суждении: «Преступление есть противоправное деяние», - субъектом суждения является слово «преступление», предикатом суждения словосочетание - «противоправное деяние», а связкой - слово «есть». Вторые семантические части 4120 логического раздела - это понятия суждения, которые идентифицированы как признаки субъекта суждения, предиката суждения, а также термины суждения - связка (когда она может быть истолкована в «объемном плане») и кванторное слово, а также иные, особые части. Например, понятие (субъект суждения) «преступление, предусмотренное Уголовным Кодексом», содержит понятие - слово «преступление» и признак понятия - словосочетание «предусмотренное Уголовным Кодексом». Признаки понятия - это содержание понятия, указывающее на наличие или отсутствие у него того или иного свойства, состояния или отношения. Иначе говоря, признаком понятия является все то, в чем понятия могут быть сходны или отличны друг от друга. Все признаки понятия, образующие содержание понятий идентифицируются как существенные и несущественные по принципу утраты своего качества (невозможности быть самим собой) без данного признака. Например, в суждении: «Преступление есть противоправное деяние», - предикатом суждения является понятие «противоправное деяние» (В), являющееся сложным понятием или «отношением», в котором «деяние» является субъектом суждения (А), а понятие «противоправное» - является признаком А. На примере «отношения» «противоправное деяние» видно, что в нем находятся «понятия», у которых объем одного полностью входит в объем другого, но не исчерпывает его. Иначе говоря, все элементы объема (В) являются элементами объема (А), но не наоборот. Вид таких отношений - «подчинение», т.е. родовидовое отношение, где более общее «понятие» выступает родом, а менее общее - видом. Кванторное слово указывает, относится ли информация о предикате суждения ко всему объему понятия, выражающему субъект суждения, или к его части. Например, в суждении: «Всякое преступление есть противоправное деяние», - кванторное слово «всякое» указывает, что информация о предмете суждения (словосочетание «противоправное деяние») относится ко всему объему (к каждому элементу объема) предмета суждения - слова «преступление». Под иными, особыми частями понимаются такие отдельные понятия и группы понятий суждения, которые также уточняют значение понятий, составляющих первую семантическую часть 4110 логических разделов 41, но формально не относятся к признакам понятия, связке или кванторному слову. Например, в суждении: «Преступление (в т.ч. мошенничество, кража, убийство) есть противоправное деяние», - понятия, указанные в круглых скобках («мошенничество», «кража», «убийство») являются реальными (жизненными) примерами понятия «преступление». Признак понятия «противоправное» является существенным для понятия «деяние», поскольку без него понятие «противоправное деяние» утрачивает свое качество, перестает быть самим собой. Объем понятия - это класс (множество) мыслимых в понятии сущностей. Признаки понятия и объем понятия взаимосвязаны в рамках каждого понятия. Эта взаимосвязь позволяет установить реальный объем понятия, т.е. то, что реально подразумевается в смысловом содержании понятия. Для достижения максимального соответствия структуры логических конструкций 41 структуре нормативного предписания необходимо сепарировать виды вторых семантических частей 4120. С технической точки зрения, идентифицированные в процессе комплексного семантического анализа иные, особые части не являются элементом основного (регулятивного или охранительного) нормативного предписания. В связи с этим они удаляются из логических разделов и формируют базу данных 5 особых семантических частей, представляющую собой нормативный справочник или иной нормативный справочный материал, представляющий собой множество особых нормативных предписаний. Информация из такого справочника является доступной и актуальной, но структурно и методологически она находится за рамками основных (регулятивных и охранительных) нормативных предписаний (фиг. 10). С точки зрения юридической науки особые нормативные предписания представляют собой предписания, устанавливающие основные принципы, механизмы, порядок и цели правового регулирования общественных отношений, закрепляют правовые категории и понятия (например, дефинитивные предписания - предписания, закрепляющие в обобщенном виде признаки того или иного юридического понятия).At this stage, the identification of specific parts, i.e. the identification in
На фиг. 11 в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 205 формирования грамматически и орфографически верных семантических частей, на котором формируют грамматически и орфографически верные семантические части упомянутых логических разделов 41 путем лингвистических преобразований над упомянутыми семантическими частями. Этап 205 включает выполнение этапа 2051 идентификации уточняющих структур, на котором в упомянутых вторых семантических частях 4120 упомянутых вторых логических разделов 412 элементов 41 второй структуры данных 4 идентифицируют, по меньшей мере, уточняющие структуры вторых семантических 4122 частей вторых логических разделов 412; и выполнением этапа 2052 лингвистических преобразований, на котором осуществляют лингвистические преобразования над всеми семантическими частями, за исключением упомянутых особых семантических частей 4111, 4121 упомянутых первых и вторых логических разделов 411, 412, для формирования грамматически и орфографически верных семантических частей 4123 и уточняющих структур 4122 логических разделов элементов 41 второй структуры данных 4. Общая схема полученной второй структуры данных 4 представлена на фиг. 12. Для достижения максимального соответствия структуры логических конструкций 41 структуре нормативного предписания необходимо дополнительно идентифицировать оставшиеся виды вторых семантических частей. Дополнительная идентификация также производится в рамках комплексного семантического анализа. Предметом анализа будет являться массив значений, выявленных указанных видов вторых семантических частей 4120, т.е. массив понятий, содержащихся в логических разделах и идентифицированных в качестве соответствующих видов. Каждое понятие данных массивов должно быть идентифицировано с точки зрения его принадлежности к уточнениям 4124 или к зависимостям 4125. При этом уточнением является такая характеристика понятия, которая осуществляет переход от более широкого понятию к более узкому, а зависимости содержат признаки юридического факта, т.е. некого события, при наличие (отсутствии) которого понятие, к которому относится зависимость, актуализируется или наоборот становится неактуальным. Лингвистические преобразования над всеми семантическими частями логических разделов связаны с восстановлением правильной грамматики и орфографии отдельных семантических частей, которое потребуется в связи с фактическим разделением текста предложений на отдельные части - семантические части 4110, 4120 логических разделов, и с учетом удаления особых семантических разделов 4111, 4121 из указанного текста. Под указанными лингвистическими преобразованиями понимается, в частности, согласование родов, чисел, падежей, правка (замена и удаление) несоответствующих знаков препинания.In FIG. 11, by way of example, but not limitation, a general flowchart is shown of the steps of
На фиг. 13 в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 206 формирования итоговой структуры данных 6, на котором формируют результирующую структуру данных 6 структурированного исходного массива данных, содержащую элементы 61 упомянутой результирующей структуры данных 6, причем упомянутые элементы 61 итоговой структуры данных содержат логические конструкции 61, содержащие, по меньшей мере, упомянутые грамматически и орфографически верные семантические части 4123 логических разделов. Этап 206 характеризуется выполнением этапа 2061 формирования смысловых сочетаний, на котором формируют из первых грамматически и орфографически верных семантических частей 4123 вторых логических разделов 412 элементов 41 второй структуры данных 4 и упомянутых грамматически и орфографически верных уточняющих структур 4122 вторых семантических частей 4120 вторых логических разделов 412 элементов 41 второй структуры данных 4 смысловые сочетания 611 грамматически и орфографически верных семантических частей 4122, 4123 вторых логических разделов 412 элементов 41 второй структуры данных 4; и выполнением этапа 2062 формирования результирующей структуры данных 6, на котором формируют результирующую структуру данных 6, содержащую элементы 61 результирующей структуры данных 6, причем упомянутые элементы 61 результирующей структуры данных 6 представляют собой логические конструкции 61, содержащие упомянутые грамматически и орфографически верные семантические части 4122, 4123 логических разделов элементов 41 второй структуры данных 4. Возможна также ситуация, когда логические конструкции 61 из упомянутой результирующей структуры данных 6 дополнительно содержат упомянутые сформированные смысловые сочетания 611 грамматически и орфографически верных семантических частей 4122, 4123 вторых логических разделов 412 элементов 41 второй структуры данных 4 (фиг. 14). Итоговая общая структура элемента 61 результирующей структуры данных 6 представлена на фиг. 15. Основой нормативного предписания является юридическое правило (правило), которое может быть максимально корректно сформировано в результате проведения комплексного семантического анализа логических разделов логических конструкций. На этапе формирования логических конструкций большая часть обусловленностей была отделена от правила (второго логического раздела 412) и выделена в отдельный раздел - первый логический раздел 411. По результатам комплексного семантического анализа было выявлено смысловое ядро правила (второго логического раздела 412) и остатки обусловленностей были также выделены во вторые семантические части 4120, в которых некоторые из указанных частей идентифицированы как уточнение 4124. В результате всех преобразований стало возможным в структуре логических конструкций 61 создать смысловые сочетания 611, т.е. сочетания из первых семантических частей 4110 вторых логических разделов 412 и вторых семантических частей 4120 вторых логических разделов 412, идентифицированных как уточнение 4124. Данные смысловые сочетания являются юридическими правилами. Результирующая структура данных представляет собой структурированную конструкцию, элементы которой максимально соответствуют структуре нормативного предписания. Результирующая структура данных сформирована в таком виде с целью упрощения и регламентации профессиональной работы по созданию и корректировке НПА. Результирующая структура данных представляет собой конструкцию, которая позволяет буквально визуализировать нормативные предписания, увидеть все фактические элементы смысловой конструкции, что позволяет проводить их многосторонний полноценный анализ с целью проведения точечных корректировок, как существующих нормативных предписаний, так и проектов предписаний на разных стадиях их создания.In FIG. 13, by way of example, but not limitation, a general flowchart of the steps of
На фиг. 16 в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 300 формирования карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных. Заявленный способ 300 формирования карты связей компонентов характеризуется выполнением этапа 301 идентификации компонентов и значений, на котором идентифицируют компоненты грамматически и орфографически верных семантических частей логических разделов логических конструкций из упомянутого преобразованного структурированного исходного массива данных, причем каждая упомянутая грамматически и орфографически верная семантическая часть, содержащая упомянутые компоненты, содержит, по меньшей мере, один упомянутый компонент, причем упомянутый компонент содержит не более одного значения компонента, и формируют таблицу компонентов, содержащую, по меньшей мере, упомянутые идентифицированные компоненты и их значения; этапа 302 идентификации семантических частей, на котором идентифицируют грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащие упомянутые идентифицированные компоненты, и грамматически и орфографически верные семантические части логических разделов логических конструкций, не содержащие упомянутые идентифицированные компоненты; этапа 303 идентификации компонентов, на котором идентифицируют компоненты, содержащиеся в количестве более одного в упомянутых грамматически и орфографически верных семантических частях, и идентифицируют сочетания компонентов, содержащихся в количестве более одного в каждой отдельной упомянутой грамматически и орфографически верной семантической части, и формируют карту сочетаний компонентов, содержащую, по меньшей мере, упомянутые компоненты, содержащиеся в количестве более одного в каждой отдельной упомянутой грамматически и орфографически верной семантической части, и их сочетания; этапа 304 идентификации значений компонентов, на котором идентифицируют значения компонентов, содержащихся в упомянутой карте сочетаний компонентов; этапа 305 идентификации понятий, на котором в грамматически и орфографически верных семантических частях логических разделов логических конструкций, не содержащих упомянутых идентифицированных компонентов, идентифицируют понятия, семантически совпадающие с упомянутыми значениями компонентов, содержащихся в упомянутой карте сочетаний компонентов, и формируют таблицу семантически совпадающих понятий, содержащую, по меньшей мере, значения компонентов, содержащихся в упомянутой карте сочетаний компонентов, и семантически совпадающие с ними понятия; этапа 306 идентификации семантических частей, не содержащих компонентов, и содержащих понятия, на котором идентифицируют, по меньшей мере, одну грамматически и орфографически верную семантическую часть логического раздела логической конструкции, не содержащую упомянутые идентифицированные компоненты и содержащую более одного упомянутого понятия; этапа 307 идентификации семантических частей, содержащих компоненты, значения которых совпадают с понятиями, идентифицируют грамматически и орфографически верную семантическую часть логического раздела логической конструкции, содержащую более одного упомянутого идентифицированного компонента, значения которых семантически совпадают с упомянутыми понятиями, содержащимися в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, не содержащей упомянутых идентифицированных компонентов и содержащей более одного упомянутого понятия; этапа 308 формирования карты сочетаний семантически совпадающих понятий, на котором формируют карту сочетаний семантически совпадающих понятий, содержащую, по меньшей мере, упомянутые понятия, содержащиеся в количестве более одного в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, не содержащей упомянутых идентифицированных компонентов, семантически совпадающие со значениями упомянутых идентифицированных компонентов, содержащихся в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, содержащей более одного упомянутого идентифицированного компонента; и этапа 309 формирования карты связей компонентов, на котором формируют карту связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую карту сочетаний компонентов и упомянутую карту сочетаний семантически совпадающих понятий. Дополнительно, способ 300 формирования карты связей компонентов может содержать этап 310 формирования отчета, на котором формируют отчет, демонстрирующий, по меньшей мере, количество связей и значения упомянутых компонентов, содержащихся в карте сочетаний компонентов. Компонент представляет собой атрибут юридического правила. Юридическое правило - это часть нормативного предписания. Целью компонентного структурирования правил является формирование некоего стандарта конструирования и системной технической оценки конструкции юридического правила, а также поиск и выявление связанных предписаний, формирующих конструкцию логической нормы права. Все компоненты правила, упомянутые в настоящем описании являются примерами, используемыми для целей пояснения настоящего изобретения. Иные компоненты без ограничений могут быть выявлены в соответствии с настоящим способом в других юридических правилах. Первым компонентом юридического правила, в качестве примера, но не ограничения, являются субъекты правоотношений - это правомочные лица, установленные в предписании, отношения между которыми регулируются предписанием. Кроме этого в предписании может быть использована одна из сторон, для которой устанавливается определенное правило. Стороны правоотношений именуются как субъект предписания и контрсубъект. При этом субъект предписания является причиной и источником регулирующего воздействия, а контрсубъект - стороной правоотношений, с которой связано это воздействие. Вторым компонентом юридического правила в качестве примера, но не ограничения, является регулирующее воздействие - некое действие, бездействие, требование, принцип и т.п. В случае наличия в предписании субъекта правоотношений, регулирующим воздействием будет являться содержание правоотношения - т.е. возможность определенных действий, необходимость определенных действий или необходимость воздержания от запрещенных действий. В случае если предписание не содержит субъекта правоотношений, то регулирующим воздействием будет являться содержание требований относящихся к объектам правоотношений. Третьим компонентом юридического правила в качестве примера, но не ограничения, является объект правоотношений - это объекты, явления и их производные (далее - объекты), это те предметы окружающего мира, на которые направлено регулирующее воздействие. В случае если правило не содержит субъекта правоотношений, то объектом правоотношений являются те объекты, на которые распространяется регулирующее воздействие в виде содержания требований к данным объектам. Четвертым компонентом юридического правила в качестве примера, но не ограничения, являются связанные объекты - это объекты, явления и их производные, которые присутствуют в правиле, но не являются объектами правоотношений. Связанные объекты используются в правиле либо для детализации и уточнения регулирующего воздействия, либо как объект регулирующего воздействия, либо как объект регулирования.In FIG. 16 as an example, but not limitation, depicts a General diagram of the steps of the claimed method 300 of forming a map of the relations of the components of the grammatically and spelling correct semantic parts of the logical sections of the logical structures of the converted structured source data array. The claimed method 300 for generating a map of component relationships is characterized by performing a step 301 of identifying components and values, which identify the components of the grammatically and spelling correct semantic parts of logical sections of logical constructions from said transformed structured source data array, each grammatically and spelling-correct semantic part containing said components, contains at least one of the aforementioned component, moreover, yanuty component comprises no more than one component value, and generating a table of components comprising at least said identified components and their values; step 302 of identification of semantic parts, which identify grammatically and spelling correct semantic parts of logical sections of logical structures containing said identified components, and grammatically and spelling correct semantic parts of logical sections of logical structures that do not contain said identified components; component identification step 303, in which components containing more than one in said grammatically and spelling correct semantic parts are identified and combinations of components contained in more than one in each separate grammatically and spelling correct semantic parts are identified, and a map of component combinations containing at least the aforementioned components contained in an amount of more than one in each separate grammatically and ortho graphically true semantic part, and their combination; step 304 identifying the values of the components, which identify the values of the components contained in the aforementioned map of combinations of components; concept identification step 305, in which, in the grammatically and spelling-correct semantic parts of the logical sections of logical constructions that do not contain the identified components identified, concepts are identified that are semantically the same as the values of the components contained in the component combination map, and a table of semantically matching concepts containing at least the values of the components contained in the said map of combinations of components and semantically matching these concepts; step 306 of identifying semantic parts that do not contain components and containing a concept, which identifies at least one grammatically and spelling-correct semantic part of a logical section of a logical construction that does not contain the identified components and contains more than one of the aforementioned concepts; stage 307 identification of semantic parts containing components whose values coincide with the concepts, identify the grammatically and spelling-correct semantic part of the logical section of the logical construction, containing more than one identified component, the values of which semantically coincide with the above-mentioned concepts, contained in one grammatically and spelling-correct semantic parts of a logical partition of a logical construct that does not contain the identified identified computers nents and comprising more than one of said concept; step 308 of forming a map of combinations of semantically matching concepts, which form a map of combinations of semantically matching concepts, containing at least the mentioned concepts, containing more than one in one grammatically and spelling-correct semantic part of the logical section of the logical construction that does not contain the identified components semantically coinciding with the values of the identified identified components contained in one grammatically and spelling in the black semantic part of the logical section of the logical structure containing more than one of the identified components; and step 309 of forming a map of component relationships, where a map of component relationships of grammatically and orthographically correct semantic parts of logical sections of the logical constructs of the transformed structured source data array containing at least said combination map of components and said map of combinations of semantically matching concepts is formed. Additionally, the method 300 of generating a map of the connections of the components may include a step 310 of generating a report on which a report is generated showing at least the number of links and the values of said components contained in the map of combinations of components. A component is an attribute of a legal rule. A legal rule is part of a regulatory enactment. The purpose of the component structuring of rules is the formation of a certain design standard and systematic technical assessment of the construction of a legal rule, as well as the search and identification of related requirements that form the construction of a logical rule of law. All components of the rule mentioned in the present description are examples used for the purpose of explaining the present invention. Other components without restrictions may be identified in accordance with this method in other legal rules. The first component of a legal rule, as an example, but not a limitation, is the subjects of legal relations - these are authorized persons established in the precept, relations between which are governed by the precept. In addition, one of the parties may be used in the order for which a certain rule is established. Parties to legal relations are referred to as the subject of the order and the counter-subject. In this case, the subject of the prescription is the cause and source of regulatory influence, and the counter-subject is the party to the legal relationship with which this effect is associated. The second component of a legal rule, as an example, but not a limitation, is the regulatory impact - an action, inaction, requirement, principle, etc. If the prescription of the subject of legal relations, the regulatory impact will be the content of the legal relationship - i.e. the possibility of certain actions, the need for certain actions or the need to refrain from prohibited actions. If the order does not contain the subject of legal relations, then the regulatory impact will be the content of the requirements relating to the objects of legal relations. The third component of a legal rule, as an example, but not a limitation, is the object of legal relations - these are objects, phenomena and their derivatives (hereinafter referred to as objects), these are objects of the world around which the regulatory influence is directed. If the rule does not contain the subject of legal relations, then the objects of legal relations are those objects that are subject to regulatory influence in the form of the content of requirements for these objects. The fourth component of a legal rule as an example, but not limitation, is related objects - these are objects, phenomena and their derivatives that are present in the rule, but are not objects of legal relations. Related objects are used in the rule either to detail and clarify the regulatory impact, or as an object of regulatory impact, or as an object of regulation.
Каждый компонент (вид компонента), установленный в компонентной структуре (см. таблицу 5), описывается с помощью различных лингвистических инструментов, таких как синтаксические функции и связи, части речи, члены предложения и т.п. Лингвистические инструменты описывают отдельные термины (понятия) и группы терминов (понятий), входящие в семантические части. Такие описания формируются в виде логических формул, в которых элементами выступают упомянутые лингвистические инструменты, связанные друг с другом логическими связками - конъюнкцией («и»), дизъюнкцией («или»), строгой дизъюнкцией («либо, …либо»), импликацией («если…, то»). Логические формулы по каждому компоненту (виду компонента) формирует база данных описаний компонентов. База данных описаний компонентов - это набор инструментов для поиска компонентов в грамматически и орфографически верных семантических частях логических разделов логических конструкций преобразованного структурированного исходного массива данных. Карта связей компонентов при этом состоит из внутренних и внешних связей компонентов. Внутренние связи компонентов указывают на сочетания компонентов внутри одного правила (внутри семантической части, содержащей компоненты). Внешние связи компонентов указывают на связь между отдельными нормативными предписаниями, основанными на наличии семантических связей между компонентами и отдельными словами, и словосочетаниями в семантических частях, не содержащих компоненты. Для идентификации компонентов в грамматически и орфографически верных семантических частях логических разделов логических конструкций из упомянутого преобразованного структурированного исходного массива данных необходимо предварительно выявить среди всех семантических частей только те семантически части, которые содержат компоненты. Это первая семантическая часть второго логического раздела логической конструкции. После выявления семантических частей, содержащих компоненты, с помощью инструментов для поиска компонентов, содержащихся в базе данных описаний компонентов, идентифицируются сами компоненты. Под идентификацией компонентов понимается выявление в каждой отдельной семантической части, содержащей компоненты следующей информации: а) наименование компонента; б) вид компонента; в) значение компонента. Наименование компонента - это элемент юридического правила, отражающий признаки правовых отношений в конкретном правиле, являющийся основной частью лингвистической формулы. Вид компонента - это основная и дополнительная части лингвистической формулы, т.е. отдельные подгруппы наименований компонентов, выявленные на основании различий в дополнительной части лингвистической формулы. Значение компонента - это термин или группа терминов, содержащихся в семантической части, которые соответствуют основной и дополнительной частям лингвистической формулы. В качестве примера, но не ограничения, будет произведена идентификация компонентов в юридическом правиле: «Уполномоченный орган обязан принять меры по отзыву такого товара с внутреннего рынка от потребителя». В данном примере идентифицируются все пять компонентов правила (см. таблицу 6).Each component (type of component) installed in the component structure (see table 5) is described using various linguistic tools, such as syntactic functions and relationships, parts of speech, sentence members, etc. Linguistic tools describe individual terms (concepts) and groups of terms (concepts) included in the semantic parts. Such descriptions are formed in the form of logical formulas in which the elements are the mentioned linguistic tools connected with each other by logical connectives - conjunction (“and”), disjunction (“or”), strict disjunction (“either, ... or”), implication ( "If ... then"). Logical formulas for each component (type of component) form a database of descriptions of components. Component descriptions database is a set of tools for finding components in grammatically and spelling-correct semantic parts of logical sections of logical constructions of a transformed structured source data array. The map of component relationships in this case consists of internal and external component relationships. The internal relationships of components indicate combinations of components within one rule (within the semantic part containing components). External relations of components indicate the relationship between individual regulatory requirements based on the presence of semantic relations between components and individual words, and phrases in semantic parts that do not contain components. To identify components in the grammatically and spelling-correct semantic parts of logical sections of logical constructions from the said transformed structured source data array, it is necessary to first identify among all semantic parts only those semantically parts that contain components. This is the first semantic part of the second logical section of the logical construction. After identifying the semantic parts containing the components, using the tools to search for the components contained in the component descriptions database, the components themselves are identified. By the identification of components is meant the identification in each separate semantic part containing the components of the following information: a) the name of the component; b) the type of component; c) the value of the component. The name of the component is an element of a legal rule, reflecting the signs of legal relations in a particular rule, which is the main part of the linguistic formula. The type of component is the main and additional parts of the linguistic formula, i.e. separate subgroups of component names identified on the basis of differences in the additional part of the linguistic formula. The meaning of a component is a term or group of terms contained in the semantic part that correspond to the main and additional parts of the linguistic formula. As an example, but not limitation, the components will be identified in the legal rule: "The authorized body is obliged to take measures to recall such goods from the domestic market from the consumer." In this example, all five components of the rule are identified (see table 6).
В юридическом правиле, смысловое ядро которого соответствует первой семантической части второго логического раздела, у каждого компонента может быть одно значение. По результатам идентификации компонентов в первых семантических частях второго логического раздела логической конструкции формируется таблица компонентов. Таблица компонентов содержит следующую информацию: наименование компонента; вид компонента; значение компонента; уникальный номер семантической части; уникальный номер логического раздела; уникальный номер логической конструкции. Основываясь на информации, содержащейся в таблице компонентов, из массива семантических частей, содержащих компоненты выявляются семантические части, содержащие более одного компонента и семантические части, содержащие один компонент. Причина такого разделения семантических частей, содержащих компоненты, в том, что карта сочетаний компонентов - это массив фактических сочетаний компонентов в каждом отдельном правиле, т.е. в каждой отдельной семантической части, содержащей компоненты. Поскольку для любого сочетания необходимо минимум два элемента, то карта сочетаний компонентов может быть сформирована на основе семантических частей, содержащих более одного компонента. При этом каждая семантическая часть, содержащая более одного компонента, формирует группу компонентов одного правила. Сочетания компонентов внутри каждой отдельной группы компонентов формируют карту сочетаний компонентов. Карта сочетаний компонентов содержит следующую информацию: наименование сочетаемых компонентов; виды сочетаемых компонентов; значение сочетаемых компонентов; уникальный номер семантической части; уникальный номер логического раздела; уникальный номер логической конструкции. В качестве примера, но не ограничения, будет произведено карты сочетаний компонентов в юридическом правиле: «Уполномоченный орган обязан принять меры по отзыву такого товара с внутреннего рынка от потребителя».In a legal rule, the semantic core of which corresponds to the first semantic part of the second logical section, each component can have one value. Based on the results of the identification of components in the first semantic parts of the second logical section of the logical structure, a table of components is formed. The table of components contains the following information: name of the component; type of component; component value unique semantic part number; Unique logical partition number unique logical design number. Based on the information contained in the component table, semantic parts containing more than one component and semantic parts containing one component are identified from the array of semantic parts containing components. The reason for this separation of semantic parts containing components is that the component combination map is an array of actual component combinations in each individual rule, i.e. in each separate semantic part containing the components. Since any combination requires at least two elements, a map of component combinations can be formed on the basis of semantic parts containing more than one component. Moreover, each semantic part containing more than one component forms a group of components of one rule. Component combinations within each individual component group form a map of component combinations. The component combination map contains the following information: name of the components to be combined; types of components to be combined; the value of the combined components; unique semantic part number; Unique logical partition number unique logical design number. As an example, but not limitation, cards of combinations of components in the legal rule will be produced: “The authorized body is obliged to take measures to recall such goods from the domestic market from the consumer”.
Указанное в примере сочетание компонентов и их видов позволяет отображать в отчете полностью или частично совпадающие между собой группы предписаний. Полное совпадение подразумевает наличие в выборке предписаний, имеющих один и тот же набор компонентов или видов компонентов, или значений компонентов. Частичное совпадение подразумевает наличие в выборке предписаний совпадающих сочетаний отдельных компонентов, или видов компонентов, или значений компонентов. В качестве примера полного совпадения можно привести выборку предписаний, в которой все предписания содержат, например, такой же состав компонентов, как и состав компонентов, приведенный в таблице 7, а именно К1-К1-К2-К3-К4, или состав указанных там же видов компонентов, или указанных значений. В качестве примера неполного совпадения можно привести выборку предписаний, в которой все предписания содержат часть указанных пользователем компонентов из установленного сочетания - например, только сочетание К1-К3. В такую выборку попадают не только предписания с установленным сочетанием К1-К3, но и с другими сочетаниями компонентов (например К1-К2-К3), в которых наряду с указанными в сочетании К1-К3 компонентами содержатся другие компоненты (например, К2). Карта сочетаний компонентов представляет собой первую часть карты связей компонентов. Внешние связи компонентов, составляющие вторую часть карты связей компонентов, основываются на наличии семантических связей между компонентами и отдельными словами, и словосочетаниями в семантических частях, не содержащих компоненты. Под семантической связью понимается наличие между значениями компонентов и отдельными словами, и словосочетаниями смыслового совпадения, т.е. совпадения значений отдельных компонентов и слов по смыслу. В качестве примера, но не ограничения, может быть рассмотрено одно правило (семантическая часть, содержащая компоненты) - «Продавец обязан передать товар потребителю», - и одна семантическую часть, не содержащая компоненты (ситуация, юридический факт) - «Если товар не передан потребителю». В первую очередь необходимо идентифицировать внешние связи компонентов, т.е. наличие семантической связи между значениями компонентов и понятиями, семантически совпадающими с ними. В результате, для данного примера будет выявлено три связи между следующими значениями компонентов и словами в семантической части «ситуация»: а) товар - товар; б) обязан передать - не передан; в) потребителю - потребителю. Для идентификации второй части карты связей компонентов используются только компоненты, зарегистрированные в карте сочетаний компонентов - т.е. компоненты, содержащиеся в одном юридическом правиле в количестве более одного. При этом в семантической части, не содержащей компоненты (в ситуациях), в которой выявлены понятия, семантически совпадающие со значениями упомянутых компонентов, должно быть выявлено не менее двух таких понятий. При этом семантически совпадающими понятиями могут быть не только полностью совпадающие или однокоренные слова (термины), но и их синонимы и ассоциации, выявленные в специальных подключаемых словарях и справочниках. Все понятия, семантически совпадающие со значениями компонентов, идентифицированные таким образом, регистрируются в специальной таблице - карте сочетаний семантически совпадающих понятий. Карта сочетаний семантически совпадающих понятий устанавливает связи между отдельными семантическими частями, содержащими компоненты и семантическими частями, не содержащими компоненты. Эта связь основана на выявленных связях между компонентами и соответствующими понятиями. В итоге выявляются связанные предписания. Карта сочетаний семантически совпадающих понятий содержит следующую информацию по каждой паре связанных предписаний: наименование компонентов; виды сочетаемых компонентов; значение сочетаемых компонентов; уникальный номер семантической части, содержащей компоненты; уникальный номер логического раздела, содержащего упомянутую семантическую часть; уникальный номер логической конструкции, содержащей упомянутый логический раздел; наименование понятий, семантически совпадающих со значениями упомянутых компонентов; уникальный номер семантической части, содержащей упомянутые понятия; уникальный номер логического раздела, содержащего упомянутую семантическую часть с понятиями; уникальный номер логической конструкции, содержащей упомянутый логический раздел и упомянутую семантическую часть с понятиями. Карта связей компонентов состоит из двух частей - из карты сочетаний компонентов и карты сочетаний семантически совпадающих понятий. Карта сочетаний компонентов может применяться при комплексном правовом анализе некоего правового контента, например, отраслевой или тематической группы НПА, или отдельного НПА или отдельного проекта НПА. По информации, зарегистрированной в Карте сочетаний компонентов можно моментально получить различные «системно-структурные срезы» НПА (проекта НПА или группы НПА) отражающие, по меньшей мере: компонентную структуру правил (как на уровне наименований, использованных в НПА компонентов, так и на уровне видов и значений компонентов); наличие отдельных сочетаний компонентов в правилах НПА (также на трех уровнях - наименование, вид и значение). Первая часть карты связей может быть сформирована и представлена в виде отчета. Этот отчет может быть сформирован по схеме и формату, который будет задан пользователем заранее и будет содержать выборочную и системно подобранную информацию, проясняющую важные для пользователя срезы НПА (проекта НПА, группы НПА). Карта сочетаний семантически совпадающих понятий может применятся как при правовом анализе некоего правового контента, например, отраслевой или тематической группы НПА, или отдельного НПА или отдельного проекта НПА, так и для поиска связанных предписаний в любом правовом контенте. Самым простым практическим результатом идентификации связей между предписаниями является решение задач по автоматическому выявлению предписаний, устанавливающих санкции за нарушение правила, указанного в исходном предписании и наоборот - выявление связи исходного предписания с правилом на основании предписания, содержащего санкции за нарушение данного правила. Выявленные таким образом связанные предписания формируют норму права, в которой присутствует регулятивная и охранительная части.The combination of components and their types indicated in the example allows displaying completely or partially matching prescription groups in the report. Full coincidence implies the presence of prescriptions in the sample that have the same set of components or types of components or component values. Partial coincidence implies the presence in the sample of prescriptions of matching combinations of individual components, or types of components, or values of components. As an example of complete coincidence, we can cite a selection of requirements in which all the requirements contain, for example, the same composition of components as the composition of the components shown in table 7, namely K1-K1-K2-K3-K4, or the composition indicated there types of components, or specified values. An example of an incomplete coincidence is a selection of prescriptions in which all prescriptions contain a part of the components specified by the user from the set combination - for example, only combination K1-K3. Such a selection includes not only the requirements with the established combination of K1-K3, but also with other combinations of components (for example K1-K2-K3), which contain other components (for example, K2) along with the components indicated in the combination K1-K3. The component combination map is the first part of the component association map. The external relations of the components that make up the second part of the map of component relationships are based on the presence of semantic relationships between components and individual words, and phrases in semantic parts that do not contain components. The semantic connection is understood as the presence between the meanings of the components and individual words, and phrases of semantic coincidence, i.e. coincidence of the meanings of the individual components and words within the meaning. As an example, but not limitation, one rule can be considered (the semantic part containing the components) - “The seller must transfer the goods to the consumer”, and one semantic part not containing the components (situation, legal fact) - “If the goods are not transferred to the consumer. " First of all, it is necessary to identify the external relations of the components, i.e. the presence of a semantic connection between the meanings of components and concepts that semantically coincide with them. As a result, for this example, three relationships will be revealed between the following meanings of the components and the words in the semantic part “situation”: a) product - product; b) must transfer - not transferred; c) to the consumer - to the consumer. To identify the second part of the component association map, only the components registered in the component combination map are used - i.e. components contained in one legal rule in an amount of more than one. At the same time, in the semantic part that does not contain components (in situations), in which concepts are identified that semantically coincide with the meanings of the components mentioned, at least two such concepts should be revealed. In this case, semantically coinciding concepts can be not only completely matching or one-root words (terms), but also their synonyms and associations identified in special connected dictionaries and reference books. All concepts that semantically coincide with the values of the components identified in this way are recorded in a special table - a map of combinations of semantically coinciding concepts. A map of combinations of semantically coinciding concepts establishes relationships between individual semantic parts containing components and semantic parts that do not contain components. This relationship is based on identified relationships between components and related concepts. As a result, related requirements are identified. A map of combinations of semantically matching concepts contains the following information for each pair of related prescriptions: name of components; types of components to be combined; the value of the combined components; unique number of the semantic part containing the components; unique number of the logical section containing the mentioned semantic part; a unique logical construction number containing the logical partition; the name of concepts that semantically coincide with the meanings of the mentioned components; unique number of the semantic part containing the mentioned concepts; unique number of the logical section containing the mentioned semantic part with concepts; a unique number of the logical construct containing the mentioned logical section and the mentioned semantic part with concepts. The map of component relationships consists of two parts - from a map of combinations of components and a map of combinations of semantically identical concepts. A combination of components map can be used in a comprehensive legal analysis of some legal content, for example, an industry or thematic group of legal acts, or a separate legal act or a separate draft legal act. According to the information registered in the Component Combination Map, you can instantly get various “system-structural sections” of the legal acts (draft legal acts or group of legal acts) reflecting at least: the component structure of the rules (both at the level of the names used in the legal acts of the components and at the level types and values of components); the presence of separate combinations of components in the rules of the regulatory legal acts (also at three levels - name, type and value). The first part of the communication map can be generated and presented in the form of a report. This report can be generated according to the scheme and format, which will be set by the user in advance and will contain selective and system-selected information clarifying the sections of the regulatory acts that are important for the user (draft legal acts, group of legal acts). A map of combinations of semantically coinciding concepts can be used both in the legal analysis of certain legal content, for example, an industry or thematic group of legal acts, or a separate legal act or a separate draft legal act, and to search for related provisions in any legal content. The simplest practical result of identifying relationships between prescriptions is to solve the problem of automatically identifying prescriptions establishing sanctions for violation of a rule specified in the original prescription and vice versa - to identify the relationship of the original prescription with the rule on the basis of the prescription containing sanctions for violation of this rule. The related prescriptions identified in this way form a rule of law in which there are regulatory and protective parts.
На фиг. 17 в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 400 поиска релевантной информации в преобразованном структурированном исходном массиве данных, содержащем, по меньшей мере, логические конструкции, содержащие грамматически и орфографически верные семантические части логических разделов логических конструкций. Заявленный способ 400 поиска релевантной информации характеризуется выполнением этапа 401 формирования поискового запроса, на котором формируют поисковый запрос, содержащий, по меньшей мере, один поисковый термин и, при необходимости, дополнительно назначают, по меньшей мере, один критерий поиска, который может представлять собой одно из: поиск по первым и вторым семантическим частям первых логических разделов логических конструкций и вторым семантическим частям вторых логических разделов логических конструкций; поиск по первым семантическим частям вторых логических разделов логических конструкций и вторым семантическим частям вторых логических разделов логических конструкций; при этом поисковый запрос может представлять собой одно из: по меньшей мере, одно из: терминологический поисковый запрос; компонентный поисковый запрос; компонентно-терминологический поисковый запрос; этапа 402 идентификации массива поиска, на котором идентифицируют массив данных в упомянутом преобразованном структурированном исходном массиве данных, соответствующий упомянутому поисковому термину; этапа 403 идентификации семантических частей, на котором идентифицируют, по меньшей мере, одну грамматически и орфографически верную семантическую часть логических разделов логических конструкций упомянутого преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутый поисковый термин; этапа 404 идентификации логических конструкций, на котором идентифицируют, по меньшей мере, одну логическую конструкцию упомянутого преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую идентифицированную грамматически и орфографически верную семантическую часть; и этапа 405 демонстрирования семантических частей, на котором демонстрируют, по меньшей мере, упомянутую идентифицированную логическую конструкцию упомянутого преобразованного структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую идентифицированную грамматически и орфографически верную семантическую часть, которая является искомой релевантной информацией. Дополнительно (фиг. 18) заявленный способ 400 поиска релевантной информации может быть дополнен вторым уровнем поиска, заключающимся в выполнении этапа 406 выбора логической конструкции, на котором выбирают, по меньшей мере, одну из упомянутых идентифицированных логических конструкций, содержащую, по меньшей мере, упомянутую идентифицированную грамматически и орфографически верную семантическую часть; этапа 407 идентификации связанных семантических частей, на котором идентифицируют, по меньшей мере, связанные с упомянутой грамматически и орфографически верной семантической частью грамматически и орфографически верные семантические части, содержащиеся в других логических конструкциях преобразованного структурированного массива данных, причем упомянутая идентификация осуществляется на основании сведений из карты связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций; этапа 408 идентификации логических конструкций, на котором идентифицируют, по меньшей мере, одну или более логические конструкции, содержащие упомянутые идентифицированные связанные грамматически и орфографически верные семантические части или идентифицируют отсутствие логических конструкций, содержащих упомянутые идентифицированные связанные грамматически и орфографически верные семантические части; и этапом 409 демонстрирования логических конструкций, на котором демонстрируют, по меньшей мере, одну или более логические конструкции, содержащие упомянутые идентифицированные связанные грамматически и орфографически верные семантические части или демонстрируют отсутствие логических конструкций, содержащих упомянутые идентифицированные связанные грамматически и орфографически верные семантические части. Изначально, массивом поиска является преобразованный структурированный исходный массив данных - т.е. нормативные правовые акты в виде логических конструкций, состоящих из множества субмассивов данных, в которых взаимозависимости существуют, как на уровне субмассивов, так и между отдельными значениями субмассивов. Субмассивы преобразованного структурированного исходного массива данных - это грамматически и орфографически верные семантические части логических разделов логических конструкций. Релевантность поиска - это выявление в тексте нормативного правового акта логических конструкций, являющихся нормативными предписаниями, соответствующими, по меньшей мере, поисковому запросу. Для достижения требуемого уровня релевантности поиска дополнительно может быть назначен один из возможных критериев поиска, которые предназначены для уточнения области поиска. Для достижения первого уровня релевантности поиска назначают критерий поиска по первым и вторым семантическим частям первых логических разделов логических конструкций и вторым семантическим частям вторых логических разделов логических конструкций. Этот критерий поиска позволяет проводить поиск в массивах, относящихся к разделам ситуаций. Посредством назначения этого критерия поиска обеспечится выбор соответствующего субмассива (субмассива ситуаций), в котором в соответствии с поисковым запросом будет произведен поиск релевантной информации. Поисковый запрос при использовании такого критерия поиска может быть только терминологическим. Терминологический запрос - это запрос на поиск совпадений с установленным в запросе термином (понятием) в соответствующих критерию поиска субмассивах. Для достижения второго уровня релевантности поиска может быть применен критерий поиска по первым семантическим частям вторых логических разделов логических конструкций и вторым семантическим частям вторых логических разделов логических конструкций. Этот критерий поиска позволяет проводить поиск в массивах, относящихся к разделам правил. Посредством назначения этого критерия поиска обеспечится выбор соответствующего субмассива (субмассива правил), в котором в соответствии с поисковым запросом будет произведен поиск релевантной информации. Поисковый запрос при этом может быть простым и сложным. Простыми запросами являются терминологический запрос и компонентный запрос. Компонентный запрос -это запрос на поиск совпадений, как по наличию компонентов юридического правила, так и по их видам, а также по их значениям. Компонентный запрос может быть трехуровневым - поиск по названию компонента юридического правила (первый уровень компонентного запроса), поиск по виду компонента юридического правила (второй уровень компонентного запроса), значение вида компонента (третий уровень компонентного запроса). При этом первые два уровня - это поиск по структуре компонентов юридического правила. Третий уровень - поиск по терминам из текста НПА, индексированным в соответствующих субмассивах как значение вида компонента юридического правила. Сложный поисковый запрос представляет собой объединение двух простых запросов - компонентного и терминологического. Компонентно-терминологический запрос представляет собой компонентный запрос, дополненный четвертым уровнем поиска - поиском по термину или терминам, содержащихся в выявленных по результатам компонентного запроса юридических правилах. Выполнение поискового запроса при этом может быть многоэтапным. В частности, на первом этапе поиска, критерии поиска и поисковый запрос применяются ко всей базе НПА. На втором и последующих этапах при этом может осуществляться применение критериев поиска и поисковых запросов к результатам поиска, полученным при выполнении первого этапа поиска. После назначения критерия поиска и выполнения поискового запроса в соответствующих критерию поиска субмассивах преобразованного структурированного исходного массива данных выявляются совпадения индексов и значений с установленными значениями поискового запроса. Результатом выполнения поискового запроса является идентификация перечня отдельных значений субмассивов, которые соответствуют значениям поискового запроса. Выявленные в результате анализа преобразованного структурированного исходного массива в соответствии с критериями поиска и поисковым запросом значения субмассивов ассоциируются с теми семантическими частями логических разделов логических конструкций, в которых они зарегистрированы. В итоге выявляются те логические конструкции, которые содержат семантические части, в которых выявлены значения, соответствующие поисковому запросу в субмассивах, соответствующих критериям поиска. В результате поиска релевантной информации в преобразованном структурированном исходном массиве данных будут продемонстрированы выявленные логические конструкции - нормативные предписания. Формат логических конструкций соответствует формату элементов преобразованного структурированного исходного массива данных и содержит юридическое правило и обусловленность правила (условно - «ситуации»). При этом юридическое правило состоит из смыслового ядра юридического правила и уточнений понятий смыслового ядра правила, а обусловленность правила состоит из смыслового ядра ситуации, уточнений понятий смыслового ядра ситуации, зависимостей понятий смыслового ядра ситуации и зависимостей понятий смыслового ядра правила. Соответственно, в случае назначения более одного значения поискового запроса (т.е. формирование нескольких запросов одновременно), дополнительно необходимо выявить логическую связь между назначенными значениями. Выявление логической связи необходимо для назначения дополнительного критерия поиска, позволяющего согласовать несколько поисковых запросов и корректной идентификации соответствующих логических конструкций. Несколько поисковых запросов при этом могут быть согласованы по логической связи «и» (конъюнкция) или логической связи или» (дизъюнкция). Назначение конъюнктивной логической связи позволяет выявлять нормативные предписания, полностью соответствующие всем запросам, т.е. нормативные предписания, которые содержат в соответствующих критериям поиска частях текста нормативного предписания, как значение первого запроса, так и значения остальных, связанных с первым запросов. Назначение дизъюнктивной логической связи позволяет выявлять нормативные предписания, полностью соответствующие только отдельным поисковым запросам, т.е. нормативные предписания, которые содержат в соответствующих критериям поиска частях текста нормативного предписания или значение первого запроса, или значения других запросов. Далее способ поиска может быть дополнен вторым уровнем поиска релевантной информации. Для реализации этого способа поиска, результатом которого является выявление логической нормы права, необходимо выбрать одну из выявленных логических конструкций (одно нормативное предписание), которая будет являться исходной для выявления всей связанной с выбранной логической конструкцией совокупности логических конструкций, образующих логическую норму права. Идентификация связей семантической части выбранной логической конструкции с семантическими частями данной и других логических конструкций основана на сведениях из второй части карты связей компонентов (из карты сочетаний семантически совпадающих понятий). Самой минимальной задачей по выявлению логической нормы права является задача идентификации нормативного предписания, устанавливающего санкции за нарушение юридического правила, указанного в исходной логической конструкции (в исходном нормативном предписании) или наоборот - идентификация нормативного предписания на основании исходной логической конструкции, содержащей санкции. В виде поискового запроса могут быть использованы либо значения компонентов, либо понятия (термины), семантически совпадающие со значениями компонентов. Это зависит от того, какая задача ставится при выявлении логической нормы права и этим определяется, в каких массивах будет производиться поиск. При поиске санкций за нарушение юридического правила поисковым запросом являются значения компонентов правила, а поисковым массивом - массивы всех семантических частей, относящиеся к обусловленностям правила. При поиске самого юридического правила по известным, ранее выявленным, санкциям, поисковым запросом являются термины, семантически совпадающие со значениями компонентов правила, а поисковым массивом - массивы всех семантических частей, относящиеся к юридическому правилу. В результате двухуровневого поиска релевантной информации в преобразованном структурированном исходном массиве данных идентифицируются логические конструкции, содержащие семантические части, которые содержат термины или компоненты, соответствующие поисковому запросу второго уровня и которые связаны с исходной логической конструкцией в рамках логической нормы права. Для идентификации таких связей используются внешние связи компонентов, составляющие вторую часть карты связей компонентов (карту сочетаний семантически совпадающих понятий), основывающиеся на наличии семантических связей между компонентами и отдельными словами, и словосочетаниями в семантических частях, не содержащих компоненты. Под семантической связью понимается наличие между значениями компонентов и отдельными словами, и словосочетаниями смыслового (семантического) совпадения, т.е. совпадения значения отдельных компонентов и отдельных слов по смыслу. В качестве примера, но не ограничения, можно рассмотреть одно юридическое правило (семантическую часть, содержащую компоненты) - «Продавец обязан передать товар потребителю» и одну семантическую часть, не содержащую компоненты (обусловленность правила, ситуацию, юридический факт) - «Если товар не передан потребителю». Осуществляется идентификация внешних связей компонентов, т.е. наличия семантической связи между значениями компонентов и понятиями, семантически совпадающими с ними. В результате для данного примера выявлено три связи между следующими значениями компонентов и словами в семантической части «ситуация»: а) товар - товар; б) обязан передать - не передан; в) потребителю - потребителю. Для идентификации связанных семантических частей используются только компоненты, зарегистрированные в карте связей компонентов - т.е. компоненты, содержащиеся в одном юридическом правиле в количестве более одного. При этом в семантической части, не содержащей компоненты («ситуации»), в которой выявлены понятия, семантически совпадающие со значениями упомянутых компонентов, должно быть выявлено не менее двух таких понятий, семантически совпадающих с не менее чем двумя значениями компонентов из одного юридического правила. При этом семантически совпадающими понятиями могут быть не только полностью совпадающие или однокоренные слова (термины), но и их синонимы и ассоциации, выявленные в специальных подключаемых словарях и справочниках. Все понятия, семантически совпадающие со значениями компонентов, идентифицированные таким способом регистрируются в специальной таблице - карте сочетаний семантически совпадающих понятий. Карта сочетаний семантически совпадающих понятий устанавливает связи между отдельными семантическими частями, содержащими компоненты, и семантическими частями, не содержащими компоненты. Эта связь основана на выявленных связях между компонентами и соответствующими понятиями. В итоге выявляются связанные предписания. Карта сочетаний семантически совпадающих понятий содержит следующую информацию по каждой паре связанных предписаний: наименование компонентов; виды сочетаемых компонентов; значение сочетаемых компонентов; уникальный номер семантической части, содержащей компоненты; уникальный номер логического раздела, содержащего упомянутую семантическую часть; уникальный номер логической конструкции, содержащей упомянутый логический раздел; наименование понятий, семантически совпадающих со значениями упомянутых компонентов; уникальный номер семантической части, содержащей упомянутые понятия; уникальный номер логического раздела, содержащего упомянутую семантическую часть с понятиями; уникальный номер логической конструкции, содержащей упомянутый логический раздел и упомянутую семантическую часть с понятиями. Карта сочетаний семантически совпадающих понятий может применятся как при правовом анализе некоего правового контента, например, отраслевой или тематической группы НПА, или отдельного НПА или отдельного проекта НПА, так и для поиска связанных предписаний по требованию пользователя в любом правовом контенте. В результате идентификации пользователю демонстрируются результаты в виде выявленных связанных предписаний (отдельных норм права).In FIG. 17, by way of example, but not limitation, a general flowchart of the
На фиг. 19 в качестве примера, но не ограничения, проиллюстрирована примерная схема заявленной системы 500, которая в предпочтительном варианте реализации содержит, по меньшей мере, одно или более устройств 501, содержащих, по меньшей мере, один или более процессоров 5011, один или более модулей ввода/вывода (I/O) 5012 и память 5013. Упомянутые устройства 501 могут представлять собой, но не ограничиваться: персональный компьютер, портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, тонкий клиент и тому подобное. Память (машиночитаемый носитель данных) 5013 устройства 501 содержит код программы, который при выполнении побуждает упомянутые один или более процессоры 5011 упомянутого устройства 501 и/или устройства 501, связанного с ним, выполнять действия описанных в вариантах осуществления настоящего изобретения с первого по двенадцатый, в вариантах осуществления настоящего изобретения с двадцатого по двадцать первый, и в вариантах осуществления настоящего изобретения с двадцать девятого по тридцать четвертый, и содержит подлежащие преобразованию или преобразованные один или несколько структурированных исходных массивов данных, содержащих, по меньшей мере, текст на естественном языке. Более того, подлежащие преобразованию или преобразованные один или несколько структурированных исходных массивов данных могут являться загружаемыми и храниться, в частности, в базе данных 502 системы преобразования структурированного массива данных. В качестве примера, но не ограничения, машиночитаемый носитель данных может включать в себя оперативную память (RAM); постоянное запоминающее устройство (ROM); электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM); флэш-память или другие технологии памяти; CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для кодирования требуемой информации, и к которому может быть осуществлен доступ посредством описываемого устройства. Память включает в себя носитель данных на основе запоминающего устройства компьютера в форме энергозависимой или энергонезависимой памяти, или их комбинации. Примерные аппаратные устройства включают в себя твердотельную память, накопители на жестких дисках, накопители на оптических дисках и т.д. В памяти хранится примерная среда, в которой при помощи компьютерных команд или кодов, хранящихся в памяти устройства, могут быть осуществлены процедуры предварительного преобразования структурированного исходного массива данных, процедуры преобразования структурированного исходного массива данных, формирования карты связей компонентов преобразованного структурированного исходного массива данных, и процедуры поиска релевантной информации в преобразованных структурированных исходных массивах данных. Устройство содержит один или более процессоров 5011, которые предназначены для выполнения компьютерных команд или кодов, хранящихся в памяти устройства с целью обеспечения выполнения упомянутых выше процедур. Компьютерные команды или коды, хранящиеся в памяти, предназначены для выполнения предварительных преобразований структурированного исходного массива данных, преобразований структурированного исходного массива данных, формирования карты связей компонентов преобразованных структурированных исходных массивов данных, поиска релевантной информации в преобразованных структурированных исходных массивах данных. Модули I/O 5012 устройства 501 представляют собой, не ограничиваясь, типичные и известные из уровня техники средства управления устройством: манипулятор типа «мышь», клавиатура, джойстик, тачпад, трекбол, электронное перо, стилус, сенсорный дисплей и тому подобное. Также модули I/O 5012 представляют собой, не ограничиваясь, типичные и известные из уровня техники средства демонстрирования информации: дисплей, монитор, проектор, принтер, графопостроитель и тому подобное. Система 500 также может включать в себя базу данных (БД) 502. БД 502 может представлять собой, не ограничиваясь: иерархическую БД, сетевую БД, реляционную БД, объектную БД, объектно-ориентированную БД, объектно-реляционную БД, пространственную БД, комбинацию перечисленных двух и более БД, и тому подобное. БД 502 хранит данные в памяти, которая может представлять собой, не ограничиваясь: постоянное запоминающее устройство (ROM), электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM), флэш-память, CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для хранения требуемой информации, и к которому может быть осуществлен доступ посредством устройства 501 преобразования структурированного исходного массива данных и сервера 503. БД 502 служит для хранения данных, представляющих собой, по меньшей мере, компьютерные команды или коды, хранящиеся в памяти, предназначенные для выполнения предварительных преобразований структурированного исходного массива данных, преобразований структурированного исходного массива данных, формирования карты связей компонентов преобразованных структурированных исходных массивов данных, поиска релевантной информации в преобразованных структурированных исходных массивах данных; подлежащие преобразованию или преобразованные один или несколько структурированных исходных массивов данных, содержащих, по меньшей мере, текст на естественном языке, которые могут быть загружены в память 5013 устройства 501; и других данных, необходимых для функционирования системы. Примерная система 500 дополнительно содержит серверное вычислительное устройство (сервер) 503, которое сохраняет и содействует манипуляции компьютерными командами или кодами, ранее описанными в данном документе, которые, соответственно, дополнительно не описываются. Сервер 503 может представлять собой: персональный компьютер, портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, машину баз данных и тому подобное. Сервер 503 обеспечивает регулирование обменом данных в системе 500 преобразования структурированного исходного массива данных, а также обеспечивает обработку данных при условии подключения к нему одного или более чем одного устройств 501 преобразования структурированного массива данных или когда устройство 501 преобразования структурированного массива данных представляет собой тонкий клиент. В этом случае все вычислительные мощности, необходимые для обеспечения выполнения процедуры преобразования структурированного массива данных, расположены на сервере 503. Система 500 также содержит одну или более сетей 504 передачи данных. Сети 504 передачи данных могут включать в себя, но не ограничиваться, одну или более локальных сетей (LAN) и/или глобальных сетей (WAN), или могут представлять собой информационно-телекоммуникационную сеть Интернет, или Интранет, или виртуальную частную сеть (VPN), или их комбинацию, и тому подобное. Сервер 503 также имеет возможность обеспечивать виртуальную вычислительную среду (Virtual Machine) для обеспечения взаимодействия между устройством 501 преобразования структурированного массива данных и БД 502. Сеть 504 служит для обеспечения взаимодействия между устройством 501, базой данных 502 и сервером 503 системы 500.In FIG. 19, by way of example, but not limitation, an exemplary diagram of the
Claims (12)
идентифицируют компоненты грамматически и орфографически верных семантических частей логических разделов логических конструкций из упомянутого структурированного исходного массива данных, причем каждая упомянутая грамматически и орфографически верная семантическая часть, содержащая упомянутые компоненты, содержит, по меньшей мере, один упомянутый компонент, причем упомянутый компонент содержит не более одного значения компонента, и формируют таблицу компонентов, содержащую, по меньшей мере, упомянутые идентифицированные компоненты и их значения;
идентифицируют грамматически и орфографически верные семантические части логических разделов логических конструкций, содержащие упомянутые идентифицированные компоненты, и грамматически и орфографически верные семантические части логических разделов логических конструкций, не содержащие упомянутые идентифицированные компоненты;
идентифицируют компоненты, содержащиеся в количестве более одного в упомянутых грамматически и орфографически верных семантических частях, и идентифицируют сочетания компонентов, содержащихся в количестве более одного в каждой отдельной упомянутой грамматически и орфографически верной семантической части, и формируют карту сочетаний компонентов, содержащую, по меньшей мере, упомянутые компоненты, содержащиеся в количестве более одного в каждой отдельной упомянутой грамматически и орфографически верной семантической части, и их сочетания;
идентифицируют значения компонентов, содержащихся в упомянутой карте сочетаний компонентов;
в грамматически и орфографически верных семантических частях логических разделов логических конструкций, не содержащих упомянутых идентифицированных компонентов, идентифицируют понятия, семантически совпадающие с упомянутыми значениями компонентов, содержащихся в упомянутой карте сочетаний компонентов, и формируют таблицу семантически совпадающих понятий, содержащую, по меньшей мере, значения компонентов, содержащихся в упомянутой карте сочетаний компонентов, и семантически совпадающие с ними понятия;
идентифицируют, по меньшей мере, одну грамматически и орфографически верную семантическую часть логического раздела логической конструкции, не содержащую упомянутые идентифицированные компоненты и содержащую более одного упомянутого понятия;
идентифицируют грамматически и орфографически верную семантическую часть логического раздела логической конструкции, содержащую более одного упомянутого идентифицированного компонента, значения которых семантически совпадают с упомянутыми понятиями, содержащимися в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, не содержащей упомянутых идентифицированных компонентов и содержащей более одного упомянутого понятия;
формируют карту сочетаний семантически совпадающих понятий, содержащую, по меньшей мере, упомянутые понятия, содержащиеся в количестве более одного в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, не содержащей упомянутых идентифицированных компонентов, семантически совпадающие со значениями упомянутых идентифицированных компонентов, содержащихся в одной грамматически и орфографически верной семантической части логического раздела логической конструкции, содержащей более одного упомянутого идентифицированного компонента;
формируют карту связей компонентов грамматически и орфографически верных семантических частей логических разделов логических конструкций структурированного исходного массива данных, содержащую, по меньшей мере, упомянутую карту сочетаний компонентов и упомянутую карту сочетаний семантически совпадающих понятий.1. A method of forming a map of relationships between components of grammatically and spelling-correct semantic parts of logical sections of logical constructions of a structured source data array, said structured source data array containing said logical constructions that are interconnected judgments that are logical sections of logical constructions consisting of the first semantic parts and second semantic parts, the first semantic parts being the meaning core of logical sections of logical constructions and consist of elements that are at least the subjects of judgments and predicates of judgments, the second semantic parts consisting of at least one or more attributes of the elements of semantic kernels of judgments, while the semantic parts are grammatically and spelling correct due to linguistic transformations, said method comprising at least the steps of:
identify the components of the grammatically and spelling correct semantic parts of the logical sections of logical constructions from said structured source data array, wherein each said grammatically and spelling correct semantic part containing said components contains at least one said component, said component containing at most one component values, and form a component table containing at least said identified composition nts and their meanings;
identify grammatically and orthographically correct semantic parts of logical sections of logical constructions containing said identified components, and grammatically and spelling correct semantic parts of logical sections of logical constructions that do not contain said identified components;
identify components contained in an amount of more than one in the aforementioned grammatically and spelling correct semantic parts, and identify combinations of components contained in an amount of more than one in each of the aforementioned grammatically and spelling correct semantic parts, and form a map of combinations of components containing at least said components contained in an amount of more than one in each separate grammatically and spelling-correct semantic part, and their etaniya;
identifying the values of the components contained in said combination map of the components;
in the grammatically and spelling-correct semantic parts of the logical sections of logical constructions that do not contain the identified components identified, the concepts are identified that semantically coincide with the mentioned component values contained in the component combination map, and a table of semantically matching concepts containing at least the component values is formed contained in the aforementioned map of combinations of components, and semantically coinciding concepts with them;
identify at least one grammatically and orthographically correct semantic part of the logical section of the logical structure that does not contain the identified components and contains more than one of the mentioned concepts;
identify the grammatically and orthographically correct semantic part of the logical section of the logical structure, containing more than one identified component mentioned, the values of which semantically coincide with the mentioned concepts, contained in one grammatically and spelling correct semantic part of the logical section of the logical structure, not containing the identified identified components and containing more than one the mentioned concept;
form a map of combinations of semantically matching concepts, containing at least the mentioned concepts, containing more than one in one grammatically and spelling correct semantic part of the logical section of the logical structure that does not contain the identified components, semantically matching the values of the identified components contained in one grammatically and spelling-correct semantic part of a logical section of a logical construction containing olee one of said identified component;
form a map of the relationships between the components of the grammatically and spelling-correct semantic parts of the logical sections of the logical constructions of the structured source data array, containing at least the mentioned combination map of the components and the mentioned combination map of semantically identical concepts.
формируют исходную структуру данных структурированного исходного массива данных, содержащую исходные элементы исходной структуры данных, причем упомянутые исходные элементы представляют собой:
- структурно-сложные языковые конструкции, представляющие собой структурно-сложные языковые конструкции, содержащие контекстные термины и структурно-сложные языковые конструкции, не содержащие контекстные термины; и
- структурно-простые языковые конструкции, представляющие собой структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;
идентифицируют в упомянутых исходных элементах контекстные термины и формируют базу данных контекстных терминов, содержащую упомянутые идентифицированные контекстные термины;
используя информацию, содержащуюся в упомянутой сформированной базе данных контекстных терминов, в упомянутой исходной структуре данных идентифицируют структурно-сложные языковые конструкции, содержащие контекстные термины, структурно-сложные языковые конструкции, не содержащие контекстные термины, структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины;
осуществляют преобразование первого типа над упомянутыми структурно-сложными языковыми конструкциями, не содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;
осуществляют преобразование второго типа над упомянутыми структурно-простыми языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины;
осуществляют преобразование третьего типа над упомянутыми структурно-сложными языковыми конструкциями, содержащими контекстные термины, для получения грамматически и орфографически верных структурно-простых языковых конструкций, не содержащих контекстные термины; и
формируют итоговую структуру данных структурированного исходного массива данных, содержащую элементы итоговой структуры данных, причем элементы итоговой структуры данных представляют собой структурно-простые языковые конструкции, не содержащие контекстные термины, и полученные за счет преобразований первого, второго и третьего типов грамматически и орфографически верные структурно-простые языковые конструкции, не содержащие контекстные термины.3. The method according to any one of paragraphs. 1 or 2, characterized in that it further comprises the step of converting a structured source data array containing at least natural language text, said step being characterized by the steps in which:
form the initial data structure of a structured source data array containing the source elements of the original data structure, and the said source elements are:
- structurally complex linguistic constructions, which are structurally complex linguistic constructions containing contextual terms and structurally complex linguistic constructions that do not contain contextual terms; and
- structurally simple language constructs, which are structurally simple language constructs containing contextual terms, and structurally simple language constructs that do not contain contextual terms;
identify the context terms in said source elements and form a database of context terms containing said identified context terms;
using the information contained in said generated contextual terms database, structurally complex language constructs containing contextual terms, structurally complex language constructs not containing contextual terms, structurally simple language constructs containing contextual terms are identified in said initial data structure, and structurally simple language constructs that do not contain contextual terms;
carry out the conversion of the first type on the above-mentioned structurally complex language constructs that do not contain contextual terms to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms;
carry out a conversion of the second type on the above-mentioned structurally simple language constructs containing contextual terms to obtain grammatically and spelling-correct structurally simple language constructs not containing contextual terms;
carry out the conversion of the third type over the above-mentioned structurally complex language constructs containing contextual terms to obtain grammatically and spelling-correct structurally simple language constructs that do not contain contextual terms; and
form the final data structure of the structured initial data array containing the elements of the final data structure, and the elements of the final data structure are structurally simple language constructs that do not contain contextual terms, and grammatically and spelling-correct structurally and structurally obtained from the first, second, and third types simple language constructs that do not contain contextual terms.
преобразование первого типа включает форматное преобразование и лингвистическое преобразование;
преобразование второго типа включает контекстное преобразование и лингвистическое преобразование;
преобразование третьего типа включает форматное преобразование, контекстное преобразование и лингвистическое преобразование.4. The method according to p. 3, characterized in that:
the first type conversion includes format conversion and linguistic conversion;
a second type conversion includes contextual conversion and linguistic conversion;
a third type conversion includes format conversion, contextual conversion, and linguistic conversion.
идентифицируют исходную структуру данных исходного структурированного массива данных; идентифицируют элементы исходной структуры данных; идентифицируют первые логические разделы упомянутых элементов исходной структуры данных и вторые логические разделы упомянутых элементов исходной структуры данных; и формируют первую структуру данных структурированного исходного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных содержат первые логические разделы и вторые логические разделы;
идентифицируют элементы первой структуры данных, содержащие один упомянутый первый логический раздел, и элементы первой структуры данных, содержащие один упомянутый второй логический раздел; идентифицируют элементы первой структуры данных, содержащие более одного упомянутого первого логического раздела, и элементы первой структуры данных, содержащие более одного упомянутого второго логического раздела; в элементах первой структуры данных, содержащих более одного упомянутого первого логического раздела, и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела, идентифицируют логические связи между упомянутыми первыми логическими разделами или между упомянутыми вторыми логическими разделами; в элементах первой структуры данных, содержащих более одного упомянутого первого логического раздела, и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела, идентифицируют элементы первой структуры данных, не имеющие логической связи между логическими разделами; и формируют базу данных логических связей логических разделов элементов первой структуры данных;
формируют логические конструкции логических разделов элементов первой структуры данных, используя информацию из базы данных логических связей логических разделов элементов первой структуры данных и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый первый логический раздел, и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый второй логический раздел; и формируют вторую структуру данных структурированного исходного массива данных, содержащую элементы второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой сформированные логические конструкции логических разделов первой структуры данных;
идентифицируют первые логические разделы элементов второй структуры данных и вторые логические разделы элементов второй структуры данных; в упомянутых первых логических разделах и вторых логических разделах элементов второй структуры данных идентифицируют первые семантические части и вторые семантические части; и в упомянутых первых и вторых логических разделах элементов второй структуры данных идентифицируют, по меньшей мере, особые семантические части первых логических разделов элементов второй структуры данных и особые семантические части вторых логических разделов элементов второй структуры данных и формируют базу данных особых семантических частей логических разделов элементов второй структуры данных путем перемещения упомянутых особых семантических частей в упомянутую формируемую базу данных особых семантических частей логических разделов элементов второй структуры данных;
в упомянутых вторых семантических частях упомянутых вторых логических разделов элементов второй структуры данных идентифицируют, по меньшей мере, уточняющие структуры вторых семантических частей вторых логических разделов; и осуществляют лингвистические преобразования над всеми семантическими частями, за исключением упомянутых особых семантических частей упомянутых первых и вторых логических разделов, для формирования грамматически и орфографически верных семантических частей логических разделов элементов второй структуры данных; и
формируют из первых грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных и упомянутых грамматически и орфографически верных уточняющих структур вторых семантических частей вторых логических разделов элементов второй структуры данных смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов третьей структуры данных; и формируют результирующую структуру данных структурированного исходного массива данных, содержащую элементы результирующей структуры данных, причем упомянутые элементы результирующей структуры данных представляют собой логические конструкции, содержащие упомянутые грамматически и орфографически верные семантические части логических разделов элементов второй структуры данных.5. The method according to p. 4, characterized in that it further comprises stages in which:
identify the original data structure of the original structured data array; identify elements of the original data structure; identifying the first logical partitions of said elements of the original data structure and the second logical partitions of said elements of the original data structure; and form the first data structure of the structured source data array containing the elements of said first data structure, said elements of the first data structure containing first logical partitions and second logical partitions;
identifying elements of a first data structure containing one of said first logical partitions and elements of a first data structure containing one of said second logical partition; identifying elements of a first data structure containing more than one of said first logical partitions, and elements of a first data structure containing more than one of said second logical partition; in the elements of the first data structure containing more than one of said first logical partitions, and in the elements of the first data structure containing more than one of said second logical partitions, logical relationships between said first logical partitions or between said second logical partitions are identified; in the elements of the first data structure containing more than one of said first logical partitions, and in the elements of the first data structure containing more than one of said second logical partitions, elements of the first data structure that do not have a logical connection between logical partitions are identified; and form a database of logical relationships of logical partitions of the elements of the first data structure;
form logical constructions of logical partitions of elements of the first data structure using information from a database of logical relationships of logical partitions of elements of the first data structure and logical partitions of said elements of the first data structure containing one of the first logical partitions and logical partitions of said elements of the first data structure containing one said second logical section; and form a second data structure of the structured source data array containing elements of the second data structure, said elements of the second data structure being formed logical structures of logical partitions of the first data structure;
identify the first logical partitions of the elements of the second data structure and the second logical partitions of the elements of the second data structure; in said first logical sections and second logical sections of the elements of the second data structure, the first semantic parts and the second semantic parts are identified; and in said first and second logical partitions of the elements of the second data structure, at least special semantic parts of the first logical partitions of the elements of the second data structure and the special semantic parts of the second logical partitions of the elements of the second data structure are identified and form a database of special semantic parts of the logical partitions of the elements of the second data structures by moving said special semantic parts to said logically generated database of special semantic parts x sections of the elements of the second data structure;
in said second semantic parts of said second logical sections of the elements of the second data structure, at least the refinement structures of the second semantic parts of the second logical sections are identified; and carry out linguistic transformations over all semantic parts, with the exception of the mentioned special semantic parts of the mentioned first and second logical sections, to form grammatically and spelling-correct semantic parts of logical sections of the elements of the second data structure; and
form semantic combinations of grammatically and spelling correct semantic parts of the second logical sections of the elements of the third data structure from the first grammatically and spelling correct semantic parts of the second logical sections of the elements of the second data structure; and form the resulting data structure of the structured source data array containing the elements of the resulting data structure, said elements of the resulting data structure being logical constructs containing the grammatically and spelling-correct semantic parts of the logical sections of the elements of the second data structure.
один или более процессоров;
один или более модулей ввода/вывода (I/O); и
память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из пп. 1-5 формулы, и содержащую преобразованные или подлежащие преобразованию один или несколько структурированных исходных массивов данных, содержащих, по меньшей мере, текст на естественном языке.6. A device for generating a map of connections of components of grammatically and spelling-correct semantic parts of logical sections of logical constructions of a structured source data array, said structured source data array containing said logical constructions, which are interconnected judgments that are logical sections of logical constructions consisting of the first semantic parts and second semantic parts, with the first semantic parts being cm word kernels of logical sections of logical constructions and consist of elements that are at least subjects of judgments and predicates of judgments, and the second semantic parts consist of at least one or more features of elements of semantic kernels of judgments, while the semantic parts are grammatically and spelling correct due to linguistic transformations, the device comprising at least:
one or more processors;
one or more input / output (I / O) modules; and
a memory containing program code, which upon execution causes said one or more processors of said device and / or device associated with said device to perform method steps according to any one of claims. 1-5 formulas, and containing converted or to be converted one or more structured source data arrays containing at least natural language text.
одно или более устройств, выполненных в виде устройств по любому из пп. 6 или 7 формулы;
один или несколько серверов, обеспечивающих регулирование обменом данных в упомянутой системе;
одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;
одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных.8. A system for generating a map of relationships between components of grammatically and spelling-correct semantic parts of logical sections of logical structures of a structured source data array, said structured source data array containing said logical structures that are interconnected judgments that are logical sections of logical structures consisting of the first semantic parts and second semantic parts, with the first semantic parts being meaning core kernels of logical sections of logical constructions and consist of elements that are at least subjects of judgments and predicates of judgments, and the second semantic parts consist of at least one or more attributes of elements of semantic kernels of judgments, while the semantic parts are grammatically and spelling correct due to linguistic transformations, moreover, the system contains at least:
one or more devices made in the form of devices according to any one of paragraphs. 6 or 7 formulas;
one or more servers providing regulation of data exchange in said system;
one or more databases for storing data configured to interact with said one or more devices;
one or more data transmission networks through which said devices, servers and databases interact.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2014126199/08A RU2571407C1 (en) | 2014-06-27 | 2014-06-27 | Method to generate map of connections of converted structured data array components |
PCT/RU2015/000392 WO2015199581A2 (en) | 2014-06-27 | 2015-06-25 | Method for preliminary conversion of initial mass of data, method for forming map of connections between components of parts of logical constructs of a converted structured initial mass of data, method for searching a converted mass of data using a component connections map, and systems and devices for implementing said methods |
EA201700031A EA201700031A1 (en) | 2014-06-27 | 2015-06-25 | METHOD first converting the original data files, METHOD FOR FORMING RELATIONSHIPS MAP components often STRUCTURED logical constructions convert the original data files, a method of searching in the transformed data sets using the card RELATIONS components and systems and apparatus for implementing these methods |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2014126199/08A RU2571407C1 (en) | 2014-06-27 | 2014-06-27 | Method to generate map of connections of converted structured data array components |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2571407C1 true RU2571407C1 (en) | 2015-12-20 |
Family
ID=54871349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2014126199/08A RU2571407C1 (en) | 2014-06-27 | 2014-06-27 | Method to generate map of connections of converted structured data array components |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2571407C1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2708213C1 (en) * | 2019-01-09 | 2019-12-04 | Олег Владимирович Постников | Method of changing information on a search results page and a method of performing operations on text fragments |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EA002016B1 (en) * | 2001-04-06 | 2001-10-22 | Лев Лазаревич Матвеев | A method of searching for fragments with similar text and/or semantic contents in electronic documents stored on a data storage devices |
-
2014
- 2014-06-27 RU RU2014126199/08A patent/RU2571407C1/en active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EA002016B1 (en) * | 2001-04-06 | 2001-10-22 | Лев Лазаревич Матвеев | A method of searching for fragments with similar text and/or semantic contents in electronic documents stored on a data storage devices |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2708213C1 (en) * | 2019-01-09 | 2019-12-04 | Олег Владимирович Постников | Method of changing information on a search results page and a method of performing operations on text fragments |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2564629C1 (en) | Method of clustering of search results depending on semantics | |
US8341167B1 (en) | Context based interactive search | |
US9678949B2 (en) | Vital text analytics system for the enhancement of requirements engineering documents and other documents | |
KR20220059526A (en) | A cross-document intelligent authoring and processing aid | |
Lupiani-Ruiz et al. | Financial news semantic search engine | |
RU2544739C1 (en) | Method to transform structured data array | |
US10503830B2 (en) | Natural language processing with adaptable rules based on user inputs | |
US10810643B2 (en) | Method and system for request for proposal (RFP) response generation | |
US20090259670A1 (en) | Apparatus and Method for Conditioning Semi-Structured Text for use as a Structured Data Source | |
US20130332454A1 (en) | Dictionary entry name generator | |
de Almeida Ferreira et al. | RSL-PL: A linguistic pattern language for documenting software requirements | |
RU2571405C1 (en) | Method for preliminary conversion of structured data array | |
Quirchmayr et al. | Semi-automatic rule-based domain terminology and software feature-relevant information extraction from natural language user manuals: An approach and evaluation at Roche Diagnostics GmbH | |
US11921763B2 (en) | Methods and systems to parse a software component search query to enable multi entity search | |
Bryl et al. | Interlinking and knowledge fusion | |
Chen et al. | An automatic method for extracting innovative ideas based on the scopus® database | |
Ashfaq et al. | Natural language ambiguity resolution by intelligent semantic annotation of software requirements | |
RU2571407C1 (en) | Method to generate map of connections of converted structured data array components | |
RU2572367C1 (en) | Method of searching for information in pre-transformed structured data array | |
RU2571406C1 (en) | Method of double-level search of information in previously converted structured data array | |
Dixit | Mastering Elasticsearch 5. x | |
Forcher et al. | Semantic logging: Towards explanation-aware das | |
WO2020026229A2 (en) | Proposition identification in natural language and usage thereof | |
WO2015199581A2 (en) | Method for preliminary conversion of initial mass of data, method for forming map of connections between components of parts of logical constructs of a converted structured initial mass of data, method for searching a converted mass of data using a component connections map, and systems and devices for implementing said methods | |
Vileiniškis et al. | Searching the web by meaning: a case study of Lithuanian news websites |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PC41 | Official registration of the transfer of exclusive right |
Effective date: 20171110 |