Brochures y lenguajes documentales archivistica">
Lenguajes Documentales
Lenguajes Documentales
Lenguajes Documentales
Lenguajes documentales
Principales tipos de clasificacin
Encabezamientos de materia,
descriptores y tesauros
Fecha: 11/04/09
Lenguajes documentales
La produccin documental ha aumentado exponencialmente en los ltimos
aos, algo que ha generado nuevas necesidades, nuevos sistemas y tcnicas
de tratamiento documental. Los lenguajes documentales surgen de la
necesidad de conseguir que el emisor y el receptor de la informacin lleguen a
el entendimiento en un contexto en el cual cada vez hay ms material y, por lo
tanto, ms ruido que dificultan la comunicacin. De ah la necesidad de crear
cdigos como elementos secundarios, nuevos productos a partir de la obra
original. Esa respuesta anticipada a un riesgo potencial de falta de
comunicacin constituye de hecho la esencia de todo el esfuerzo del anlisis
documental.
El proceso se podra representar de la siguiente manera: el autor crea la obra
con un cdigo determinado, el analista (o agentes software de informacin) lo
traduce a su cdigo (adaptado para la bsqueda y recuperacin de la
informacin) y el receptor utiliza ese nuevo cdigo para encontrar la obra
original.
Los lenguajes documentales son, pues, los que establecen la comunicacin
entre el documento original y el usuario, haciendo de puente o intermediario
entre las informaciones contenidas en los documentos y las informaciones
solicitadas por los usuarios.
Definicin de lenguaje documental
C. Guinchat y M. Menou (1984) definen los lenguajes documentales como
lenguajes convencionales utilizados por una unidad de informacin para
describir el contenido de los documentos para almacenarlos y recuperar las
informaciones".
Blanca Gil Urdician (1996) entiende por lenguaje documental "todo sistema
artificial de signos normalizados, que facilitan la representacin formalizada del
contenido de los documentos para permitir la recuperacin, manual o
automtica, de informacin solicitada por los usuarios.
Quizs la definicin ms ajustada de lenguaje documental sera la de sistema
artificial de signos utilizados en las operaciones de indizacin que permite la
representacin de contenido documental para su posterior recuperacin,
sirviendo como medio para la interrogacin, recuperacin y difusin de
informacin pertinente para el usuario. Al fin y al cabo, la finalidad ltima de los
lenguajes documentales es la generacin del conocimiento en el usuario, algo
que slo ser posible si ste consigue llegar al documento primario.
El lenguaje documental es considerado objeto de estudio de la lingstica
documental, cuyas bases tericas proceden de disciplinas como la lingstica,
Analysis System, por ejemplo, y confiando en el uso preciso del ISSN en los
registros bibliogrficos.
Tipos de lenguajes documentales
Existen diversos criterios de clasificacin de los lenguajes documentales,
aunque los ms generalizados son aquellos que utilizan como criterio el control
ejercido sobre el vocabulario, la coordinacin de los trminos (en qu momento
se combinan los elementos) y la estructura.
Dependiendo del grado de control terminolgico, se pueden distinguir:
Lenguajes libres. Lenguajes fundados en el principio de postcoordinacin,
se componen de trminos no predefinidos que se va generando a partir de la
realizacin de procesos de indizacin. Lenguajes altamente pertinentes,
coherentes, de bajo coste y que proporcionan una enorme cantidad de
resultados cuando se realizan bsquedas. De este tipo son las listas de
descriptores libres y las listas de palabras clave (Uniterm, ndices
permutados, Precis ). Los lenguajes libres no son propiamente lenguajes
documentales puesto que para que reciban este nombre el vocabulario ha
de estar controlado.
Lenguajes controlados. Son lenguajes controlados los lenguajes
documentales propiamente dichos: tesauros, listas de encabezamientos de
materia y clasificaciones. Presentan un vocabulario previamente elaborado,
y admiten un limitado nmero de modificaciones en el momento de su
utilizacin. El vocabulario controlado proporciona al usuario un punto de
bsqueda, en vez de dos o ms, y reduce la posibilidad de que la bsqueda
sea incompleta. Sin embargo, puede perderse alguna informacin debido a
la falta de especificidad y errores en el anlisis.
Dependiendo de la coordinacin de los trminos, en funcin del momento en
que se combinan los elementos que los componen, podemos distinguir:
Lenguajes precoordinados. Combinan los trminos en el momento de la
descripcin. Son lenguajes precoordinados las clasificaciones y las listas de
encabezamientos de materia. En estos sistemas las distintas nociones o
conceptos que se unen para expresar una materia o un tema ocupan un
lugar determinado, es decir se introducen en el momento de la indizacin en
un orden previamente establecido y la recuperacin habr de hacerse
secuencialmente, siguiendo ese orden. Suelen ser muy precisos, pero
tambin muy rgidos.
Lenguajes postcoordinados. Combinan los trminos en el momento de la
recuperacin. Son lenguajes postcordinados los tesauros (lenguaje utilizado
para la indizacin por descriptores), y si incluyramos los lenguajes libres
podemos mencionar tambin las listas de descriptores libres y las listas de
momento, los que aparecieron a finales de los aos sesenta, como Syntol
(Syntagmatic Organization Language) no han tenido demasiado xito.
No corresponde definir todos y cada uno de los lenguajes documentales
existentes en este tema, puesto que no habra ni tiempo ni espacio suficiente
para hablar de todos ellos. De hecho, sera posible dedicar un tema a cada
uno. Por ello, ofreceremos slo una rpida visin de conjunto sobre los
principales tipos de clasificacin, los encabezamientos de materia, descriptores
y tesauros.
10
fueron los primeros reglamentos de este tipo para dar forma a la aplicacin de
la CDU.
En 1939, tan slo unos das despus de finalizada la Guerra Civil, se estableci
la obligatoriedad oficial del empleo de la CDU para la clasificacin de los
fondos de las bibliotecas espaolas, segn la Orden de 29 de julio de ese ao.
Se adopt el "Sistema Decimal: Melvil Dewey modificado por el Instituto
Internacional de Bibliografa de Bruselas y con las correcciones introducidas
por su representacin en Berln", es decir, se adopt la CDU (o el Sistema
Decimal en su 3 edicin internacional, en lengua alemana) siguiendo a
Alemania por la afinidad existente, entonces, entre Espaa y Alemania. El
bibliotecario Javier Lasso de la Vega fue quien inst al nuevo Gobierno para
que legislara y posibilitara esta implantacin oficial de la CDU. Redact la
Orden de 1939, debido a su colaboracin con el nuevo Gobierno tras la Guerra
Civil. Ello le llev a tratar que se adoptara de forma oficial la CDU con las
modificaciones emanadas de Berln, omitiendo las ya publicadas ediciones
internacionales y traducciones de la Clasificacin Decimal que se haban
realizado como la 4 edicin internacional en lengua inglesa de 1936 y la 5 de.
Internacional de 1939 en lengua francesa. Sin embargo, la consumacin de la
implantacin de la CDU se produjo con este decreto de 1939 que recoga una
prctica bibliotecaria que haba tenido plena vigencia durante la ltima dcada.
Finalizada la Guerra Civil desapareci el Gobierno autnomo de la Generalidad
y la Biblioteca de Catalua de nuevo pas a depender de la Diputacin de
Barcelona, al igual que haba ocurrido durante el perodo de Primo de Rivera.
La nueva Administracin Central marc las directrices de las bibliotecas
catalanas, y mediante el citado decreto de 29 de julio de 1939 quedaba
implantada la versin de 1934 de la Clasificacin Decimal Dewey. Pero en
Catalua desde haca ms de una dcada el Sistema Decimal ya se haba
implantado, de forma total, en la red de Bibliotecas Populares a instancia de
Jordi Rubio i Balaguer. En la Biblioteca de Catalua se inici la implantacin
ms tarde, mientras se produca el traslado de sta desde su anterior ubicacin
en el Palacio de la Diputacin, hasta el nuevo edificio del Hospital de Santa
Cruz y San Pablo en el que contina en la actualidad. As las nuevas directrices
en la recin instalada Biblioteca hicieron que en ella se implantara finalmente la
CDU y no la Clasificacin Decimal, con las modificaciones realizadas en 1905
por el Instituto Internacional de Bibliografa. Las Bibliotecas Populares
catalanas, al igual que las restantes del Estado espaol, quedaron sujetas a
esta organizacin de los libros en salas y depsitos, aunque en algunos casos
en los depsitos no qued totalmente implantada, pues en muchas bibliotecas
no existi el acceso directo a los estantes por parte de los usuarios. Sin
embargo, s se hizo uso de la CDU para la ordenacin y distribucin de los
catlogos sistemticos.
11
12
13
Encabezamientos de materia
Un encabezamiento de materia es la expresin lingstica (palabra o conjunto
de palabras) que representa el contenido temtico de un documento y que se
utiliza para hacer bsquedas en un catlogo, bibliografa o ndice. Puede
constar de un elemento, si el tema se expresa con un solo trmino, o de varios
elementos, si el tema se expresa mediante la combinacin de un conjunto de
trminos dispuestos en una cadena segn unas reglas sintcticas
preestablecidas. Esta sintaxis especial es la que precisamente diferencia los
encabezamientos de materia de los descriptores.
En el contexto de los lenguajes documentales, las listas de encabezamientos
de materia (LEM) son lenguajes controlados precoordinados, formados por un
conjunto de trminos extrados del lenguaje natural.
El objetivo principal de una lista de encabezamientos de materia, al igual que
cualquier lenguaje documental controlado, es promover la utilizacin de unas
prcticas indizacin normalizadas dentro de una institucin o entre diferentes
instituciones o entre diferentes servicios de indizacin, principalmente si estas
instituciones o servicios intercambian o comparten la catalogacin o la
informacin bibliogrfica. Estas listas se usan preferentemente en las
bibliotecas nacionales, universitarias, pblicas y municipales, y en aquellas
bibliotecas o centros de documentacin cuyos fondos son esencialmente
enciclopdicos (es decir, no se limitan a un dominio especializado del
conocimiento). Aunque desde el punto de vista terico los centros
especializados podran utilizar listas de encabezamientos, en la prctica suelen
utilizar tesauros.
La catalogacin alfabtica de materias, adems, no se aplica a todo tipo de
documentos: no son objeto de entradas las obras de creacin, las literarias y
las clsicas, porque se considera que su contenido intelectual resulta tan
heterogneo y complejo que sera imposible reducirlo a un simple
encabezamiento de materia. Se supone que se localizan a travs del catlogo
alfabtico de autores o a travs del ttulo. Slo se hace una excepcin: las
antologas o repertorios de obras literarias s que son objeto de indizacin
mediante encabezamiento de materia.
Principios bsicos de la indizacin mediante LEM
Especificidad. Cuando se utiliza una lista de encabezamientos de materia
es necesario seleccionar el trmino existente ms especfico para
representar una determinada nocin. La especificidad est relacionada con
la exactitud mediante la cual una nocin concreta del documento se
encuentra representada por un trmino de indizacin. Cuando una nocin
concreta se encuentra representada por un trmino ms general se produce
una prdida de especificidad. Se han de identificar las nociones de la forma
14
15
16
17
como son los nombres de los personajes bblicos, clanes, casas nobiliries,
dinastas, familias y casas reales, nombres de personajes de ficcin,
legendarios y mitolgicos o dioses y diosas. Las formas correctas de los
nombres personales, de los nombres de entidad, de jurisdicciones y los
ttulos uniformes se establecen de acuerdo con las reglas de catalogacin
utilizadas y adoptan la misma forma que presentaran en el catlogo de
nombres y de ttulos.
Encabezamientos geogrficos. Existen dos tipos de encabezamientos
geogrficos: nombres geogrficos de jurisdicciones polticas y
administrativas y nombres geogrficos no jurisdiccionales. Los nombres
geogrficos de jurisdicciones polticas y administrativas (como nombres de
pases, estados, autonomas, departamentos, provincias, dicesis, ciudades,
etc.) slo constan en la lista cuando se necesita aadir una subdivisin
temtica o cronolgica, como por ejemplo.: Catalunya--Histria--1213-1276,
Jaume I. Los nombres geogrficos jurisdiccionales se construyen segn el
captulo correspondiente de las reglas de catalogacin. Los nombres
geogrficos jurisdiccionales reciben un tratamiento diferente si se utilizan en
la catalogacin descriptiva o en la catalogacin de materias. En la
catalogacin descriptiva se usa, como punto de acceso, el nombre
geogrfico jurisdiccional propio de la poca que contempla la obra, mientras
que en la catalogacin de materias, cuando el nombre del pas, estado,
ciudad, etc. ha cambiado, sin afectar substancialmente el rea geogrfica
cubierta por la jurisdiccin, como punto de acceso de materias slo se usa el
ltimo nombre, sin tener cuento la poca contemplada por el documento. Por
ejemplo.: Sri Lanka [y no] Ceilan. Los nombres geogrficos de
jurisdicciones polticas y administrativas que han cambiado de nombre y que
no abarcan la misma rea geogrfica se pueden usar tambin como punto
de acceso de materia. Por ejemplo: Lle (Regne).
Desde el punto de vista de la estructura formal, los encabezamientos de
materia pueden ser:
Encabezamientos simples o de un solo trmino formados por un
sustantivo o un adjetivo sustantivado. Los nombres que representan objetos
concretos generalmente se citan en plural y los nombres que representan
conceptos abstractos aparecen en singular, ej.: Gossos; Filosofia.
Encabezamientos formados por un sustantivo seguido de un adjetivo, ej.:
Literatura barroca
Encabezamientos formados por dos sustantivos unidos por una
conjuncin que normalmente representan temas o conceptos relacionados,
encontrados o que establecen una relacin de causa y efecto, ej. Esglsia i
Estat
18
19
20
Tesauros y descriptores
La explosin de la informacin, su diversificacin y especializacin,
desbordaron la capacidad de los lenguajes clasificatorios para representar y
recuperar el contenido de los documentos. La aparcin del sistema Unitrmino
de Taube (1951-1953), la elaboracin del ndice KWIC de Luhn (1959) y la
indizacin por conceptos (descriptores) de Mores (1960) revolucionaron las
tcnicas de inizacin y pusieron las bases tericas y metodolgicas para la
creacin en los aos 60 de los primeros tesauros.
Definicin de tesauro
A partir de la norma UNE 50106:1990, Directrices para la creacin y desarrollo
de tesauros (equivalente de la ISO 2788:1986) los tesauros se pueden definir
segn su funcin y segn su estructura:
Por su funcin, se pueden definir como instrumentos de control
terminolgico. Controlar el vocabulario significa identificar dentro de un
campo semntico todos los conceptos que son representados por ms de un
trmino. La identificacin de trminos equivalentes hace posible minimizar la
21
22
Etnografa
TR Etnolingstica
Lingstica
TE Etnolingstica
Sociolingstica
23
Contador
USE Contable
Contable
UP Contador
24
25