lunes, 17 de marzo de 2014

1.1.3. Índexs d'arxiu: actualització.


Indexació és el procés pel qual són enregistrades ordenadament dades i informació per construir el seu índex, que facilita la recerca d'informació i ajuda a seleccionar la informació més rellevant d'acord amb les característiques dels usuaris amb major completesa.

Indexació
El contingut conceptual dels documents es representa per mitjà d’un conjunt de símbols o paraules de llenguatge natural, les quals poden procedir d’una col·lecció predeterminada o ser paraules rellevants del mateix contingut del document.

La indexació es fa per mitjà dels anomenats llenguatges d’indexació. N’hiha de dos tipus:

• Llenguatges lliures.
• Llenguatges controlats.

Indexació lliure

1)Llenguatges lliures

Els llenguatges lliures poden estar formats per les llistes de paraules clau i els descriptors lliures.

a) Llista de paraules clau: és una col·lecció de paraules rellevants, extretes automàticament per l’ordinador, del títol, del resum o bé del text complet del document. En aquest procés s’exclouen les paraules sense significació, com ara articles, preposicions, etc., també denominades paraules buides.

D’altra banda, i com a avantatge d’aquest sistema, cal esmentar que, com que aquesta llista comprèn tots els mots significatius del document, la recerca es pot afinar per a paraules molt específiques.

b) Descriptors lliures: són una col·lecció o llista de conceptes extrets del contingut del document o que hi tenen relació mitjançant una operació intel·lectual, és a dir, procedent de l’anàlisi del document per una persona qualificada (el documentalista).

2)Llenguatges controlats

En aquests tipus de llenguatge, les paraules o conceptes que serveixen per indexar un document formen part d’una llista construïda prèviament. És a dir, que abans de començar a indexar documents, es crea una col·lecció o llista de conceptes o paraules en la qual ens haurem de basar per indexar el document.

Els descriptors són paraules o expressions compostes que permeten la indexació del document. Aquests descriptors els extreu el documentalista, a partir de l’anàlisi del document, d’una llista definida prèviament i que és l’única font autoritzada. Aquests descriptors permeten la indexació del document.

La llista d’autoritat és un conjunt predefinit i limitat de noms i expressions.

En la seva preparació s’eliminen al màxim els problemes de sinonímia i de polisèmia (diferents significats de la paraula en funció del context). El volum que necessita per emmagatzemar les referències és més petit que
en els llenguatges lliures.

El tesaure també és un conjunt predefinit, limitat i sobretot estructurat de noms i expressions. Les seves característiques redueixen al màxim els problemes de precisió amb el llenguatge, cosa que facilita notablement les recerques.

En resum, un descriptor és la llista de paraules o expressions que pertanyen al llenguatge controlat. De tota manera, per extensió, i tot i que no és gaire correcte, també s’anomenen descriptors les dels llenguatges no controlats (llistes de paraules clau i descriptor lliure)

No hay comentarios:

Publicar un comentario