
\chapter{Tudásszervezési rendszer}

A tudásszervezési rendszer funkcióját, szerepét az archívumok világában már korábban megadtuk. Akármilyen tudásszervezési rendszert is használjunk, a keresés teljes folyamatában ezeknek ugyanaz a szerepük: segítségükkel tudjuk a dokumentumokat valamiféle módon egységesen tartalmilag leírni, és ennek eredményeként a dokumentumok tartalmi szempontok alapján is kereshetőkké válnak. A tudásszervezési rendszerek elsősorban azáltal segítenek, hogy egységesítik a tartalmi leírás nyelvét. Egy, a keresést támogató nyelvet, egyfajta szótárat nyújtanak nekünk, hogy ugyanazokkal a szavakkal, nyelvi elemekkel írhassuk le a dokumentumainkat, és ezáltal egymáshoz rendelhessük az egymáshoz hasonló egységeket. A tudásszervezési rendszerek másodlagos haszna pedig abban rejlik, hogy meg tudják mutatni nekünk önmagukban a ,,szótár'' szavai közti kapcsolatokat is, és ezáltal még a dokumentumok tényleges keresését megelőzően segíthetnek minket megtalálni a legpontosabb keresőkérdést, tárgyszót, amely segítségével aztán megkereshetjük a nekünk szükséges dokumentumot is. Ebben az értelemben a tudásszervezési rendszerek az előzetes navigáció lehetőségét bizosítják.\footnote{A tudásszervezés, az osztályozás kérdéseit, problémáit, történeti fejlődését elemzi: [György 2002] 143-232.o. Az osztályozás, a könyvtártudomány, az információvisszakeresés meghatározó személyeit, történeti forrásait mutatja be: [Ungváry \& Orbán 2001].}

Ez a tartalmi leíró munka ma már lehet emberi vagy automatikus. A szakemberek által elvégzett tartalmi feltárás jó minőséget ígér, de az élőmunka-igénye miatt nagyon drága, a gépi feltárás olcsóbb, de a minőségével egyelőre még vannak gondok. A jövő nyilván az automatikus tartalmi feldolgozásé, de a tudásakvizíció, a gépi tudásszerzés, tudáskinyerés technikái (mint például az autoklasszifikáció, a dokumentumtipizálás és -kivonatolás, az automatikus tárgyszavazás, a szemantikai komponensek gépi felismerése stb.) ma még nem elég megbízhatóak. 

Az osztályozással, katalogizálással, tipizálással foglalkozó szakmák már évszázadok óta foglalkoznak az osztályozás, automatikus osztályozás elméleti és gyakorlati kérdéseivel, aztán a kilencvenes évek második felében a különböző terminuslisták, osztályozási rendszerek, tezauruszok, szótárak, névkataszterek, tárgyszólisták stb. közös fölöttes kategóriájaként jelent meg a tudásszervezési rendszer fogalma. Azért nevezik ezeket így, mert adott tudásterületen (mikrovilágon) belül ezen rendszerek mindegyike megpróbál valamilyen kapcsolatrendszert, valamilyen rendet, valamilyen szerveződést leírni, rögzíteni az adott tudásterület fontosnak tartott kategóriái között. A tudásszervezési rendszerek nyelvi erőforrások, melyek alkotóelemei a következők:

\begin{itemize}
\item a rendszer -- természetes nyelven alapuló -- elemei (lexikai egységei, deszkriptorai, kategóriái),
\item a rendszer részei (pl. azonos hierarchikus szinten levő elemek halmaza vagy egy adott osztály vagy típus alá rendelt elemek összessége, ,,nemzettsége''),
\item az elemek közötti -- minősített vagy nem minősített -- relációk.
\end{itemize}

A tudásszervezési rendszer a természetes nyelv elemeiből építkezik. Ezzel a tulajdonsággal azonban minden tudásszervezési rendszer rendelkezik, és ennek alapján nem tudunk az egyes altípusok között különbséget tenni. Az eltéréseket csak azzal magyarázhatjuk meg, hogy a tudásszervezési rendszerek különböző típusai más és más módon kezelik a természetes nyelvi egységek között érvényesülő, érvényesített relációkat. Az elemek közti kapcsolatok kezelése lényegében háromféleképpen történhet. Egyszerű listákat (tömböket), egynemű kapcsolatot kezelő osztályhierarchiákat, illetve töbszörös viszonyokat is megengedő (és reprezentálni képes) hálós szerkezeteket tartalmazó rendszereket különíthetünk el egymástól.

A tudásszervezési rendszerek valamely tudásterület természetes nyelven kifejezett elemeiből (szavakból, kifejezésekből), illetve az elemek közötti kapcsolatokból építkező rendszerek. Ha az egyszerűség kedvéért a szavak és kifejezések különbségeitől eltekintünk, és a továbbiakban ezekre egységesen a szó kategóriáját használjuk, akkor felvetődik a kérdés, hogy mi az azonosság és mi a különbség a tudásszervezési rendszerek, illetve azok részei és a természetes nyelv, illetve azok mondatai között? A közös vonás bennük az, hogy mindkét rendszer a természetes nyelv szavaiból építkezik, a különbség köztük a szavak halmazán elvégzett műveletek eltérő minőségéből adódik. A mondatok képzését ugyanis a szavak egymás mellé illesztésével, azaz a konkatenáció műveletével végezzük, illetve a mondatokat központozási jelek segítségével tagoljuk  úgy, hogy közben mindvégig adott szintaktikai és szemantikai szabályokhoz igazodunk.\footnote{A mondatok tagolásán a különböző mondatok egymástól történő elhatárolását, illetve az egyes mondatok belső szegmentálását, részekre osztását értjük.} A konkatenáció művelete azonban csak lineáris építkezést tesz lehetővé, azaz nem tud mást, mint a szavakat sorba rendezni, és emiatt a mondat egyes szavai közt esetleg létező más relációk jelzésére, kezelésére nem alkalmas. A tudásszervezési rendszer viszont azáltal, hogy a rendszer elemein kívül a szavak közti relációkat is külön atomi egységként kezeli, egy-egy rendszerelemhez többfajta reláció mentén képes más egységet kötni.

Nézzünk meg egy példát! Vegyük a következő természetes nyelvű mondatot:
\begin{predexample}
\item[(p30)]	A kutya és a macska a ragadozó emlős állatok osztályába tartozik.
\end{predexample}

Ezt a mondatot tezaurusz részleteként a következő módon jeleníthetjük meg (a két tétel teljes környezetének megjelenítése helyett csak egy-egy sorral imitálva az egységekhez tartozó kapcsolatokat):

\begin{predexample}
\item[(p31)]	KUTYA\\
F\hspace{0.5cm}Ragadozó emlős állat
\newline\newline
MACSKA\\
F\hspace{0.5cm}Ragadozó emlős állat
\end{predexample}

Ha a fenti két tezaurusztételt átforgatnánk nem hétköznapi módon formált, természetes nyelvű állításokra, a következő mondatokat kapnánk (két lehetséges ,,átírást'' is bemutatva):

\begin{predexample}
\item[(p32a)]	A kutya generikus fölérendeltje a ragadozó emlős állat. A macska generikus fölérendeltje a ragadozó emlős állat.\\
\end{predexample}

\begin{predexample}
\item[(p32b)]	A kutya a ragadozó emlős állatok osztályába tartozik. A macska a ragadozó emlős állatok osztályába tartozik.
\end{predexample}

Fenti példáink azt szemléltetik, hogy a tezaurusztételekből mindig előállíthatunk hagyományos (szöveg)mondatokat, míg fordítva ez nem igaz, és a hagyományos mondataikból (mint amilyen a (p30)-s példánk) nem tudunk minden -- egyébként benne rejlő -- információt kinyerni. A tudásszervezési rendszerből (példánkban a tezauruszból) mint speciális szövegtípusból viszont a strukturáltsága révén könnyen lehet többletinformációt kiszedni. Ez adja az erejét.  Lássuk tehát a fogalom meghatározását.

\begin{deftitle}
tudásszervezési rendszer
\end{deftitle}
\begin{defbody}
Archívumok, dokumentumok tartalmi leírására alkalmas deszkriptorok $D$ halmazán értelmezett $R_1, R_2, \dots, R_n$ relációk $KOS$ adatbázisát \textit{tudásszervezési rendszernek} nevezzük.
\end{defbody}
\begin{defformula}
$KOS = <D, R_1, R_2, \dots, R_n>$
\end{defformula}
\begin{defexample}
\item[(KOS1)] USA Kongresszusi Könyvtár Névautorizációs állománya
\item[(KOS2)] Getty földrajzi tezaurusz	
\item[(KOS3)] ETO osztályozási rendszer	
\item[(KOS4)] SUMO csúcsontológia	
\end{defexample}

A tudásszervezési rendszerekről szóló gondolatmenet összegzéseként újra hangsúlyozzuk azt a rendkívül fontos tényt, hogy a tartalmi leíró tevékenység és a tudásszervezési rendszerek megjelenésével a dokumentumgyűjtemények mellett megjelenik két új, a dokumentumok világától teljesen független információs tartomány, amelyek önállóan is kereshetők, menedzselhetők.

A tudásszervezési rendszer általános fogalma után érdemes áttekinteni, mit tudunk mondani az ilyen rendszerek típusairól.

\section{Terminuslista}

A tudásszervezési rendszerek legegyszerűbb típusa és használati módja az, amikor valamilyen egyedtípus vagy nyelvi kategória konkrét megjelenési formáit, előfordulásait listázzuk. Ezek legfőbb célja az, hogy általuk egyértelmű -- kontrollált -- választási lehetőséget biztosítsunk a dokumentumok valamilyen szempontú leírása számára. Az archívumok ún. ,,authority''-állományai (kötött személynév-listái, testületi név-listái vagy földrajzi név-listái) mind ilyenek. Ebben az esetben egynemű elemeket (neveket) sorolunk fel, és olykor -- általában nem túl sok -- kiegészítő információt is szoktak biztosítani a lista elemeihez.\footnote{Itt érdemes megjegyezni, hogy a kötött névállományoktól gyakran elkülönítve kezelik a földrajzi nevek rendezett listáit, melyeket angolul Gazetteereknek neveznek. Példa: [GNIS]}

Más célúak és tartalmúak azok az egyszerűsített szótárak (glosszáriumok, rövidítés- és betűszójegyzékek), amelyek adott tudásterületre fókuszálva adják meg bizonyos szavak, rövidítések, akronimák feloldását, jelentését, definícióját. Az ilyen rendszerekben tipikus módon egy jelentéssel szerepelnek a szavak, kifejezések. Az igazi szótárak annyival adnak és jelentenek többet egyszerű társaiknál, hogy egyfelől adott szóalak, kifejezés többféle jelentését is megadják, másfelől adott esetben sokkal több kiegészítő, kitekintő információt is hozzárendelnek a szótári tételekhez. Többnyelvű szótárak esetén pedig nyilvánvalóan a szótári tételek idegen nyelvű jelentését, szóalakját is megadják. A szótárak, glosszáriumok azonban -- bár a tudásszervezési rendszerek közé sorolják ezeket is -- számunkra itt nem érdekesek, mivel ezeket nem dokumentumok leírására szokták (lehet) használni.
A terminuslisták belső szerkezete nem túl bonyolult, egyszerű listaként funkcionálnak. Az effajta rendszereket azért vezették be és alkalmazzák mind a mai napig szerte a világon, mert csak ilyen megoldások segítségével lehetséges egységes és konzisztens módon kezelni ezeket az eligazodást támogató információvisszakereső rendszereket. A fogalom definiálása során egyetlen relációként a \textit{lexikografikus rendezési} relációt értelmezhetjük a lista elemein.

\begin{deftitle}
terminuslista
\end{deftitle}
\begin{defbody}
A metaadatelemek $D$ kontrollált tartóhalmaza és a rajta értelmezett $R_{lex}$ lexikografikus rendezési reláció együttesét $KOS_{term}$ \textit{terminuslistának} nevezzük.
\end{defbody}
\begin{defformula}
$KOS_{term} = <D, S, R_{lex}>$, ahol $S$ a kontroll normarendszere 
\end{defformula}
\begin{defexample}
\item[(KOS1)] USA Kongresszusi Könyvtár névautorizációs állománya
\item[(KOS5)] Getty művésznevek egyesített listája
\item[(KOS6)] USA Kongresszusi Könyvtár tárgyszójegyzéke
\end{defexample}

Bár nem szokás a tudásszervezési rendszerek közé sorolni, a fenti definíció (mi több, a KOS-közösség mindennapos gyakorlata) alapján mégis csak azt kell mondanunk, hogy a könyvek \textit{tárgymutatóit, indexeit} is idetartozónak kell minősítenünk. Ha egy kicsit belegondolunk, miként működik egy könyv tárgyszójegyzéke, akkor teljes funkcionális egyezést állapíthatunk meg a terminuslista és a könyv indexe között. Terminusok (tárgyszójegyzék esetén: tárgyszavak) vannak felsorolva -- leggyakrabban ábécé sorrend szerint --, és ezek az elemek össze vannak kötve valamely archívum (tárgyszójegyzék esetén: könyv) adott dokumentumaival (tárgyszójegyzék esetén: a könyv részeivel). Az indexelemek között nincs semmi ,,komoly'' reláció -- ha csak az nem (nagyon ritkán), hogy valamilyen tartalmi vagy formai szempont alapján szűkítve van a lista terjedelme. A ,,klasszikus'' index (könyvindex) persze egyetlen dokumentumhoz van hozzárendelve, és minden egyes könyv esetében más és más lesz az indexelemek tényleges halmaza. Ez az egyetlen komoly különbség a hagyományos terminuslisták és a tárgyszójegyzékek között. Az utóbbiak ugyanis mindig archívumokhoz, vagyis dokumentumgyűjteményekhez kapcsolódnak, ami azt jelenti, hogy a terminusok halmaza ugyanaz marad dokumentumról dokumentumra.

Ez utóbbi különbség is eltűnik akkor, amikor -- már hálózati környezetben -- a szabad szavas keresőszolgáltatások \textit{invertált indexállományait} felépítik és azokat működésbe hozzák. A dokumentumok tartalmainak gépi feltérképezése során minden egyes hálózati dokumentumokról indexállományt készítenek,\footnote{Méghozzá -- a hagyományos indexállományokkal szemben -- teljes körű, vagyis a dokumentum minden szavára kiterjedő tárgyszólistát állítanak össze.} és ezeket az összes dokumentum adatait tartalmazó, egyetlen állományba összesítik, majd elkészítik ennek a hatalmas indexállománynak az inverzét, hogy a tárgyszavakhoz azonnal hozzá tudják rendelni az azokat tartalmazó dokumentumok listáját.\footnote{Innen származik az `invertált index' elnevezés.} Ezzel a megoldással ugyanaz az indexállomány van a dokumentumok összességére vetítve (tehát ebben a vonásában is hasonlít a terminuslistákra), és természetesen minden más jellemzőjében egyszerű listaként működik az egész rendszer.

\section{Taxonómia}

A terminuslisták mindegyikében közös az a vonás, hogy az egyes elemek, tételek között nem rögzítenek és nem fejeznek ki semmilyen kapcsolatot -- leszámítva természetesen a tételek ábécé szerinti megjelenítésében ,,megbúvó'' lexikografikus rendezési relációt. A \textit{taxonómiák} vagy \textit{osztályozási rendszerek} típusába tartozó tudásszervezési rendszerek az egyes tételek, elemek felsorolásán, jellemzésén túl tartalmaznak még a tételek közötti szemantikai relációkra vonatkozó információkat is azáltal, hogy a rendszer elemeit egymásba ágyazódó, kisebb-nagyobb csoportokba, partíciókba, osztályokba sorolják. A metainformációs rendszerek történelmileg legjelentősebb típusai mindenképpen a könyvtári osztályozási rendszerek. A legnagyobb archiválással foglalkozó intézmények, a könyvtárak világában a XIX. század végétől napjainkig világszerte használják az ilyen osztályozási, szakozási rendszereket.

Az osztályozási tevékenység persze nemcsak a könyvtári és tudományos tevékenység, de sok más megismerő, intellektuális, rendszerező munka számára ugyanolyan hasznos segédeszköz, ezért egyáltalán nem meglepő, hogy az osztályozási rendszerek olyannyira elterjedtek a különféle tudásterületeken. Az osztályozási rendszerek ,,népszerűségének'' egyik gyakorlati oka az, hogy azok hierarchikus felépítéséből fakadóan gyorsan lehet a struktúrán belüli elemek között haladni, vagyis -- bizonyos értelemben -- nagyon jó az ilyen rendszrek navigációs képessége. A \textit{monohierarchikus} szerkezet ugyanis fagráffal reprezentálható (amiből már következik, hogy minden pontja között egyetlen elérési útvonal létezik), és épp ezért ez a felépítés egyértelműsége és könnyű szeparálhatósága, bokrosíthatósága miatt relatíve gyors haladást ígér az általa keretbe fogott fogalmak között. A monohierarchikus rendszer fenti előnye mellett van azonban egy igen komoly hátránya, problémája. Ezek a rendszerek ugyanis merevek, rugalmatlanlanok, ami megint csak a monohierarchikus struktúra speciális rendezettségéből fakad. A fogalmak között valóságban létező többértelműséget, a fogalmak közötti többféle kapcsolatok létezését nem lehet egy ilyen rendszerben megfogni, ,,reprezentálni''. Az osztályozási rendszerek monohierarchikus merevsége persze lényege szerint e struktúrákhoz tartozik, tehát nem lehet igazából változtatni ezen a rugalmatlanságon. Az egyetlen ,,oldási lehetőség'' csak azáltal biztosítható, ha bizonyos pontokon megengedjük többszörös kapcsolatok és ezáltal alternatív útvonalak létrejöttét a rendszert alkotó elemek között. A könyvtárosi szakmán belül az ilyen esetekben \textit{polihierarchiáról}, illetve polihierarchikus osztályozási rendszerről szoktak beszélni.\footnote{Meg kell itt jegyezzük, hogy a polihierarchiát hierarchiának tartani némiképp ellentétes más tudásterületek fogalomhasználatával, de a könyvtárosi világban való elterjedtsége okán tudomásul kell venni e kategória létezését és használatbavételét.} A polihierarchikus struktúrában felbomlik az elemek közti útvonalak egyértelműsége, hiszen egy-egy elemnek lehet több ,,fölöttese'' (és ezáltal több, alternatív útvonal alakul ki a rendszeren belül), de a rendszer irányítottsága miatt még ez a szerkezet is majdnem ugyanolyan jó navigációs lehetőségeket biztosít (,,lefelé'' menő irányokban mindenképpen). Polihierarchikus rendszer például az Internet legismertebb osztályozási rendszere, a Yahoo is. A kétfajta hierarchia különbségét szemléltetjük az alábbi ábra segítségével (\ref{fig-shan09} ábra).

\begin{figure}[h]
\centering
\includegraphics[width= \textwidth]{image/shan09.jpg}
\caption{a hierarchia két típusa}
\label{fig-shan09}
\end{figure}

Mindegyik hierarchikus rendszerben egyirányú (irányított) kapcsolatok léteznek, vagyis két elem közül az egyik alá van rendelve a másiknak (és ez a viszony nem megfordítható).\footnote{Ezt az irányítottságot, alárendeltséget fejezik ki a rendszerábrákon az elemeket összekötő vonalak nyilai.} Amíg azonban a monohierarchia esetében a rendszer bármely elemére igaz, hogy csak egyetlen felső kapcsolata létezik (ez biztosítja a navigációs egyértelműséget), addig a polihierarchikus rendszerekben előfordulhat, hogy egy elemnek több fölérendeltje is van (ábránkon ilyen a 6. és 15. számú elem).

A taxonómia definiálásához szükségünk van a ,,hierarchiaképző'' relációra, amit -- az egyszerűség kedvéért -- \textit{hierarchikus alárendeltje} relációnak nevezünk. Az osztályozási rendszerek építése során ezt a relációt sokféle értelemben használják, úgyhogy a reláció gyakorlati használata szemantikai értelemben pongyolának mondható. Emiatt a reláció pontos értelmezése is nehezebb, úgyhogy -- a dolgokat kissé leegyszerűsítve, a részleteket és magyarázatokat elhagyva -- az alábbi definíciót adhatjuk:

\begin{deftitle}
hierarchikus alárendeltje
\end{deftitle}
\begin{defbody}
A $KOS$ tudásszervezési rendszer elemein értelmezett, felső korlátos részben rendezési (tranzitív és antiszimmetrikus) $R_h$ relációt \textit{hierarchikus alárendeltje} relációnak nevezzük.
\end{defbody}
\begin{defformula}
$Dom(R_h) \subset KOS \land Range(R_h) \subset KOS \land R_h$ \textit{részben rendezés}  $\land R_h$ \textit{felső korlátos}
\end{defformula}
\begin{defexample}
\item[(R10)] a Yahoo Directory alárendeltségi relációja
\end{defexample}

A hierarchikus reláció értelmezéséhez érdemes néhány megjegyzést fűznünk. Először is említést érdemel, hogy egzaktabb tárgyalásmódot követve mindig relációpárról kellene beszélnünk, mert a hierarchikus alárendeltség fogalmilag maga után vonja a hierarchikus fölérendeltje reláció létezését,\footnote{Azt mondhatjuk, hogy az egyik reláció a másik inverze.} de ettől -- jelen kontextusban -- eltekintünk. Ugyancsak nem foglalkozunk azzal a kérdéssel, hogy hogyan lehetne pontosítani a hierarchikus alá-, fölérendelési reláció tartalmát (és terjedelmét), megint csak jelezzük, hogy az -- önmagukban precízen definiálható -- generikus, partitív, eleme relációkat nagyon gyakran mind ide sorolják a taxonómiák tényleges építési gyakorlatában. Azt a kérdést sem válaszoljuk meg, hogy miként lehetne a kétfajta hierarchikus rendszer struktúraképző relációját, a mono-, illetve polihierarchikus alárendeltje relációt definiálni és egymástól elválasztani. Végül szintén csak jelezzük, de nem elemezzük részletesebben, hogy a hierarchia igazán egzakt értelmezéséhez szükség lenne még egy másik reláció, a -- szimmetrikus, tranzitív, irreflexív -- inkompatibilitási reláció felvételére is. 

Mivel a taxonómia értelmezéséhez itt elegendőnek tartjuk a hierarchikus alárendeltje reláció felvételét, ezért megadhatjuk a taxonómia meghatározását is.

\begin{deftitle}
taxonómia
\end{deftitle}
\begin{defbody}
A $KOS_{tax}$ tudásszervezési rendszert a rajta értelmezett $R_h$ hierarchikus alárendeltje relációval \textit{taxonómiának} nevezzük.
\end{defbody}
\begin{defformula}
$KOS_{tax} = <D, R_h>$
\end{defformula}
\begin{defexample}
\item[(KOS3)] Univerzális Tizedes Osztályozási rendszer
\item[(KOS7)] Dewey Tizedes Osztályozási rendszer
\item[(KOS8)] USA Kongresszusi Könyvtár Osztályozási rendszere
\end{defexample}

Ahogy azt már említettük, akár a monohierarchikus, akár a polihierarchikus osztályozási rendszerről beszélünk, a rendszer tételei között mindenképpen erősen kötött szerkezetet találunk. Ez a kötöttség, merevség lehet előny is, hátrány is: csak adott feladat, elvárás ismeretében lehet megválaszolni azt a kérdést, vajon vállalható-e vagy sem egy ilyen rendszer rugalmatlansága. Amennyiben rugalmasabb, több irányban navigálható szerkezetre van szükség, más -- bonyolultabb struktúrával -- rendelkező rendszert kell keresni.

\section{Tezaurusz}

A könyvtári világ a taxonómiák mellett használja még a tezauruszokat is, melyek magasabb fokú belső szervezettséggel rendelkeznek az osztályzási rendszerekhez képest. Az első tezauruszt Roget állította össze még a XIX. században, nagyjából az első osztályozási rendszer megszületésével egyidőben.\footnote{Roget könyve 1852-ben jelent meg, s azt azóta is időnként újra kiadják. Lásd: \cite{Roget}} Azóta rengeteg tezauruszt hoztak létre, de a könyvtári világ sosem cserélte le az osztályozási rendszereket a tezauruszok kedvéért. Az okok közül az egyik az a tény lehetett, ami más szempontból az előnyüknek mondható: az ilyen rendszereknek bonyolultabb a belső szerkezetük, ami miatt nehezebb őket építeni és használatba venni. A másik ok pedig talán az, hogy a tezauruszokat mindig csak valamilyen szűkebb tudásterületre lehet igazán jól felépíteni, és ez nem felelt meg a könyvtárak azon igényeinek, amelyek a tartalmi leírás terén univerzális lefedettséget reméltek. De persze szép számmal alkalmaztak és alkalmaznak a jelenben is különböző szakterületeken tezauruszokat, ezért a magyarázatok keresése helyett inkább az ilyen rendszerek belső felépítését vizsgálatával foglalkozunk a továbbiakban.

A tezauruszok elemei, a lexikai egységek ugyanúgy tárgyszavakként, szótári tételekként funkcionálnak, mint bármely más tudásszervezési rendszer elemei. Annyi megszorítás van csak, hogy a tezaurusz lexikai egységeinek nem lehet több jelentése, egészen pontosan a tezauruszba mindig adott jelentés mentén veszik fel a többjelentésű szavakat. Szükség esetén pedig valamilyen megoldással (pl. hátravetett minősítővel) jelzik, hogy melyik konkrét jelentéssel szerepel az adott szóalak a rendszerben. A tezaurusz igazi ,,újdonsága'' azonban a relációk következetes alkalmazásában van. A nemzetközi és magyar szabványokban\footnote{Az alábbi szabványok léteznek ezen a területen: [ISO 5964], [ISO 2788], [MSZ 3418-87], [Z39.19]} pontosan és egyértelműen definiált relációtípusok vannak rögzítve, amelyek segítségével (ezen relációtípusok mentén) a lexikai egységek között jól-strukturált, részhierarchiákból álló szerkezetet lehet megszilárdítani. A \ref{fig-table25}. táblázatban felsoroljuk azokat a relációkat, amelyeket a tezauruszokban elkülönítenek egymástól (feltüntetve az egyértelmű szakmai megnevezésüket, illetve ezek szélesebb körben használt, olykor többértelmű szinonimáit).

\begin{figure}[h]
\centering
\includegraphics[width= \textwidth]{image/table25.jpg}
\caption{A tezaurusz relációi}
\label{fig-table25}
\end{figure}

Ezek a relációk nem függetlenek egymástól, hiszen vannak köztük olyanok, melyek egymás inverzeinek tekinthetőek. A generikus alárendelt és a generikus fölérendelt, a partitív alárendelt és a partitív fölérendelt mindenképpen inverzei egymásnak, az előzménye és a folyománya, illetve a lásd és a helyette relációk pedig sok esetben (bár nem mindig) invertálhatók egymásba.

A szabványban rögzített relációk segítségével a lexikai egységekhez hozzá lehet rendelni a kapcsolódó terminusokat. Mivel többféle reláció létezhet a lexikai egységek között, ebből következően könnyen előfordulhat, sőt gyakran elő is fordul, hogy egy adott lexikai egységhez -- a különböző relációk mentén -- több lexikai egység kapcsolódik. Ez az a mozzanat, ami miatt a tezaurusz szerkezete más, nem olyan ,,egy-szerű'', egynemű, s ebből következően persze nem is olyan merev, mint az osztályozási rendszereké. Utóbbiakban egy elem csak fölé- és alárendeltségi kapcsolatban lehet más elemekkel, ezért a kapcsolatrendszere homogén, az elemek közti relációt ezért meg sem kell nevezni. A tezaurusz egy elemét a hozzá kapcsolódó többi elemmel viszont csak úgy lehet megjeleníteni, hogy kötelezően fel kell tüntetni a relációk nevét (vagy rövid jelét). A tezaurusz egy lexikai egységét -- a példa kedvéért -- az alábbi formában lehet megadni:\\

\begin{tabular}{lll}
\multicolumn{3}{l}{\sf\footnotesize KUTYA}\\
\hspace{0.5cm}&	\sf\footnotesize M:	&\sf\footnotesize Négylábú ragadozó háziállat.\\
&		&\sf\footnotesize Lásd még az állatrendszertant is.\\
&	\sf\footnotesize H	&\sf\footnotesize Eb\\
&	\sf\footnotesize H\&	&\sf\footnotesize Vadászkutya\\
&	\sf\footnotesize HV	&\sf\footnotesize Kutyafélék\\
&	\sf\footnotesize F	&\sf\footnotesize Ragadozó\\
&	\sf\footnotesize A	&\sf\footnotesize Agár\\
&	\sf\footnotesize T	&\sf\footnotesize Falka\\
&	\sf\footnotesize P	&\sf\footnotesize Fog\\
&	\sf\footnotesize R	&\sf\footnotesize Házőrzés\\
&	\sf\footnotesize E	&\sf\footnotesize Ebtenyésztés\\
&	\sf\footnotesize X	&\sf\footnotesize Dingó
\end{tabular}
\\

Ha nem egy lexikai egységre és annak kapcsolatrendszerére figyelünk, hanem az egész tezaurusz szerkezetére koncentrálunk, akkor annyit mondhatunk, hogy az egész rendszer belső szerkezete hálós jellegűvé válik, mivel a lexikai egységek között többféle kapcsolattípust is érvényesíttethetünk. Noha a tezaurusz részrendszerei hierarchikusak maradnak, a tezaurusznak mint egésznek megszűnik a hierarchikus jellege. Ez a tény egyfelől nyilvánvalóan csökkenti a rendszer bejárásának egyértelműségét (és ezzel persze a gyorsaságát), a rendszer navigálhatóságát, másfelől viszont jelentősen növeli a rendszer rugalmasságát, hiszen a rendszer elemi között többféle kapcsolat mentén, többféle irányban lehet haladni.

Említettük, hogy a könyvtári világban a tezauruszok nem tudták kiszorítani az osztályozási rendszereket. A tezauruszokat különféle tudásterületen, szűkebb szakmai területeken kezdték el használni, és mind a mai napig megmaradt a tezauruszoknak egyfajta ,,szakterület-függő'' jellege, ami miattt a tezauruszokra vonatkozó bármifajta példálózás szükségképpen elfogult, ,,félrevezető'' lehet csak, hiszen -- az osztályozási rendszerek világától eltérően -- a tezauruszok között nincs 3-5 olyan rendszer, melyet széles körben elfogadtak volna, és azért sok helyen (mindenhol) használnának. 

A tezaurusz fogalmával kapcsolatban egyébként az is problémát jelent, hogy létezik a gyakorlatban olyan tezaurusz-értelmezés és -használat, amikor tezauruszon voltaképp egy sima szinonimaszótárat értenek, és mindenféle relációt egyszerűen csak asszociatív viszonyként értelmeznek. Ez a kettős jelentéstulajdonítás és használati gyakorlat nem igazán szerencsés, mert a ,,gyenge'' értelmezés (amikor csak szinonima van) jóval kisebb kifejezőerővel rendelkezik. Mi a továbbiakban az ,,erős'' értelemben használjuk a tezaurusz fogalmát, tehát a pontosan megnevezett és elkülönített relációkat kezelni képes rendszerként fogjuk fel.

A tezaurusz mint tudászervezési rendszer meghatározásához arra van szükség, hogy megadjuk a hozzárendelhető relációkat. Ezeket -- bizonyos leegyszerűsítéssel -- a következőképen határozhatjuk meg. A tudásszervezési rendszerek terminusokat (szavakat, kifejezéseket) fognak össze egy struktúrába. Ha a terminusok között relációkat definiálunk, akkor azokat annak segítségével adhatjuk meg, hogy kifejezzük a terminusok terjedelmébe sorolt dolgok (emberek, állatok, tárgyak, állapotok, tulajdonságok, cselekvések, mozgások stb.) közti összefüggéseket.

\begin{deftitle}
generikus reláció
\end{deftitle}
\begin{defbody}
A $KOS$ tudásszervezési rendszer deszkriptor elemein értelmezett, másodrendű, felső korlátos, jobbról egyértelmű, szigorú elrendezési (aszimmetrikus, tranzitív) $R_{gen}$ relációt \textit{generikus} relációnak nevezzük.
\end{defbody}
\begin{defformula}
$Dom(R_{gen}) \subset KOS \land Range(R_{gen}) \subset KOS \land \forall x \forall y \forall P \forall Q(P(x,y) \to Q(x,y)) \land \\ R_{gen}$ \textit{felső korlátos} $\land R_{gen}$ \textit{jobbról funkcionális} 
\end{defformula}
\begin{defexample}
\item[(R11)] kutya \textit{generikus fölérendeltje} ragadozó
\item[(R12)] kutya \textit{generikus alárendeltje} agár
\end{defexample}
A példáinkból egyből kitűnik, hogy a `generikus reláció' terminus nem pontos megnevezés, mert lehet a `generikus alárendeltje' és a `generikus fölérendeltje' relációt is érteni alatta. Az egyszerűség kedvéért a továbbiakban a `generikus reláció' terminus alatt a `generikus alárendeltje relációt' fogjuk érteni.

A generikus relációt még tudtuk ,,egyszerű'' relációtulajdonságok felsorolásával definiálni, ám ez nem minden esetben járható út. A tezauruszok partitív relációját például csak egy kiválasztott mereológiai elmélet tételeinek segítségével határozhatjuk meg (ez az is jelenti egyben, hogy többféle módon is értelmezhetjük ezt a relációt). A mereológiai elméletek bemutatásába itt nem kezdünk bele, elegendőnek tartjuk hivatkozni arra a tényre, hogy szükség van valamely elmélet megfelelő tételeire.\footnote{A partitív reláció formalizálásáról szól: [Simons 1987], [Varzi 1996], magyarul rövid áttekintést ad: [Szakadát 2005b]}

\begin{deftitle}
partitív reláció
\end{deftitle}
\begin{defbody}
A tetszőleges terjedelemmel rendelkező $\top$ tárgyalási univerzum elemeit leíró tudásszervezési rendszer $KOS_{\top}$ részhalmazának deszkriptor elemein értelmezett, elsőrendű $R_{part}$ relációt \textit{partitív} relációnak nevezzük, ha $R_{part}$ kielégíti az $\Omega$ mereológiai elmélet axiómáit.
\end{defbody}
\begin{defformula}
$Dom(R_{part}) \subset KOS_{\top} \land Range(R_{part}) \subset KOS_{\top} \land R_{part} \models \Omega$ 
\end{defformula}
\begin{defexample}
\item[(R13)] kutya \textit{partitív fölérendeltje} falka
\item[(R14)] kutya \textit{partitív alárendeltje} fog
\end{defexample}
A példák megint csak azt mutatják, hogy a partitív relációra is igaz az, amit a generikus reláció kapcsán elmondtunk, hogy ti. csak az alá- vagy fölérendeltséget kifejező minősítéssel együtt lehet pontosan megadni a relációt. Itt viszont nem jelenthetjük ki, hogy a minősítés elhagyásával valamelyik változatát domináns módon kifejezhetnénk, ebben az esetben mindig meg kell adnunk a reláció ,,irányát'' jelző minősítést (vagy pedig használhatjuk helyettük a `része', illetve `egésze' reláció terminusokat).

A tezaurusz következő relációját nem tudjuk megfelelően formalizálni. Egyfelől azért nem, mert -- megítélésünk szerint -- nem is egyetlen relációról (vagy relációpárról) van szó, hanem többről, hiszen a tezauruszszerkesztési gyakorlat ebben a relációban a fogja össze a `követi' és a `következménye' relációt is, ami -- szerintünk -- mást jelent: az egyik oldalon egy időbeli kapcsolatot, a másik oldalon egy oksági kapcsolatot. De másfelől nem is ismerünk olyan formalizálási kísérletet, amely sikeresen próbáná meg az effajta relációkat logikai formulákban leírni. Annyit jegyezhetünk csak meg, hogy ez a reláció a világ időbeli kiterjedéssel rendelkező dolgaira alkalmazható, és emellett a relációba kapcsolt jelenségek időbeli elrendezettségét is feltételezhetjük.

\begin{deftitle}
előzménye, eredete/folyománya, következménye reláció
\end{deftitle}
\begin{defbody}
Az időben zajló jelenségek $\triangle$ halmazának elemeit leíró tudásszervezési rendszer $KOS_{\triangle}$ részhalmazának deszkriptor elemein értelmezett, $R_{rez}$ relációt \textit{előzménye, eredete/folyománya, következménye} relációnak nevezzük, ha két olyan jelenséget kapcsol össze, amelyekre igaz, hogy ha az időben előbb lezajló jelenség létezése feltétele az időben később lezajló jelenségnek.
\end{defbody}
\begin{defformula}
$Dom(R_{rez}) \subset KOS_{\triangle} \land Range(R_{rez}) \subset KOS_{\triangle} $ 
\end{defformula}
\begin{defexample}
\item[(R15)] kutya \textit{rendeltetése} házőrzés
\end{defexample}


A következő relációról is keveset lehet mondani, mert ez a reláció -- már a szabványalkotók szándéka szerint is -- eleve elmosódott élű fogalom, hiszen ebbe a kategóriába szokás sorolni a ,,maradék'' jellegű kapcsolatokat. Erről a relációról tehát csak annyit mondhatunk, hogy hasonlósági relációhoz ,,hasonlít'' (amit viszont a logikában a toleranciarelációval írhatunk le).

\begin{deftitle}
egyéb rokonsága reláció
\end{deftitle}
\begin{defbody}
A tetszőleges terjedelemmel rendelkező $\top$ tárgyalási univerzum elemeit leíró tudásszervezési rendszer $KOS_{\top}$ részhalmazának deszkriptor elemein értelmezett, $R_{xrel}$ relációt \textit{egyéb rokonsága} relációnak nevezzük, ha $R_{xrel}$ toleranciareláció (azaz szimmetrikus és tranzitív reláció).
\end{defbody}
\begin{defformula}
$Dom(R_{xrel}) \subset KOS_{\top} \land Range(R_{xrel}) \subset KOS_{\top} \land R_{part}$ \textit{szimmetrikus} $\land R_{part}$ \textit{tranzitív}
\end{defformula}
\begin{defexample}
\item[(R16)] kutya \textit{egyéb rokonsága} dingó
\end{defexample}

A tezauruszrelációk ,,leggyengébbike'' annyiban lóg ki a sorból, hogy -- szemben a többivel, amelyek mindig deszkriptorok között állnak fel -- a `szinonímája' reláció mindig egy deszkriptor és egy nem-deszkriptor közötti kapcsolatot fejez ki. Viszont a reláció fennállása azt jelenti, hogy a két összekapcsolt terminus terjedelme megegyezik, vagyis ekvivalensek egymással.

\begin{deftitle}
szinonímája reláció
\end{deftitle}
\begin{defbody}
A $KOS$ tudásszervezési rendszer elemein értelmezett, $R_{syn}$ relációt \textit{szinonímája} relációnak nevezzük, ha egy deszkriptor és egy nem-deszkriptor elemet kapcsol össze, miközben a két elem terjedelme megegyezik, vagyis a szinonímája reláció ekvivalencaireláció, azaz szimmetrikus, tranzitív és reflexív.
\end{defbody}
\begin{defformula}
$DOM(R_{syn}) \subset KOS_{+desc} \land Range(R_{syn}) \subset KOS_{-desc} \land R_{syn}$ \textit{szimmetrikus} $\land R_{syn}$ \textit{tranzitív} $\land R_{syn}$ \textit{relfexív}
\end{defformula}
\begin{defexample}
\item[(R17)] kutya \textit{szinonímája} eb
\end{defexample}


A fentebb meghatározott relációk ismeretében már egyszerűen megadhatjuk a tezaurusz definícióját is -- a következőképpen:

\begin{deftitle}
tezaurusz
\end{deftitle}
\begin{defbody}
A $KOS_{tez}$ tudásszervezési rendszert a rajta értelmezett $R_{gen}$ generikus, $R_{part}$ partitív, $R_{rez}$ előzménye/folyománya, $R_{rel}$ egyéb rokonsága, $R_{syn}$ szinonímája relációkkal \textit{tezaurusznak} nevezzük.
\end{defbody}
\begin{defformula}
$KOS_{tez} = <D, R_{gen}, R_{part}, R_{rez}, R_{xrel}, R_{syn}>$
\end{defformula}
\begin{defexample}
\item[(KOS2)] Getty földrajzi nevek tezaurusza
\item[(KOS9)] Art \& Architecture Thesaurus
\item[(KOS10)] NASA Thesaurus
\item[(KOS11)] Thesaurus of Engineering and Scientific Terms
\end{defexample}



\section{Ontológia}
 
Az ezredforduló tájékán a Szemantikus Web Kezdeményezés meghirdette a szemantikai szintű interoperabilitás programját. Hamar kiderült, hogy e cél eléréséhez a világról való tudásunkat reprezentálni képes ontológiák alkalmazására van szükség. Az elmúlt években szerte a világon egymás után jelentek meg a különféle ontológia-építő projektek. Egy formális ontológia építése során két kérdésre kell válaszolnunk: mit tegyünk bele az ontológiánkba, és hogyan építsük fel az ontológiánk tartalmát.

Az ontológia fogalma persze közel sem újkeletű, hiszen a filozófiában többezer éves hagyománya van a létezés kategoriális kérdéseinek. A filozófiai ontológiáktól való megkülönböztetés végett pontosabb lenne a formális (esetleg ipari) ontológia kifejezés használata, de -- mivel itt nem foglalkozunk sem a filozófiai ontológiákkal, sem a filozófiai és ipari ontológiák részleges átfedését jelentő kategoriális kérdésekkel, ezért -- a továbbiakban a jelző nélküli terminust alkalmazzuk.

Az ontológiaépítés tartalmi oldalról egyet jelent azzal a kérdéssel, hogy a világ milyen entitásait (illetve ezek leíró fogalmait) ismerjük el létezőnek, más szavakkal: milyen ontológiai elkötelezettségek mentén rögzítjük a világot leíró fogalmainkat. Az ontológiákat eddig nem sorolták a tudásszervezési rendszerek közé, de ennek inkább az lehetett az oka, hogy a mérnökök, informatikusok kezdték el inkább alkalmazni ezt az ,,új'' fogalmat, míg a tudászervezési rendszerek kategóriája inkább a könyvtárosi, osztályozáselméleti szakmák képviselői között voltak használatban. Az ontológiák különösségéhez lehetne talán sorolni azt a szándékot, hogy nyelvfüggetlennek gondolt fogalmak rendszerét akarják felépíteni, míg a tudásszervezési rendszerek világában ez az igény sohasem jelent meg igazán komolyan. De a nyelvfüggetlen építkezés igénye, sőt a szándék megvalósulása sem jelent igazán lényeges különbséget, mert -- a számunkra itt szükséges elemzési mélységben -- elhanyagolható az a problémakör, hogy még a teljes mértékben nyelvfüggetlen módon felépített ontológiák esetében is mindig szükség van nyelvi kötésekre, vagy legalábbis egy nyelvi rétegnek az ontológiára illesztésére, amely már pontosan úgy működik, mint egy rögzített nyelvű tudásszervezési rendszer. 

Az ontológia tehát -- a dolgokat némileg leegyszerűsítve -- pont olyan, mint a tudásszervezési rendszerek. Valamilyen, a fogalmi rétegre illesztett, nyelvi réteg kifejezései adják az elemkészletet, és ezen a halmazon -- részben az ontológiahasználati céloktól, részben az ontológiaépítők elkötelezettségeitől függően -- relációk vannak értelmezve. De éppen azért, mert az ontológiák relációit az építés során kell definiálni, ezért előzetesen és definíciószerűen nem tudjuk ezeket rögzíteni -- úgy, ahogy például a tezauruszoknál ezt meg lehetett tenni. Az ontológiák kapcsán csak metaszintű relációkat lehet rögzíteni, bár ezek is mind az építők ontológiai elkötelezettségeitől függenek. Egy ilyen metaszintű ontológiamodellt mutatunk be a következő ábrán, melyen csak azok a metafogalmak vannak feltüntetve, melyek még bármely konkrét ontológia legelső ,,saját'' fogalma előtt ,,létezőnek'' ismertünk el (\ref{fig-meo01} ábra).\footnote{Erről bővebben lásd: [MEO-projekt]}

\begin{figure}[h]
\centering
\includegraphics[width= \textwidth]{image/meo01.jpg}
\caption{az ontológia modellje}
\label{fig-meo01}
\end{figure}

Ha az ontológiamodell alapján kezdenénk el ontológiát építeni, akkor a fogalmak adott nyelvi képén az ontológiában definiált, illetve a metaszinten a rendszerbe ,,égetett'' relációk formálnák ki a konkrét ontológia konkrét struktúráját. Épp ezért -- ahogy azt már korábban leírtuk -- nem lehet előzetes definíciót adni az ontológia fogalmára. Amit tehetünk, az annyi, hogy a \ref{fig-meo01} ábra alapján szövegesen is rögzítjük az ontológiaépítéshez szükséges metafogalmakat.

\begin{deftitle}
ontológia
\end{deftitle}
\begin{defbody}
A matematikai relációértelmezésekre támaszkodó, metaszinten értelmezett metarelációk, metatulajdonságok, műveletek és primitív típusok segítségével szabadon definiálható relációfogalmak, osztályfogalmak, attribútumok és szabadon felvehető másodrendű relációk együttesét ontológiának nevezzük.
\end{defbody}
\begin{defformula}
$KOS_{ont} = <\{Rel^i_{meta}\}, \{Prop^j_{meta}\}, \{Op^k_{meta}\}, \{Rel_m\}, \{Class_n\}, \{Attr_p\},  \{Rel^q_{2nd}\}>$
\end{defformula}
\begin{defexample}
\item[(KOS4)] SUMO csúcsontológia
\item[(KOS12)] OpenCyc
\item[(KOS13)] Dolce
\item[(KOS14)] MEO
\end{defexample}

A fenti ontológiameghatározásba nem vettük fel a nyelvi réteget, illetve annak a fogalmi réteghez történő kapcsolódását, mert nem akartuk még bonyolultabbá tenni a definíciót, de természetesen minden gyakorlatban működő ontológiának szüksége van valamilyen nyelvi kötésre, tehát a rendszer része kell legyen valamilyen nyelvi réteg.

\section{Folkszonómia}

A hálózati média fejlődésében a web 2.0 ,,mozgalom'' feltűnésével egyidőben (vagy talán már egy kicsit azt megelőzően) jelentek meg azok a szolgáltatások,\footnote{Web 2.0 néven jelölik az olyan hálózati szolgáltatásokat, melyekben meghatározó szerep jut a felhasználóknak. A témáról kicsivel bővebben szót ejtünk majd könyvünk második részében.} melyek hátterében olyan speciális alkalmazások voltak, melyeket \textit{közösségi szoftvernek} (social software) neveztek. Ezek segítségével adott szolgáltatás felhasználói szabadon jellemezhetnek, ,,osztályozhatnak'' weboldalakat, fényképeket, zeneszámokat úgy, hogy a tartalomelemekhez hozzárendelik az általuk relevánsnak tartott fogalmakat. Mivel minden tevékenységet a felhasználók végeznek, ezért, miközben leírják a választott tartalmakat, egyszerre hozzák létre a leíró kategóriákat (vagyis a tudásszervezési rendszer, pontosabban a taxonómia elemeit), illetve a dokumentumokat jellemező metainformációs egységeket -- anélkül, hogy bármihez vagy bárkihez igazodnának (pontosabban igazodniuk kellene).

A jelenség azonnali pozitív hozadéka az lett, hogy rendkívül rövid idő alatt hatalmas méretű metainformációs rendszerek tudtak ilyen módon létrejönni, mert a felhasználók önmagukban elhanyagolhatónak számító munkái egymással összeadódva könnyen és gyorsan jelentős méretűvé váltak. Az osztályozási rendszer kialakításának, illetve a dokumentumok osztályokba sorolásának  nehézkes és lassú munkáját a sok önkéntes rendkívül hatásosan és eredményesen végezte. Persze azonnal megjelent az ellenérzés és az a kritika a jelenséggel szemben, hogy a laikusok által megalkotott leíró fogalmi kategóriák nem megfelelőek, mert, még ha az általuk készített rész-kategóriarendszerek önmagukban elfogadható minőségűek is (az osztályzási rendszerekkel szemben támasztott szakmai követelményekhez igazodva), összességükben, tehát egyben kezelve az összes elemet, a teljes rendszer már biztosan nem lehet megfelelő szakmai szempontból. Mivel pedig az osztályozási rendszerekhez hasonlónak látszottak, ezért olyan neveket ragasztottak rájuk, melyek utaltak valahogy a taxonómia fogalmára. Két név is terjedni kezdett. Arra a vonásra utalva, hogy az ilyen rendszereket laikusok hada építi, megjelent a \textit{folkszonómia} terminus,\footnote{\cite{folksonomy}} míg a közösségi címkézés (tagging) tevékenysége miatt használni kezdték a \textit{tagszonómia} kifejezést is. Ha majd megvizsgáljuk, hogy milyen struktúrát találhatunk az ilyen rendszerekben, látni fogjuk, hogy mindkét kategória félrevezető, mert nem a taxonómiákra, hanem a terminuslistákra hasonlítanak. Ennek ellenére természetesen mi is ezeket a terminusokat vesszük át és visszük tovább, hiszen közösségi használatuk társadalmi tény.

A közösségi szoftverek megjelenését és terjedését a hálózati kommunikáció egyik legfontosabb fejleményének tartjuk, és több szempontból forradalminak ítéljük. Mivel a közösségi szoftverek világát is magába foglaló `peer production' fogalmát a könyv másik fejezetében bővebben elemezzük majd, ezért itt a jelenségnek csak azt az új vonását próbáljuk meg -- a következő ábra segítségével -- bemutatni, amely a mostani gondolatmenetünk szempontjából releváns.

\begin{figure}[h]
\centering
\includegraphics[width= \textwidth-1cm]{image/shan06.jpg}
\caption{Az általános archívum működési elve}
\label{fig-shan06}
\end{figure}

Az ábrán az archívum működésének elvi vázlata látható -- a már korábban is bemutatott állapothoz képest annyiban módosítva, amennyiben az archívumok helyzete megváltozott a közösségi szoftverek megjelenésével. Ez a változás pedig nem más, mint a korábban paszív helyzetben levő felhasználók (befogadók) aktivizálódása. Az új helyzetben ugyanis a felhasználók a befogadói szerep mellett a tartalom és a metaadatok előállításának folyamatában egyaránt részt vesznek. Ebből számunkra természetesen most csak az a fontos, hogy a metaadatok tartalomhoz rendelését is a felhasználók végzik. Ez a tevékenység nem más, mint címkék (tag-ek), vagyis metaadatok hozárendelése a szóban forgó tartalmakhoz (blogbejegyzésekhez, videókhoz, képekhez, weboldalakhoz). A jelenség több szempontokból jelentősnek mondható, és a közösségi szoftverek révén működő szolgáltatások sikerét valóban a fent jelzett újfajta munkaszervezési rend adja, ám azt is látni kell, hogy ez a változás a metaadat-kezelés, a tudásszervezési rendszerek használata, felépítése területén nem hoz lényeges változást. A tudásszervezési rendszerek szerveződése és működtetése szempontjából ugyanis lényegtelen, hogy milyen módon áll elő maga a rendszer. A rendszer egészének felépítésére és fenntarthatóságára természetesen lényeges hatással van a megváltozott helyzet, de a számunkra érdekes szerkezeti és működési szempontból mindez kevéssé lényeges.

Könnyen érthetővé válik mindez akkor, ha megnézzük azt, hogyan lehet definiálni a folkszonómia fogalmát. Mint minden tudásszervezési rendszer esetében, itt is azt kell elsősorban keresni, hogy milyen relációkat lehet értelmezni a rendszer elemein. Ebben az esetben pedig,  mivel a rendszert építő önkéntesek számára semmilyen elvárás és előírás nincs, nem találhatunk semmilyen, a felhasználók által érvényesített vagy érvényesíthető relációt a címkék között. Csak az az egyetlen lehetőség marad a rendszeren belül, hogy a címkék közt -- utólag és ,,mechanikusan'' -- alkalmazható lexikografikus rendezést érvényesítsük. Vagyis a rendszer egyetlen -- nagyon gyenge -- relációja ugyanaz, mint a terminuslisták esetében volt. Ezek után a folkszonómia fogalmát az alábbi módon határozhatjuk meg. 

\begin{deftitle}
folkszonómia
\end{deftitle}
\begin{defbody}
A metaadatelemek $D$ nem kontrollált tartóhalmaza és a rajta értelmezett $R_{lex}$ lexikografikus rendezési reláció együttesét $KOS_{folk}$ \textit{folkszonómiának} nevezzük.
\end{defbody}
\begin{defformula}
$KOS_{folk} = <D, R_{lex}>$
\end{defformula}
\begin{defexample}
\item[(KOS15)] del.icio.us szolgáltatás
\item[(KOS16)] YouTube szolgáltatás
\end{defexample}

A folkszonómia definíciója tehát egyetlen mozzanatban tér el a terminuslita meghatározásától. Amíg az utóbbi esetében a metaadatelemek építésére vonatkozó kontrollt írtunk elő, aminek fennállását valamilyen normarendszer érvényesítése révén várhatjuk el, addig a folkszonómiák esetében ezt a kontrollt nem kell feltételeznünk (érvényesítenünk). Hogy e kontroll nélkül is lehet tudásszervezési rendszert és ,,katalógust'' is építeni, azt a folkszonómiákat alkalmazó közösségi oldalak sikeressége önmagában bizonyítja. Időt és elemzéseket igényel azonban annak megállapítása, hogy vajon képesek lesznek-e tartósan betölteni ,,hivatásukat'' ezek a rendszerek, vagy a jövőben változtatni kell majd a ,,működésükön''.

A fent megadott definíció nem teljesen pontos, mert nem veszi figyelembe azt a lehetőséget, hogy a folkszonómiák címkéihez olykor szoktak gyakorisági értékeket is rendelni (ami nyilván azt jelzi, hogy az adott címkét hányszor használta az adott közösség -- mindegy, hogy mit értünk itt ,,használaton''). Ezért -- így, utólag -- talán csak annyit érdemes jelezni, hogy egy alaposabb tárgyalás során annyiban lehetne a folkszonómia fogalmának meghatározását pontosítani, hogy belevesszük azt a rendezési relációt, ami a címkékhez rendelt fontossági, leggyakrabban gyakorisági értékek sorozatából fakad. Ez adhat egy különös (és második) rendezettséget a címkék rendszerének, melyet egyébként \textit{címkefelhőnek} is szoktak nevezni.\footnote{Könyvünk címoldalát is úgy szerkesztettük meg, hogy a hagyományos ,,könyves'' szokás szerinti információk helyett a könyv kulcsfogalmaiból felépített címkefelhőt jelenítettük meg.}
