Yleistä tietokannoista

Mureakuha

Loikkaa: valikkoon, hakuun

Mikä on tietokanta

Tietokannan voidaan sanoa yksinkertaisesti olevan joukko tietoja, joka on järjestetty niin, että sitä voi helposti käsitellä ja haluttu tieto on nopeasti sieltä saatavilla. Tiedot tietokannassa on järjestetty tietyllä loogisella tavalla, jotta oikean tiedon saaminen olisi mahdollisimman tehokasta. Tietokanta koostuu kolmesta osasta – kentistä (fields), tietueista (records) ja tauluista (tables). Kenttä on tietoyksikkö kuten nimi tai osoite. Tietue taas koostuu yhteen kuuluvista kentistä, esimerkiksi yksi tietue voi sisältää käyttäjän nimen, osoitteen ja puhelinnumeron. Taulut taas ovat kokoelma tietueita, jotka sisältävät yhtenevää tietoa.

Tietokanta voi olla hyvinkin pieni ja yksinkertainen tai toisaalta todella monimutkainen ja kooltaan suuri. Esimerkiksi tavallisen henkilön cd-levykokoelmatietokanta tuskin kasvaa monta megatavua suuremmaksi. Vertailun vuoksi Altavistan tietokanta, joka ylläpitää hakusanastoa koko WWW:n sisällöstä vie reilusti yli 200 gigatavua kovalevytilaa, puhumattakaan laitteistovaatimuksista ja tietokantaohjelmiston toiminnoista. Altavistan tietokanta on iso, mutta ei läheskään maailman suurin.

Erilaiset tietokannat

On olemassa niin sanottuja tasaisia tietokantoja (flat-file) sekä relaatiotietokantoja (Relational database management system, RDBMS). Tasaisessa tietokannassa kaikki tieto on tallennettu yhteen tauluun ja myös yhteen tiedostoon. Esimerkkeinä tasaisista tietokannoista voisivat olla vaikka Excel-taulukko tai tekstitiedosto, jossa yksittäinen tieto on erotettu aina pilkulla. Tällainen tietokanta voi sopia yksinkertaisille sovelluksille, mutta jos tietoa on paljon tai haluat hakea toisiinsa liittyvää tietoa useasta tasaisesta tietokannasta, eivät ne enää ole käyttökelpoisia. Relaatiotietokanta kehitettiin vastaamaan yritysten tietojärjestelmien luotettavuus- ja suorituskykyvaatimuksia. Se on kasa tauluja (tasaisia tietokantoja), jotka voidaan liittää toisiinsa erilaisilla tavoilla. Yhden taulun tietoja tallennettaessa voidaan myös toiseen tauluun tallentaa tietoa ensimmäisestä taulusta (yleensä yksilöllinen numeerinen tunniste). Tällöin tauluja on helppo yhdistää toisiinsa, sillä molemmat taulut sisältävät saman tiedon. Relaatiotietokannan käyttö on järkevää esimerkiksi kun tallennetaan paljon tietoa, kaikkea tietoa ei ole järkevää tallentaa samaan paikkaan tai tarvitaan parempaa tietoturvaa kuin tekstitiedosto tai Microsoft Excel pystyy tarjoamaan.

Rakenne

Yksi relaatiotietokannan ydinkomponenteista on taulu. Kuten aiemmin todettiin taulu koostuu kentistä jotka ovat tallennettu tauluun sarakkeittain (columns), sekä tietueista, jotka taas on tallennettu riveittäin (rows). Yksittäinen kenttä on pienin tietoyksikkö taulussa, esimerkiksi yhden henkilön sukunimi tai puhelinnumero. Kenttä määritellään sen mukaan minkälaista tietoa siihen halutaan syöttää. Erilaisia tietotyyppejä ovat esimerkiksi merkkijonot, numerot, päivämäärät, aikaleimat ja binaaritieto. Yleensä jokin taulun kenttä toimii tietueen tunnistimena. Kyseinen sarake sisältää yksilöllisen tiedon jokaiselle taulun riville. Tätä yksilöllistä tietoa kutsutaan pääavaimeksi (primary key) ja sen avulla haluttu tietue löydetään helposti ja nopeasti suurenkin taulun tiedoista. Yleensä tämä pääavain toimii numeerisen laskurin tavoin; sen arvo kasvaa aina yhdellä (mahdollista myös kustomoida) kun tauluun lisätään uusi tietue

Kahden taulun tietoja yhdistetään relaatiotietokannoissa niin, että lisätään liitettävään tauluun kenttä, johon tallennetaan sama arvo kuin toisen taulun pääavainkentässä on. Tätä kenttää taas kutsutaan viiteavainkentäksi (foreign key), sillä se viittaa toisen taulun pääavainkenttään. Esimerkiksi jos tietokannassa olisi taulu joka sisältää henkilöiden nimet ja osoitetiedot, niin voitaisiin henkilön asuinkunta merkitä pelkällä ID-numerolla. ID-numero yhdistettäisiin sitten toisen taulun pääavainkenttään. Tämä toinen taulu sisältäisi jokaisen kunnan nimen niin että niillä kaikilla on oma ID-numeronsa (pääavain). Kun tiedot tallennetaan näin, ei tarvitse henkilötiedot sisältävään tauluun tallentaa jokaiselle henkilölle erikseen hänen kuntansa nimeä, vaan riittää että oikea kuntanumero syötetään viiteavainkenttään. Toistettavaa tietoa ei tule vaan, ne tallennetaan omaan tauluunsa, tätä kutsutaan tietokantasuunnittelussa normalisoinniksi (normalize). Näin voidaan siis varmistaa että samaa kunnan nimeä käytetään joka kerta, kun kunta valitaan.

Käytännössä kaikki yrityksissä käytettävät ohjelmat perustuvat tavalla tai toisella jonkinlaiseen tietovarastoon. Sen ei aina tarvitse olla tietokanta, se voi myös olla esimerkiksi Excel-taulukko tai pelkkä tekstitiedosto. Tärkeää on kuitenkin tiedon helppo muokkaaminen, lisääminen ja hakeminen.

Henkilökohtaiset työkalut