Data Mining

Čo je dolovanie údajov:

Data mining je anglický termín spojený s informatikou, ktorej preklad je dolovanie dát . Pozostáva z funkcionality, ktorá agreguje a organizuje údaje, pričom v nich nájde relevantné vzory, asociácie, zmeny a anomálie .

Termín data mining sa prvýkrát objavil v roku 1990 v databázových komunitách. Data mining je procesný analytický krok známy ako KDD ( Knowledge Discovery in Databases ), jeho doslovný preklad je "Knowledge Discovery in Databases".

Dolovanie dát možno rozdeliť do niekoľkých základných krokov: prieskum, budovanie modelov, definícia vzorov a overovanie a overovanie.

Data mining je relatívne nová prax vo svete výpočtovej techniky a využíva vyhľadávanie informácií, umelú inteligenciu, rozpoznávanie vzorov a štatistické techniky na vyhľadávanie korelácií medzi rôznymi údajmi, ktoré vám umožnia získať prospešné vedomosti pre spoločnosť alebo jednotlivca. Pre spoločnosť môže byť dolovanie údajov dôležitým nástrojom, ktorý zlepšuje inováciu a ziskovosť.

Využívanie dolovania dát je vo veľkých databázach pomerne bežné a konečný výsledok ich použitia možno zobraziť prostredníctvom pravidiel, hypotéz, rozhodovacích stromov, dendrogramov atď.

Dobre vykonávaná data mining by mala plniť také úlohy, ako sú: detekcia anomálií, učenie asociačných pravidiel (modelovanie závislosti), klastrovanie, klasifikácia, regresia a sumarizácia. Proces získavania údajov sa zvyčajne uskutočňuje pomocou údajov obsiahnutých v dátovom sklade .

Existuje niekoľko spoločností a softvéru, ktoré sa venujú dolovaniu údajov, pretože identifikácia vzorov v databázach je čoraz dôležitejšia. Identifikácia príslušných noriem však nie je pre počítačový svet jedinečná. Ľudský mozog používa podobný proces na identifikáciu vzorov a získavanie vedomostí.

V posledných rokoch sa dolovanie dát široko používa v oblastiach vedy a techniky, ako sú bioinformatika, genetika, medicína, vzdelávanie a elektrotechnika.

Koncepcia dolovania údajov je často spojená s získavaním informácií o správaní ľudí. Z tohto dôvodu v niektorých situáciách získavanie údajov vyvoláva právne otázky a otázky týkajúce sa súkromia a etiky. Napriek tomu mnohí ľudia tvrdia, že dolovanie údajov je eticky neutrálne, pretože nemá žiadne etické dôsledky.

Príklady dolovania skutočných dát

Dolovanie dát je často využívané spoločnosťami a organizáciami na získanie vedomostí o užívateľoch / zamestnancoch / zákazníkoch. Napríklad vo verejnom sektore je možné krížovo skontrolovať rodinný stav zamestnanca a plat, ktorý zarobí, aby sa zistilo, či to má vplyv na jeho manželský život.

Spoločnosti, ako napríklad reťazce supermarketov, môžu použiť tieto krížové údaje na určenie produktov, ktoré sa kupujú spoločne. Ak si zákazník, ktorý si kúpi produkt X, kúpi aj produkt Y, môže byť vhodné umiestniť tieto dva produkty v blízkosti, aby bolo pre zákazníka ľahšie nakupovať.