Шта је Дата Мининг? Основе и његове технике.
Основа четврте индустријске револуције ће у великој мери зависити од података(Data) и повезаности(Connectivity) . Услуге анализе(Analysis Services) способне да развију или креирају решења за рударење података ће играти кључну улогу у овом погледу. То би могло помоћи у анализи и предвиђању исхода куповног понашања купаца за циљање потенцијалних купаца. Подаци(Data) ће постати нови природни ресурс и процес издвајања релевантних информација из ових несортираних података ће добити огроман значај. Као такво, правилно разумевање термина – Дата Мининг(Data Mining) , његових процеса и примене могло би нам помоћи у развоју холистичког приступа овој популарној речи.
Основе рударења података(Data Mining Basics) и његове технике
Ископавање података, такође познато као Откривање знања у подацима(Knowledge Discovery in Data) ( КДД(KDD) ) је претраживање великих складишта података да би се открили обрасци и трендови који превазилазе једноставне анализе. Ово, међутим, није решење у једном кораку, већ процес у више корака и завршава се у различитим фазама. Ови укључују:
1] Прикупљање података и припрема
Почиње прикупљањем података и њиховом правилном организацијом. Ово помаже у значајном побољшању шанси за проналажење информација које се могу открити кроз дата мининг
2] Изградња модела и евалуација
Други корак у процесу рударења података је примена различитих техника моделирања. Они се користе за калибрацију параметара на оптималне вредности. Технике које се користе у великој мери зависе од аналитичких способности потребних да се одговори на читав низ организационих потреба и да се донесе одлука.
Хајде да укратко испитамо неке технике рударења података. Утврђено је да већина организација комбинује две или више техника рударења података заједно како би формирале одговарајући процес који испуњава њихове пословне захтеве.
Прочитајте(Read) : Шта су велики подаци?(What is Big Data?)
Дата Мининг Тецхникуес
- Асоцијација – (Association – )Асоцијација(Association) је једна од надалеко познатих техника рударења података. У складу са овим, образац се дешифрује на основу односа између ставки у истој трансакцији. Стога(Hence) је позната и као техника релације. Продавци великих брендова ослањају се на ову технику да би истражили куповне навике/преференце купаца. На пример, када прате куповне навике људи, трговци на мало могу идентификовати да купац увек купује крему када купује чоколаде, и стога предлажу да следећи пут када купе чоколаде можда желе да купе и крему.
- Класификација(Classification) – Ова техника рударења података разликује се од горе наведене по томе што је заснована на машинском учењу и користи математичке технике као што су линеарно(Linear) програмирање, стабла одлучивања , (Decision)неуронске(Neural)мреже. У класификацији, компаније покушавају да направе софтвер који може научити како да класификује ставке података у групе. На пример, компанија може да дефинише класификацију у апликацији која „с обзиром на сву евиденцију запослених који су понудили оставку у компанији, предвиђа број појединаца који ће вероватно дати отказ у компанији у будућности“. По таквом сценарију, компанија може да класификује евиденцију запослених у две групе и то „одлазе“ и „остају“. Затим може да користи свој софтвер за рударење података да класификује запослене у засебне групе створене раније.
- Груписање(Clustering) – различито(Different)објекти који показују сличне карактеристике су груписани заједно у један кластер путем аутоматизације. Многи такви кластери се креирају тако што се класе и објекти (са сличним карактеристикама) постављају у њих у складу са тим. Да бисмо ово боље разумели, размотримо пример управљања књигама у библиотеци. У библиотеци, огромна збирка књига је у потпуности каталогизована. Ставке истог типа су наведене заједно. То нам олакшава да пронађемо књигу која нас занима. Слично, коришћењем технике груписања, можемо држати књиге које имају неке врсте сличности у једном кластеру и доделити му одговарајуће име. Дакле, ако читалац жели да зграби књигу релевантну за његово интересовање, мора само да оде до те полице уместо да претражује целу библиотеку. Дакле, техника груписања дефинише класе и ставља објекте у сваку класу,
- Предвиђање(Prediction) – Предвиђање је техника рударења података која се често користи у комбинацији са другим техникама рударења података. То укључује анализу трендова, класификацију, подударање образаца и однос. Анализом прошлих догађаја или инстанци у одговарајућем редоследу може се безбедно предвидети будући догађај. На пример, техника анализе предвиђања се може користити у продаји за предвиђање будућег профита ако је продаја изабрана као независна варијабла, а профит као варијабла зависна од продаје. Затим, на основу историјских података о продаји и добити, може се нацртати прилагођена крива регресије која се користи за предвиђање профита.
- Стабло одлучивања(Decision trees) – У оквиру стабла одлучивања почињемо са једноставним питањем које има више одговора. Сваки одговор води до даљег питања које помаже у класификацији или идентификацији података тако да се могу категоризовати или да се на основу сваког одговора може направити предвиђање. На пример, користимо следеће стабло одлучивања да одредимо да ли да играмо крикет ОДИ(ODI) : Стабло одлучивања за рударење података(Data Mining Decision Tree) : Почевши од основног чвора, ако временска прогноза тада предвиђа кишу, требало би да избегавамо меч за тај дан. Алтернативно, ако је временска прогноза јасна, требало би да одиграмо утакмицу.
Дата Мининг(Data Mining) је у срцу аналитичких напора у различитим индустријама и дисциплинама као што су комуникације, осигурање(Insurance) , образовање(Education) , производња(Manufacturing) , банкарство(Banking) и малопродаја(Retail) и још много тога. Стога је неопходно имати тачне информације о томе пре него што примените различите технике.
Related posts
26 најбољих софтвера за рударење података
Како користити функцију аутоматског типа података у програму Екцел
БитЛоцкер подешавање није успело да извезе БЦД (подаци о конфигурацији покретања) складиште
Како управљати ограничењем употребе података у оперативном систему Виндовс 11/10
Није могуће увести датотеку регистра. Нису сви подаци уписани у регистар
Шта је Аналитика података и за шта се користи
0кц0000098: Подаци о конфигурацији покретања оперативног система Виндовс не садрже унос ОС
Најбољи бесплатни алати за визуелизацију података на мрежи
Како користити функцију Уметање података из слике у Екцел-у
Укључите или искључите дијагностичке податке о коришћењу наратора у оперативном систему Виндовс 10
Како претворити МБР у ГПТ без губитка података у оперативном систему Виндовс 11/10
Бесплатно преузимање БурнАваре-а: бесплатни ЦД, ДВД, Блу-Раи, ХД-Медиа Бурнер
Шта је Реманентност података? Како га елиминишете или преписујете?
Омогућите, онемогућите прикупљање података за монитор поузданости у оперативном систему Виндовс 10
Гоогле Цхроме неће обрисати историју и податке прегледања
Шта су УСБ блокатори података? Најбољи УСБ блокатори података за куповину на Амазону
МиниТоол Повер Дата Рецовери Фрее обнавља податке са оштећених партиција
Обришите или избришите историју прегледања, колачиће, податке, кеш меморију у Едге-у
10 најбољих професионалних софтвера за прављење резервних копија и опоравак података за Виндовс 10
Шта очекивати када преузмете историју Фацебоок података