Што такое Data Mining?

Буйныя кампаніі ведаюць пра вас больш, чым вы можаце сабе ўявіць - вось як

інтэлектуальны аналіз дадзеных з'яўляецца аналізам вялікіх аб'ёмаў дадзеных, каб выявіць заканамернасці і веданне. На самай справе, здабыча дадзеных таксама вядомы як выяўленне дадзеных або выяўлення ведаў.

Інтэлектуальны аналіз дадзеных выкарыстоўвае статыстыку, прынцыпы машыннага навучанне (ML), штучны інтэлект (ІІ), і велізарныя аб'ёмы дадзеных (часта з баз дадзеных або набораў дадзеных) , каб выявіць заканамернасці ў спосабе , якім гэта , як аўтаматызаваны і карыснымі , наколькі гэта магчыма.

Ці што інтэлектуальны аналіз дадзеных?

Здабыча дадзеных мае дзве асноўныя мэты: апісанне і прадказанне. Па-першае, здабыча дадзеных апісвае ідэі і веды, атрыманыя ў выніку аналізу заканамернасцяў у дадзеных. Па-другое, здабыча дадзеных выкарыстоўвае апісання прызнаных мадэляў дадзеных для прагназавання будучых мадэляў.

Напрыклад, калі вы патрацілі час прагляду на гандлёвы сайце для кніг пра тое , як ідэнтыфікаваць розныя тыпы раслін, здабываюць дадзеных паслуг , якія працуюць за кулісамі на гэтым сайце увайсці апісанне вашых пошукаў у вашым профілі. Калі вы зноў увайсці ў сістэму праз два тыдні, паслугі інтэлектуальнага аналізу дадзеных на вэб-сайце выкарыстоўваюць апісання папярэдніх запытаў, каб прадказаць вашыя бягучыя інтарэсы і прапаноўваць персанальныя рэкамендацыі, якія ўключаюць гандлёвыя кнігі пра ідэнтыфікацыі раслін.

Колькі горных работ дадзеных

інтэлектуальны аналіз дадзеных працуе з выкарыстаннем алгарытмаў, набораў інструкцый, якія загадваюць кампутар або працэс, як зрабіць задачу, каб выявіць розныя тыпы малюнкаў у дадзеных. Некалькі розных метады распазнавання вобразаў, якія выкарыстоўваюцца ў горназдабыўной прамысловасці дадзеных ўключаюць кластарны аналіз, выяўленне анамалій, вывучэнне асацыяцыі, залежнасці дадзеных, дрэва рашэнняў, мадэль рэгрэсіі, класіфікацыю, выяўленне выкідаў і нейронавыя сеткі.

У той час як інтэлектуальны аналіз дадзеных можа быць выкарыстаны для апісання і прагназавання мадэляў ва ўсіх розных відах дадзеных, выкарыстанне шматлікіх людзі сутыкаюцца часцей за ўсё, нават калі яны не разумеюць яго, каб апісаць заканамернасці ў выбары куплі і паводзінах, каб прадказаць верагодную куплю ў будучыні рашэння.

У якасці прыкладу, вы калі - небудзь задаваліся пытаннем, як Facebook заўсёды ведае , што вы глядзелі на онлайн і паказвае рэкламу ў вашай падборцы , звязаных з іншых сайтаў , якія вы наведвалі ці вашых вэб - пошуку? Інтэлектуальны аналіз дадзеных facebook выкарыстоўвае інфармацыю , якая захоўваецца ў вашым браўзэры , які адсочвае вашыя дзеянні, такія , як печыва , разам са сваім веданнем вашых мадэляў на аснове папярэдняга выкарыстання сэрвісу Facebook, каб выявіць і спрагназаваць прадукты ці прапановы , вы можаце быць зацікаўлены.

Якія дадзеныя могуць быць Замінаваны?

У залежнасці ад службы або крамы (фізічныя крамы выкарыстоўваюць інтэлектуальны аналіз дадзеных таксама), дзіўнае колькасць дадзеных аб вас і вашай мадэлі можа быць замінаваны. Дадзеныя, сабраныя пра Вас можа ўключаць у сябе, які тып аўтамабіля вы едзеце, дзе вы жывяце, месца, дзе вы падарожнічалі, часопісы і газеты, якія вы падпісаныя, і ці сапраўды вы ці не ў шлюбе. Ён таксама можа вызначыць, ці сапраўды вы дзяцей, што вашыя хобі, якая група вам падабаецца, вашы палітычныя прыхільнасці, што вы купляеце ў Інтэрнэце, што вы купляеце ў фізічных крамах (часта праз ўзнагароджанне лаяльнасці кліентаў карты), а таксама любыя дадзеныя, якія вы падзяліцеся пра сваё жыццё на сацыяльнай медыя.

Напрыклад, прадпрыемствы рознічнага гандлю і моды на аснове публікацый , арыентаваных на падлеткаў выкарыстоўваць ідэі з інтэлектуальнага аналізу дадзеных фатаграфій на сацыяльных медыя - паслуг , такіх як Instagram і Facebook , каб прадказаць тэндэнцыі моды , якія будуць прывабіць у падлеткавых пакупнікоў або чытачоў. Веды, выяўленыя ў выніку здабычы дадзеных могуць быць настолькі дакладнымі, што некаторыя рознічныя гандляры могуць нават прадказаць, калі жанчына можа быць цяжарнай, заснавана на вельмі спецыфічныя зменах у яе выбары пакупкі. Рытэйлер Target, як паведамляецца, настолькі дакладныя, з прагназаваннем цяжарнасці на аснове шаблонаў ў куплі гісторыі, якія яна па пошце купоны для дзіцячых тавараў для маладой лэдзі, аддаючы сваю цяжарнасць ў таямніцы, перш чым яна распавяла сваю сям'ю.

Здабыча дадзеных ўсюды, аднак, вялікая частка інфармацыі, выяўленай і прааналізаваць пра нашых пакупніцкіх звычак, асабістых пераваг, выбар, фінансы, і дзейнасць у Інтэрнэце выкарыстоўваецца крам і паслуг з мэтай павышэння якасці абслугоўвання кліентаў.