Што ж такое «Big Data»?

І чаму гэта важна?

«Вялікія дадзеныя» з'яўляецца новай навукай разумення і прагназавання паводзін чалавека шляхам вывучэння вялікіх аб'ёмаў неструктураваных дадзеных. Вялікія дадзеныя таксама вядомы як «прагнастычны аналіз».

Аналізуючы паведамленні Twitter, Facebook каналы, eBay пошук, GPS-трэкеры, і Банкаматы некаторыя вялікія прыклады дадзеных. Вывучэнне відэа бяспекі, дадзеныя трафіку, характар ​​надвор'я, якія прыбылі рэйсы, сотавы тэлефон часопісы вежавых і трэкеры сардэчнага рытму і іншыя формаў. Вялікія дадзеныя брудны новая навука, якая змяняецца раз у тыдзень, і толькі нешматлікія спецыялісты разумеюць усе.

Якія некаторыя прыклады вялікіх дадзеных у звычайным жыцці?

скрыншот http://project.wnyc.org/transit-time

У той час як большасць буйных праекты дадзеных вельмі рэдкія, ёсць паспяховыя прыклады вялікіх аб'ёмаў дадзеных, якія ўплываюць на паўсядзённае жыццё асобных людзей, кампаніі і ўрадаў:

Прадказанне вірусных эпідэмій: шляхам вывучэння сацыяльна-палітычных дадзеных, пагодныя і кліматычныя дадзеныя і бальніцы / клінічныя дадзеныя, гэтыя навукоўцы прагназуюць ўспышкі ліхаманкі денге з 4 тыдні папярэдняга паведамлення.

Забойны Watch: гэты вялікі праект дадзеных профіляў ахвяраў забойстваў, падазраваныя і злачынцы ў Вашынгтоне, акруга Калумбія. І як спосаб ушанаваць памерлы і як рэсурс павышэння для людзей, гэты вялікі праект дадзеных зачароўваюць.

Транзітнае Планаванне паездкі, Нью - Ёрк: WNYC радыё праграміст Стыў Мелендэс аб'яднала онлайн расклад метро з маршрутам падарожжа праграмнага забеспячэннем. Яго стварэнне дазваляе ньюйоркцы націсніце іх месцазнаходжанне на карце, а таксама прадказанне часу паездкі для цягнікоў і метро з'явіцца.

Xerox скарацілі страты рабочай сілы: колл - цэнтр праца эмацыйна вымотвае. Xerox вывучыў стосы дадзеных з дапамогай прафесійных аналітыкаў, і цяпер яны могуць прадказаць, колл-цэнтр наймы, верагодна, застануцца ў кампаніі даўжэй за ўсіх.

Падтрымка барацьбы з тэрарызмам: вывучаючы сацыяльны медыя, фінансавыя справаздачы, браніраванне авіябілетаў, а таксама дадзеныя бяспекі, праваахоўныя органы могуць прадказаць і вызначыць месцазнаходжанне падазраваных у тэрарызме , перш чым яны робяць свае злыя справы.

Настройка брэнда маркетынгу на аснове аглядаў сацыяльных медыя: людзі прама і хутка дзяліцца сваімі думкамі онлайн на паб, рэстаран або фітнес - клуб. Можна вывучыць гэтыя мільёны паведамленняў у сацыяльных сетках і забяспечыць зваротную сувязь для кампаніі аб тым, што людзі думаюць аб сваіх паслугах.

Хто выкарыстоўвае Big Data? Што яны робяць з ім?

Многія маналітныя карпарацыі выкарыстоўваюць вялікія дадзеныя, каб скарэктаваць свае прапановы і кошты для максімальнага задавальнення патрэбаў кліентаў.

Чаму Big Data Такі Big Deal?

4 рэчы, якія робяць вялікія дадзеныя значныя:

1. Дадзеныя масавы характар . Яна не змяшчаецца на адзін жорсткі дыск , нашмат менш флэшкі . Аб'ём дадзеных нашмат перавышае тое, што можа ўспрыняць чалавечы розум (узгадайце мільярд мільярдаў мегабайт, а затым памножыць гэта на больш мільярдаў).

2. Дадзеныя неакуратна і неструктураваных. 50% да 80% ад вялікай працы дадзеных пераўтварэння і ачысткі інфармацыі, так што для пошуку і сартаванні. Толькі некалькі тысяч спецыялістаў на нашай планеце ў поўнай меры ведаць, як гэта зрабіць ачыстку дадзеных. Гэтыя спецыялісты таксама маюць патрэбу ў вельмі спецыялізаваныя інструменты, такія як HPE і Hadoop, каб зрабіць сваё рамяство. Можа быць, у 10 гадоў, вялікія спецыялісты дадзеных стануць сажалкай гаці, але цяпер, яны вельмі рэдкія віды аналітыкі і іх праца па-ранейшаму вельмі невыразная і стомная.

3. Дадзеныя стаў таварам ** , якія могуць быць прададзеныя і набытыя. гандлёвыя пляцоўкі дадзеных існуюць, дзе кампаніі і прыватныя асобы могуць купіць тэрабайт сацыяльных медыя і іншых дадзеных. Большая частка дадзеных у воблаку, так як ён занадта вялікі, каб змясціцца на любы адзін жорсткі дыск. Купля дадзеных звычайна ўключае ў сябе абаненцкую плату, дзе вы заткнуць ў ферме воблака сервераў.

** Кіраўнікі вялікіх інструментаў дадзеных і ідэй Amazon, Google, Facebook і Yahoo. Таму што гэтыя кампаніі служаць многія мільёны людзей з іх інтэрнэт - паслуг, гэта мае сэнс , што яны будуць кропкай збору і празорцы за вялікіх аналітычных дадзеных.

4. Магчымасць вялікіх дадзеных бясконцая. Магчыма , лекары будуць адзін дзень прадказаць сардэчныя прыступы і інсульты для асобных асоб тыдняў да іх узнікнення. Самалёт і аўтамабільныя аварыі можа быць паменшаная шляхам інтэлектуальнага аналізу іх механічных характарыстык і схем руху і другіх умоў . Інтэрнэт знаёмства можа быць палепшана шляхам мець вялікія прагнастычныя дадзеныя аб тым, хто з'яўляюцца сумяшчальнымі асобамі для вас. Музыкі маглі б атрымаць разуменне таго , што музычная кампазіцыя з'яўляецца найбольш прыемнай для змены густаў мэтавай аўдыторыі. Дыетолагі могуць быць у стане прадказаць , якая камбінацыю набытых у краме прадуктаў будуць абвастрыць або дапамагчы медыцынскім умовам чалавека. Паверхню толькі падрапаў, і адкрыцця ў вялікіх дадзеных здараюцца кожны тыдзень.

Big Data брудны

Monty Rakusen / Getty

Вялікія дадзеныя прагнозны аналіз: канвертацыя масіўных неструктураваных дадзеных у чым - то для пошуку і сартаванні. Гэта брудная і хаатычны прастору, якое патрабуе адмысловага роду ведаў і цярпення.

Возьмуць, напрыклад, маналітныя службы дастаўкі UPS. Праграмісты UPS даследаванні дадзеных ад GPS і смартфонаў сваіх кіроўцаў, каб прааналізаваць найбольш эфектыўныя спосабы адаптацыі да затораў. Гэты GPS і смартфон дадзеныя зверскія, і аўтаматычна не гатовыя для аналізу. Гэтыя дадзеныя наліваюць у розных GPS і карт база дадзеных, з дапамогай розных прылад смартфона. Аналітыкі UPS патрацілі месяцы пераўтварэнні ўсе гэтыя дадзеныя ў фармат , які можа быць лёгка знойдзеныя і адсартаваныя. Намаганні каштавалі таго, хоць. Сёння, UPS выратавала больш за 8 мільёнаў галонаў паліва, так як яны пачалі выкарыстоўваць гэтыя вялікія аналітычныя дадзеныя.

Паколькі вялікія дадзеныя неакуратна і патрабуе столькі намаганняў для ачысткі і падрыхтоўкі да выкарыстання, навукоўцы даных сталі празваныя «дворнікі» дадзеных для ўсіх стомнай працы, якую яны робяць.

Навука вялікіх дадзеных і прагнастычнай аналітыкі паляпшаецца кожны тыдзень, хоць. Чакаць вялікія дадзеныя, каб яна была даступная для ўсіх да 2025 года.

Ня Big Data назойлівай пагроза прыватнасці?

Feingersh / Геці

Так, калі нашы законы і індывідуальныя сродкі абароны прыватнай жыцці не старанна кіраваць, то вялікія дадзеныя ўрываецца ў асабістае жыццё. Як можна заўважыць, Google і YouTube і Facebook ужо адсочваць штодзённыя онлайн - звычкі . Ваш смартфон і вылічальная жыццё пакідае лічбавыя сляды кожны дзень, і выдасканаленыя кампаніі вывучаюць гэтыя сляды.

Законы вакол вялікіх дадзеных эвалюцыянуюць. Канфідэнцыяльнасць з'яўляецца стан быцця, што цяпер вы павінны ўзяць на сябе асабістую адказнасць за, як вы больш не можаце чакаць, што яна, як права па змаўчанні.

Што вы можаце зрабіць, каб абараніць вашу прыватную жыццё:

Самы вялікі адзін крок вы можаце прыняць гэта маскіраваць свае штодзённыя звычкі , выкарыстоўваючы падключэнне да сеткі VPN . Служба VPN будзе зашыфраваць ваш сігнал, каб ваша імя і месцазнаходжанне, па меншай меры, часткова маскіруюцца ад трэкер. Гэта не зробіць вас 100% ананімнасць, але VPN дазволіць істотна знізіць, наколькі свет можа назіраць за свае звычкі.

Дзе я магу даведацца больш пра Big Data?

Monty Raskusen / Getty

Вялікія дадзеныя займальная рэч для людзей з аналітычным розумам і любоўю да тэхналогіі. Калі гэта вы, то абавязкова наведайце гэтую старонку цікавых буйных праектаў дадзеных.