Големите провали на големите данни

Неслучайно светът на бизнесът е ентусиазиран от възможностите, които големите данни предлагат. Заравянето надълбоко в сетове от исторически данни е неоценим помощник при оптимизирането на процеси, повишаването на ефективността, както и в създаването на нови източници на приходи. Всичко това обаче повдига въпросът дали големите данни и аналитичното прогнозиране могат да се провалят? Разбира се!

В тази публикация фокусираме върху 5 различни случая, в които аналитичното прогнозиране и големите данни се провалят по един или друг начин. Без значение дали става дума за погрешно предположение, лошо изпълнение, липсващи променливи или погрешни стойности – резултатите са най-малкото изненадващи и далеч не приятни.

Изборната победа на Доналд Тръмп

Също като резултата от гласуването за Брекзит, победата на Доналд Тръмп беше нищо по-малко от изненада. Предварителните сондажи сочеха щедра преднина за Хилъри Клинтън, както и силна подкрепа за оставане на Великобритания в ЕС. Но на сутринта след тези две гласувания, всичко стана различно.

Истината е, че предварителните социологически проучвания дават вероятности за изхода от изборите. Изследването на FiveThirtyEight даваше 85% шанс за Клинтън да спечели президентските избори в САЩ. А това означава, че други 15 са вероятността Тръмп да спечели. Другата причина за резултатът от тези гласувания е широкото разпространение на резултатите от предварителните сондажи. То може да се превърне в лоша услуга за някои от участниците, доколкото обезкуражава техните гласоподаватели, защото те смятат, че победата вече е осигурена. Подобна нагласа не може да бъде прогнозирана, нито моделирана. Според публикация на Wall Street Journal, предизборният щаб на Доналд Тръмп е била информиран в сутринта на изборния ден, че има над 50% шанс той да спечели титулярното място в Белия дом. Само ден по-рано, този шанс е бил 30 на сто.

Google Flu Trends 2012/2013

Данни без контекст могат да бъдат малко или повече подвеждащи. Също като Google Flu Trends през зимния сезон на 2012/2013 г. Инструментът разчита на търсенията в Google за грип и сходни ключови думи, комбинирани с локацията на потребителите. Алгоритмите, създадени от аналитиците на компанията могат да посочат приблизителен брой на заболелите от грип в САЩ към даден момент. През зимата на 2012/2013 г., Google обявява, че 11% от населението на САЩ е болно от грип. От щатския Център за контрол и превенция на заболяванията коментират, че пиковите стойности са били 6 на сто. Оказва се, че Google обявява подобни данни, защото алгоритмите са били объркани от увеличаващото се количество на медийно съдържание, покриващо темата грип.

Чатботът на Microsoft

Тази история е истински забавна! Microsoft работиха истински усърдно, за да стартират техния Twitter бот, захранван от изкуствен интелект, така че да се учи от другите потребители на социалната мрежа. Резултатът от това усилие е виртуален расист, оспорващ Холокоста и използващ обидни думи към жени и малцинства. Само след 24 часа живот в мрежата, ботът на Microsoft беше изключен за „допълнителни настройки“. Това е забележителен публичен провал, който не бе предвидил вероятността чатботът да бъде заобиколен и съответно да се учи от хора с проблемно поведение.

Приложението, предотвратяващо самоубийства

Британската неправителствена организация Самаряните създава безплатно приложение, чиято цел е да информира потребителите на Twitter, когато някой от техните последователи публикува потенциално суицидни фрази като „мразя се“ или „омръзна ми да съм сам“. За съжаление, създаденото с цел да информира, че приятел е в нужда се ползва и от хора, чиято цел е да уязвят човек в труден момент. Така, благородното начинание има живот от само седмица и половина преди да бъде спряно от британските Самаряни.

Снимката с изгореното от напалм момиченце във Facebook

Маркетинг експертите в социалните мрежи са наясно с т.нар. nudity rule на Facebook, което блокира рекламни изображения, показващи твърде много от човешкото тяло. Потребителите на тази мрежа не могат да споделят снимки на зърна, задници, гениталии и т.н. За целта, инженерите на компанията разработват базиран на големи данни алгоритъм, който идентифицира голотата на снимки и понякога блокират и изображения, които не би трябвало. Също като легендарната снимка на голото виетнамското момиченце, бягащо от бомбите с напалм. Блокирането на изображението от Facebook подложи компанията на остра критика и нейната репутация на лидер в областта на изкуствения интелект беше силно разклатена.

„Ключът е да се разбере, че големите данни и науките за тях са инструмент, който далеч не задължително дава отговори, а по-скоро вероятности“, казва Ерик Бринйолофсон, професор в Масачузетския технологичен институт в публикация за New York Times.

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *