A járványok terjedési mintázatát minél előbb észre kell venni, hogy hatékonyan lehessen védekezni ellenük. Erre kínálnak megoldást a státuszfrissítéseink és kereséseink alapján összeállított vírustérképek. De miért ne lehetne helyalapú riasztásokkal személyre szabottan is figyelmeztetni a veszélyre? Big data az ebola és az influenza korában.
Korábban már írtunk arról, hogyan segíthet krízishelyzetben a Facebook, de a gyakorlatban is láthattuk ezt a tavaly márciusi hóhelyzet kapcsán, amikor a sajtó tájékoztató szerepét vette át a közösségi oldal. De a közvetlen információcserén túl más módon is hasznosnak bizonyulhatnak a közösségi oldalak és más nagy techcégek adatai.
Ezek a szolgáltatások óriási adatmennyiséget halmoznak fel, aminek persze vannak komoly adatbiztonsági vonatkozásai is, ugyanakkor az tagadhatatlan a big data korában, hogy ha megfelelő módon sikerül feldolgozni ezt a rengeteg adatot, akkor új lehetőségek sora nyílik meg, elemzések és előrejelzések válhatnak minden eddiginél pontosabbá és gyorsabbá.
Az egyik olyan terület, amely sokat profitálhat a dologból, a járványtan. A bejegyzések, bejelentkezések, keresési előzmények és más, általunk hagyott digitális nyomok metaadatai hatékony eszközei lehetnek a vírusok terjedésének feltérképezéséhez és előrejelzéséhez. A posztok hashtagjeitől a használt szavakon át a felhasználók tartózkodási helyéig sok minden segítheti a járványok elleni harcot.
Beteg vagyok, ments ki innen
A Techrunch egy cikke a legaktuálisabb példa, az ebola kapcsán vesz számba néhány olyan szolgáltatást, amelyeket tovább lehetne fejleszteni úgy, hogy tartózkodási hely alapján személyre szabott riasztásokkal hívják fel az emberek figyelmét a veszélyre. (Bár a pánik gyorsabban terjed, mint maga a vírus.)
Az egyik a Facebook nemrég bevezetett, Safety Check nevű funkciója, amely akkor érhető el, ha a felhasználó valamilyen természeti katasztrófa közelében tartózkodik. Ilyenkor automatikusan előugrik egy olyan felület, ahol egy gombnyomással jelezhetjük az ismerőseinknek, hogy biztonságban vagyunk, és megnézhetjük a többi ismerősünk státuszát is. Ennek mintájára lehetne a Techcrunch szerint automatikus riasztással felhívni a figyelmet a veszélyre, ha bejelentett ebolás fertőzés közelébe kerülünk.
Egy másik ilyen szolgáltatás a Google Public Alerts, amely szintén természeti katasztrófákra hívja fel a figyelmet, és a veszélyek térképesen kereshetők is. A szolgáltatás hivatalos szervektől származó információn alapul, beépül a Google ökoszisztémájába (a keresésekbe és az Asszisztensbe is), és szintén értesít, ha veszélyes területre érünk.
A harmadik megoldás a Geofeedia, amellyel térképen kijelölhetünk egy tetszőleges területet, és összegyűjtve láthatjuk több közösségi szolgáltatásnak az arra a területre vonatkozó tartalmait.
Keresve se találni gyorsabbat
Az ebola viszonylag friss fejlemény, de már léteznek egy ideje olyan szolgáltatások, amelyek éppen digitális járványfigyelésre specializálódtak. Leggyakrabban az influenza elleni küzdelemben vetik be a közösségi információ valós idejű elemzését.
A Centers for Disease Control and Prevention (CDC) nevű amerikai közegészségügyi intézet hivatalból kiad egy heti influenzajelentést, de ennek az adatai már több hetesek lehetnek, mire megjelenik, vagyis nem éppen naprakész a rendszer.
Ezt az esemény és adat közötti időeltolódást tudják kitölteni a közösségimédia-figyelő rendszerek, amelyekkel valós idejű információt kaphatunk az éppen terjedő járványról, az eddiginél gyorsabb ellenlépéseket lehetővé téve. Sőt, a követés mellett a terjedés mintázatának előrejelzésével ispróbálkoznak a tudósok.
Ezen a téren az egyik élen járó cég a Google. A térképszolgáltatásukat mindenféle projektekhez szokták használni (legújabban például az orvhalászok szemmel és kordában tartására), de az egyik leghíresebb térképes projekt még mindig a Google Flu Trends, amelyet először 2008-ban mutattak be. Azon alapul, hogy az emberek gyakrabban keresnek rá vírusokkal kapcsolatos információra vagy egy fertőzés tüneteire, ha ők maguk már megbetegedtek. Így a keresési adatok feldolgozásával és térképre vetítésével látható, hol üti fel a fejét az influenza (vagy a dengue-láz, mert ezt is elemzik Google-éknál).
A projekt alapvetően óriási siker, és a nagy adatmennyiség feldolgozását célul tűző trendek egyik fő hivatkozási pontja, de arra is rámutat, hogy a módszernek van még hova fejlődnie, és a használhatósága korlátozott. A legtöbb esetben a hivatalos adatokhoz közeli becslést adott ugyan, de több alkalommal is jócskán mellélőtt. Részben azért, mert korábbi járványok alapján állították be, egy-egy újabb járvány terjedési mintázatához viszont így nem feltétlenül passzolt, úgyhogy az algoritmusoknak folyamatosan tanulniuk kell.
Becsekkol a vírus
Tanulmányok sora foglalkozik a Twitteren alapulú módszerekkel is, és általában arra jutnak, hogy ezekelég pontosak ahhoz, hogy használhatók legyenek a járványkutatásban. Sőt, megbízhatóbbnak bizonyulnak a Google-féle trendelemzésnél is.
A Twitter csatasorba állításával már évek óta kísérleteznek. Az egyik első alkalmazás, amely a betegségekkel kapcsolatos tweeteket figyelte, a Germ Tracker volt 2012-ben. Ez azóta megszűnt, de ma is több hasonló szolgáltatást találni. A GermTrax is térképen mutatja a betegségeket, ahol különböző szűrőkkel kereshetünk a különféle nyavalyák között. A Sickweather telefonra is letölthető, és itt már konkrét riasztást is beállíthatunk egy-egy tartózkodási helyre, ha a Twitter- és Facebook-adatok alapján járvány várható arrafelé.
Kicsit más elven, de hasonlóan valós időben működik a Healthmap, amely nem a közösségi aktivitásra épít, hanem hivatalos forrásokból (például a WHO-tól) és hírfigyelőkből nyeri az adatokat, vagyis inkább a Public Alertshez hasonlít. (Ők külön oldalt szenteltek az ebolának is.) És lehetne még folytatni a sort, a közösségi oldalak mellett például blogposzt-elemzéssel is hasznos információhoz lehet jutni.
Digitális járványtan
Maga a CDC se zárkózik el a közösségi megoldások hasznosításától, sőt még egy versenyt is kiírtak tavaly év végén, hogy ösztönözzék a fejlesztéseket. A 2013-2014-es influenzaszezon legpontosabb megjóslói 75 ezer dollárt (kb 18 millió forintot) kapnak.
Ezeknek a módszereknek persze megvannak a maguk korlátai. Egyrészt nem minden korosztály és társadalmi csoport használja egyforma intenzitással az internetet, ráadásul az angol nyelv előnyt élvez ezeknél a vizsgálatoknál. Másrészt nagyon sok a zaj, vagyis az olyan adat, amely bizonyos paramétereiben relevánsnak tűnik, mégse bizonyul hasznos információnak a járványkutatás számára. Náksi vs Brunner Influenza című száma például zajnak minősül ilyen szempontból (is), ha valaki kiposztolja a falára, hiába tartalmazza a betegség nevét. Ezért fontos a zajszűrés, amelyre például a Johns Hopkins Egyetem csapata is ír algoritmusokat, hogy minél hatékonyabban meg lehessen tisztítani a nyers adathalmazt.
A laboratóriumi vizsgálatokat természetesen soha nem fogják tudni kiváltani a közösségi média figyelésére alapuló felügyeleti módszerek, viszont a járványok gyors megállításában, sőt akár megelőzésében fontos szerepük lehet, hiszen olyankor éppen a gyorsaságon múlhat minden.