Magamról

Saját fotó
Főiskolai, majd egyetemi diplomamunkáimtól kezdve világ életemben, adatok, adatbázisok, adattárházak (leginkább Oracle) környékén mozogtam. Mostanság adattárházasként, adatbányászként élem napjaimat.

2017. április 13., csütörtök

A "Black Swan"-elmélet meg a "Cauchy-mód" - 2.menet

A "Black Swan"-elmélet meg a "Cauchy-mód"

Mai blogposztomra, ritka fehér hollóként, ám annál értékesebb és érdekesebb kommentet kaptam. Köszönöm a kommentet. Meg sem kísérlem szimpla egy soros válaszban elintézni, igyekszem pontokba szedve, sorrendben válaszolni.
"Én a legnagyobb problémának azt érzem, hogy nincs adat, ami alapján ki lehet számolni, mi fog történni. A történelem értelmezése és a jövő kikövetkeztetése analógiákban működik, de ha kevés az adat, hogy mondod meg, mivel áll fenn az analógia? Sok meglepetés abból adódik, hogy rosszul lett kiválasztva az analógia. Ezért váratlan egy esemény, nem azért, mert valóban váratlan volt. (Értsd: Csak neked volt váratlan, aki benézted az analógiát.)
Amit látsz magad körül, gyakorlatilag marketing kommunikáció, nincs információ-értéke. Az ilyen blogok, mint amit idéztél, a nulla információ és a kamuk alapján alakítanak ki véleményt. Ez szellemi gyakorlatnak, időtöltésnek tök jó, annál többre aligha. A politikai párt az a ritka termék, aminek a reális értékét szinte lehetetlen megítélni. Ha van egy valódi előnye, észérve, nem azt fogja mondani, mert észérvekkel nem lehet semmit se eladni.
De azt se gondolom, hogy a politikusok tisztán látnak. A stabil vásárlóréteg (elvakult szavazók) szűk, nehezen tudsz mérni. Nem derül ki, hogy a többiek mit gondolnak, mert nincs, ahol kiderüljön. A leveles konzultáció egyértelműen mérés szerintem, de nagyon limitált adatot fog hozni. Megmutatja a biztos szavazók és a biztos ellenszavazók egy részét, de mi van a többiekkel? "

* Az adatbányászat valóban extenzív ÉS intenzív értelemben nagy(obb) adathalmazokon szeret dolgozni, ráadásul nem hosszútávra, "láncosan" előrejelezve (ezért marhaság 60 évre előre hőhalált vizionálni a klímaváltozás mentén). Nemhogy 2018-ra nem tudunk mondani semmit, de még sokszor a holnapra sem. Ezért szoktam óva inteni mindig a fejben lejátszásoktól. Az élet távolról sem fonalas (sakk) vagy pláne predesztináltnak (teológiai értelemben) érzékelt az adatbányász számára.

* Előrejelzést lehet készíteni arra "legálisan", hogy 2018 áprilisában bukik-e vagy sem a Fidesz. Síma binomiális (másképpen "egybites") leképezés ez. Hozzá a globális elektronikus média korában irdatlan nagy tömegű szöveg áll rendelkezésre ("Big Data"). Azaz sok adat az mindenképpen rendelkezésre áll. Ráadásul a mai (elosztott) számítógépes kapacitásokkal olcsón fel is dolgozható. Az egyetlen ami kérdés, hogy mennyire jól, megbízhatóan (mert ez már humántudás-specifikus). Én jelen állás szerint afelé hajlok, hogy nem elég jól, és a Black Swan teóriát is érvnek érzem emellett.

* Én imádom az analógiákat, rengetegszer keresem is őket leírt betűimben. De kizárólag jelen és múltbeli eseményekre. Jövőbeli eseményekre szigorúan nem szabad használni véleményem szerint, mert túl komplexek (természetüknél fogva). Az adatbányász/data scientist "data jujitsu" keretében mindig transzformálja a ("megrendelő" által felvetett) alapproblémát, lehetőség szerint kevés veszteséggel, ám jóval könnyebben, megbízhatóbban kezelhető egyszerűbb problémára. Ilyen egyszerűsítés a fentebb említett "bukik-e vagy sem" kérdés feltevés, a például "mikor bukik" vagy "hogyan bukik" kérdésekhez képest. És ehhez képest próbálunk meg magyarázó változókat keresni. Egy rövid blogposzt nem engedheti meg magának a számok nyelvére lefordított teljes reprezentációt (magyarázó változók keretében), de arra enged teret, hogy magyarázó erő szerinti erősség  tekintetében fókuszt próbáljon keresni.

* Nem igazán értettelek: tagadnád a váratlan létezését (analógia-benézés mentén)? Szerintem a váratlan abszolút létező dolog, ha tagadjuk, akkor a Black Swan teória mintha egyazegyben kuka lenne. Ha tágabb értelemben nézzük, akkor a "váratlan" korrekt modellezésével, kezelésével adós még az adatbányászat, ha egyáltalán ez lehetséges. Sem a hatótényezők lajstromozása, sem keretekbe szorítása (akár a "végtelenből" vagy precízebben szólva beláthatatlanul sokból), sem helyes súlyozása az én tudtommal még nem kitalált a szakmában. Én jelen állás szerint szkeptikus vagyok, viszont egyúttal érdeklődő is az ügyben :)

* Marketing-kommunikáció topik. Nagyon örülök, hogy előkerült, én is nagyon fontosnak érzem, ám súlypontilag én kicsit másképpen értékelem. Azt gondolom egyfelöl, hogy ezt a Fidesz emelte piedesztálra és vitte leginkább tökélyre. Korábban ez minőségileg kisebb nagyságrendben ment. Illetve másfelöl hiszem (és bevallom szeretném), hogy meg is bukik, a Fidesszel együtt és azért mert értelmezésemben ez 100% vegytiszta hatalomtechnika csak. A plebs - velem együtt - meg nem ebben érdekelt. Ez implikálja azt is, hogy nézetem szerint nem más megközelítésű ám műfajában ugyanolyan  marketing-kommunikációval kell harcolni ellene, hanem valami teljesen mással.

* Ettől a marketing-kommunikációtól függetlennek érzem a generáló poszt irányába írt szigorú soraidat. Abban egyetértek, hogy nem megalapozott a poszt (én is írtam a fejben lejátszás kapcsán). abban viszont már nem, hogy (1) ezért intellektuális "onanizáláson" felül nem is érdemes vele foglalkozni (2) marketing-kommunikáció lenne. A poszt értelmezésemben egy (mint megbeszéltük hibás) szubjektív vélemény, valamiféle cselekvési terv kontextusba helyezése kapcsán. Sem több, sem kevesebb. Továbbá azt is gondolom, hogy a posztot rombadöntő hiba (mint legfontosabb posztból eredő információ) előkerülése önmagában érték, mert (nem marketing-alapú) kommunikációt inspirálhat, aminek kimenetelét nem ismer(het)jük még. Hétköznapian szólva: nem magának a posztnak, hanem a jövőbeli folyamatos (együtt)gondolkodásnak kell a világot "megváltania".

* Záró soraid egybevágnak az én gondolataimmal is. Én úgy fogalmaztam, hogy közvéleménymérés önmagában nagyon kevés, ennél sokkal-sokkal több kell bármiféle komolyanvehető stratégiához, taktikához, látszólagosan betonbiztos alapok mellett is. Én aminek nagyon szurkolok, hogy minél inkább térjünk vissza a valósághoz, meg annak méréséhez. Adatbányászként nem is gondolhatok másra.

2 megjegyzés:

  1. Szerintem az analógia-képzés a legritkábban tudatos, és az egyes ember szűk környezetében ugyanúgy működik, mint a társadalomban. Megfigyeled, hogy ha a,b és c van, akkor általában k. Amikor egy új eseménynél látod, hogy a,b és c, megjóslod, hogy k. Nemsokára, már ha csak annyit látsz, hogy a, akkor is megjóslod, hogy k, mert kiegészíted azzal, hogy szerinted b és c is. Amikor kiderül, hogy nem k, hanem l, ami egyébként rendszeresen jár együtt az a, d, e elemekkel, azt mondod, ez véletlen, kivétel a szabály alól. Meggyőzni nyilván nem szeretnék erről senkit, de én ezt így érzékelem. Az ember "nagyképűsége" nem abban áll, hogy nem tudja elképzelni a véletlent, hanem hogy hiányos adatokból következtet. Létezik-e véletlen? Nem tudom, de azt gondolom, ha létezik is, ritkább, mint mi gondoljuk. Társadalmi változásoknál még rosszabb a helyzet, mint a magánéletnél. Konkrétan esélyünk sincs tudni azokat az elemeket, amikből bármit ki lehetne következtetni.
    A marketing-kommunikáció bukása engem nagy örömmel töltene el, de szerintem nem fog megtörténni. Azt kell mondani az embereknek, amire rezonálnak. Az észérvekre, logikára szinte senki se rezonál. Ez nekem szomorú tapasztalatom, de sajnos el kell fogadni annak, aki nagy mennyiségben szeretne eladni valamit. A Fidesz ezt okosan csinálta, jobban, mint az elődei. A plebs nem ebben érdekelt, de erre vágyik. Ha olvasol kormánypárti kommentelőket, gyakori téma, hogy embereknek a Fidesz adott büszkeséget, öntudatot. Nem mondhatod meg az embereknek, hogy mire kéne, hogy vágyjanak a te észérveid mentén. Én ebben látom a liberális politika legnagyobb hibáját.

    VálaszTörlés
    Válaszok
    1. :) Köszönöm és ismét csak nagyon örülök soraidnak.
      * Szerintem jellemzően tudatos az analógiaképzés, azáltal, hogy keresni kell. Nem jön az szembe csak úgy magától, márcsak azért is, mert agymunkával függ össze.
      * Amit a betűsített változókkal modellezel, az alapvetően relációs gondolkodással(lásd SQL) rokon. Amivel nagyon sokféle kérdést, nagyon erős módon, nagyon jól meg lehet válaszolni. Az a baj, hogy korlátokba ütközik a kérdezés azzal, hogy minden tényezője explicit. Az adatbányászat pont ezen az SQL-en akar túl lépni (elvi alapon!) avval, hogy ismeretlen és/vagy nemtriviális összefüggéseket/mintázatokat próbál azonosítani a rendelkezésre álló nagytömegű adatokon belül.
      Mondok egy kifejezetten NEM aktuálpolitikai példát. A cégek rengeteg pénzt ölnek abba, hogy minél többet tudjanak ügyfeleikről. Rengeteg kérdést, szempontot tudnak SQL-jeikbe, OLAP-kockáikba belevinni. Azonban, ha az a kérdés, hogy melyik ügyfél fog elvándorolni (másik szolgáltatóhoz), ahhoz ezek az eszközök nem elégségesek: csak és kizárólag adatbányászat tudhat tudományosan korrekt eredményt felmutatni.
      * Szerintem érdemes szétválasztani a véletlent a megismerhetőségtől, mivel lehet e szétválasztáshoz információnk/tudásunk.
      Szerencsejáték: napnál világosabb, hogy egy Lottó5 normál esetben semmilyen adatbányászati trükkel nem hackelhető meg (nyerőstratégia értelemben). Arra viszont nehéz fogadni, hogy világon senki nem jön ki pozitívan a például a tippmixből, véletlen feletti tudatos stratégia eredményeként. Az, hogy mégse tippmix-milliárdosok tegyék tönkre exponenciálisan a Szerencsejáték Zrt-ket, ahhoz nagyon komoly, historikus, minőségi, perdöntően nem publikus/hozzáférhető adatbázisok, nagyon komoly tudás/emberi erőforrások (manualitásokkal spékelten is) kellenek, meg fogadási limitek kontrollálják (meg persze inkorrekt játékszervezés, ami a jellemző magyar esetben, a mohó kapzsiság mentén).
      * Marketing-kommunikáció. Én optimista/optimistább vagyok e téren, de erre meggyőző érvem valóban nincs. Én azt gondolom a marketing eleve "bűnben fogant" (hiába van esetleg vállalható eszköze is, amit még én is be tudok vállalni). Fejlődésében meg látnivalóan olyan, mint a pornó: egyre durvább akciók kellenek a "kielégüléshez". Míg másik oldalról a sorozatos és/vagy egyre durvább (esetünkben politikai) hibák meg komfortzónát üthetnek át, kognitív disszonanciát oldhatnak fel, és ami fő, hogy kontrollálhatatlan folyamatok keretében.

      Törlés