Magamról

Saját fotó
Főiskolai, majd egyetemi diplomamunkáimtól kezdve világ életemben, adatok, adatbázisok, adattárházak (leginkább Oracle) környékén mozogtam. Mostanság adattárházasként, adatbányászként élem napjaimat.

2013. november 7., csütörtök

Budapest BI Fórum - második nap ("Innovatív BI")

.
Az idő haladtával, meg fáradásommal(?) fordított arányban egyre csökkent a lelkesedésem a konferencián. :(

Immáron nem is adok teljes feedbacket, nem is linkelek, csak pár dolgot elvenítenék fel, nagyon sötét meg kritikus tónusban. Még az is lehet, hogy megbánom....

Mintha elérkeztünk annak a konferencia-modellnek korlátaihoz, amikor fizetett szponzori előadásokért fizet a hallgatóság (és adott esetben kínlódja végig). Egy "Open"-konferenciánál nehéz elképzelni ilyen gondokat. Másik megközelítésben szponzorság ide vagy oda, csak megfelelő szinvonal esetében engednék bárkit is mikrofonhoz (plenáris előadásoknál hatványozottan), illetve nem utasítanék el jó, de pénzzel nem szponzoráló előadást (ha véletlenül lenne ilyen). Azaz szakmai alapon való kőkemény szelektálást tartanám üdvözítőnek. Persze lehet, hogy ez idealisztikus és elérhetetlen vágyálom, de célként akkor is megfogalmazható talán.

1.
Már rögtön a konferenciaszervező Arató Bence előadásával voltak gondjaim. Amit tudni érdemes rólam:
- Nagyon szerettem korábban Bence elődásait, akkor is ha hihetetlen sebességgel beszélt, és nem is mindig értettem mindent.
- Van tehát összehasonlítási alapom, hiszen korábban csak magyarul adott elő, most hallottam először angolul előadni.

A tempó lassabb lett az angollal ;), értettem is mindent az előadásból immáron, mégis nagyon hiányoltam azokat a magyar ízeket, magyar poénokat, amiket esetleg egyetlen külföldi sem ért, és ami oly emlékezetessé tették mindig is Bence prezentációit. Magam részéről lemondtam volna a 100%-os teljeskörű érthetőségről ;)

Önmagában már azt sem értettem miért kellett angolul beszélnie. Nyitó előadás volt. A külföldi vendégek maximum tovább aludtak volna ma. ;) Azt látom/érzékelem, hogy mi hallgatóság mivel lettünk kevesebbek, azt viszont nem látom cserébe, hogy milyen hozzáadott érték származott ebből (konferencia szempontjából).

További gondom volt, hogy a prezentációját arra lőtte el, hogy elemezte a BI-felhasználói felmérés adatait. Nem mondom, hogy ez nem fontos téma, de szinte bármi másra szívesen lecseréltem volna. Túl "könnyű" feladat, kvázi "töltelék", nyitó plenáris előadást erre a témára pazarolni, legyen bármilyen érdekes és fontos is. Illetve nagyon hiányoltam Bencénél a "(BI-)evangélista" attitűdöt, amikor akár nonkonformista - úgymond "nem konfliktuskerülő" - módon is, akár merészen is érvelve beszélne saját - szakmát érintő - meglátásairól, egyfajta - horribile dictu javító szándékú - vízióvázolást - de jó szó :) - átnyújtva a hallgatóságnak. Arról már nem is beszélve, hogy Bence van már olyan pozicióban BI-t illetően, hogy ilyen fajta említett áttörést is megtehetné. Mindez különösen annak fényében fontos, hogy mennyire tudna így is tartalmasan megtölteni előadást. A teljes problémakikerülés sok más hibája mellett unalmassá is tud válni (mármint a konferencia közvetítette üzenet teljes egészét és távolról nézve).
Szóval egy szónak is száz a vége, nagyon hiányoltam Bence intenzívebb jelenlétét.

Aztán. Helyenként nem éreztem helyesnek a súlyozást. A "mobility" biztos fontos, viszont túl lehet hajtani. Nem lehet cél, hogy a menedzser wc-n ülve is nyomkodja a telefonját, sales chartokat nézegetve, így is minden határon túl nyomatva a content-et. Viszont a collaboration az a téma, amit nem lehet eléggé hangsúlyozni, nem lehet túlzásba vinni, az én értelmezésemben. Főleg a gyér eredményeket látva.

Aztán tényleg fontos dolog a Data Blending. De nem lehet csak egyoldalúan nézni. Maximálisan egyetértek azzal a másutt elhangzó kommenttel, hogy hiába okos egy üzleti felhasználó, adott esetben hárman négyfélét gondolnak csak egy fiscal year-ről, mint olyanról, amiről az ember azt gondolná, hogy konszenzusos dolog (valós tapasztalat). És akkor egy szót sem beszéltem az "átlagegyenlegről", aminél két egyforma definiciót én még nem hallottam. ;) Ha egy korrekt MDM-es adattárházépítés nem megy (jól) egy cégnél, akkor a "Tableau-szigetecskék"  mintől lennének jók önmagukban? Szóval jó a dolog a gyors adatgazdagítás, de hinni is kell benne egy külső értelmezőnek, ami nem jön automatikusan a Data Blending megvalósításokkal.

Collaboration, mint már említettem, nálam komoly vesszőparipa. A fasorba' sincs viszont az arról való gondolkodás, hogy hogyan tudnak összeadódni a BI-ból származó értékek ("aggregálódni" a lokális vállalati tudás), egy vállalaton belül.

Kimondatlanul is látnivalóan terjed az agilis projektek koncentrációja a világban (BI-ban is). Érdemes lett volna pár gondolatot szentelni neki, ha már a kontextus komolyan felmerült a BI projektek átfutását illetően.

Bence értelemszerűen nem tehet róla (maximum esetleg "ragozhatta" volna előadásában), de az enterprise riporting 84%-a ritka elkeserítő adat 2013-ban. Azt gondolom az egész BI szégyene, a megmozgatott pénztömegek fényében.

2.
Spotfire-előadás az egész teljes konferencia abszolút mélypontja volt nulla Kelvinnél megállva. Valós üzenet nélküli közhelygyűjtemény volt, lassított felvételben. Nálam egyes alá. Még az utóvizsgadíjat is emelt tarifával szabnám ki.;)

3.
Hogy mennyire nem az én napom volt a mai, azt bizonyítja, hogy Földi Tamás (egész nap legjobb prezentációjára is) csak egy erős hármast tudnék adni. Persze az előadás módja az csillagos ötös volt most is (humor, figyelemfókuszálás, remek kérdések kihajtása a közönségből, értékes - marketingen túli - infók koncentrálása stb.).

Ab ovo hányast lehet adni egy olyan előadásra, ami az egész ipar legvisszataszítóbb figurájának Mark Zuckerberg (Facebook) pozitív kontextusú idézetével nyit és alapoz meg? ;)

MZ nagy mondása, hogy alkalmazottainek minden neki kellő adatot biztosítani kell. Ez lenne az adatvezérelt vállalat eszményének egyik központi üzenete. (Egy MIT felmérés pedig azt mondja, hogy ezáltal nagyobb profitalbilitás érhető el ezen az úton. Optimalizálni kéne tehát az "ember-élmény-idő" háromság mentén a témát).

De például nagyon hiányoltam az adatvezérelt vállalat koncepciójának teljesebbkörű cost-benefit elemzését. Nyilván a  marketing nem szereti hangsúlyozni a hátrányokat, mégis ennél a témánál annyira kilóg a ("hátrány-")lóláb, hogy legalább említés szintjén érdemes lett volna egy mondatot áldozni rá. Az adathozzáférés demokratizálása jól hangzó jelszó, de lássuk be nemkevés problémát generál is.

Az egy dolog, hogy nincs ODBC a Tableau-hoz. De az "adatdemokratizáláshoz" nálam hozzátartozna, hogy míg a Tableau ugyan nagyon jól integrálja a legkülönfélébb adatforrásokat, sőt még API-t is ad saját magához. Csak éppen belőle (TDE-kből) nem lehet már értelmesen kinyerni adatot (sőt keresztbe is fekszik a kívánságnak és megoldási alternatíváinak a Tableau-t gyártó cég). Éppúgy, mint az Oraclenél, ahol az Sql*Loader úgy szenzációs program, hogy csak éppen az Sql*Unloader párja hiányzik. Milyen "demokrácia" ez? A XXI.században? Én - korábbi blogposztjaim tanusíthatják - nagy rajongója vagyok a Tableaunak. De a fentiek miatt akkora (egyébként eddig csak egyetlen) feketepontot vések be a Tableau-nak, hogy a világ legnagyobb ellenörzőkönyvébe sem fér bele.

Aztán. Legalább Tamástól elvártam volna, hogy a vállalaton belüli 8%-os BI-felhasználói arányra legalább egy pillanatra felhúzza a szemöldökét. De meg is fordíthatom a dolgot. Ha sikerül elérni a 80%-ot (az említett "demokratizálással") akkor annak is van nem kevés továbbgondolnivaló vonzata. Nem úgy megy ez, hogy pusztán bele kell fújni a kecske seggébe, aztán csak ki kell várni, amíg kiegyenesedik a kecske szarva, csupáncsak teorotikus alapokon sem (nemhogy implementálásnál).

Látványos volt a record count(*) gyorsaságának érzékeltetése (interneten keresztül) Vectorwise-nál, de egyrészt a Vectorwise tárolja az információt (nem kell röptében kalkulálni), másrészt még egy Oraclenél is ad abszurdum lehet friss statisztika révén a teljes tábla-végigolvasás nélkül egy nagyságrendileg jó számhoz jutni villámgyorsan. (Persze elismerem, hogy egy rövid előadásban nem lehet mindenre kitérni idő hiányában, pláne, ha a lényeget nem érinti)

És ha már a Vectorwise ennyire piedesztálra került, akkor én érzékeltettem volna, hogy egy komplett üzemeltetési rémálom, nehezen skálázódik a felhasználói bázis növekedésére, adatpiacépítésnél meg nem tiviális a potenciális vakvágányokat kikerülni (amin csak továbbrontanak elképesztő spéci hülyeségei). De még ha csak ingyenes esetben lennének ezek a problémák: de nem, a kőkemény fizetős opcióban is megállnak. Mondom mindezt akkor is, ha korábbi blogposztomban megelőlegezve a bizalmat egy Ingres-származéknak, én is lelkendeztem vele kapcsolatban. Figyelem! Ez önkritika volt! :)

Ugyanígy a felskálázott 300 milliós adatállománnyal nyilván jobban megküzdött a Tableau (Vectorwise-os oszloptömörítés miatt), mint általában. Miközben nemlehet eléggé hangsúlyozni, hogy mennyire komoly kihívás a Tableau korlátait mindezek nélkül is feszegetni (méretben, lekérdezés-sebességben). Mi sem bizonyítja mindezt, hogy a cachelést is milyen nagyvonalúan intézi el, hiszen, milyen gyors ugye. ;)

Részemről úgy tisztességes, hogy a nagyon jó "mémeket" is hangsúlyozzam az előadásból:
- In-Memory Database, az a Microsoft Access úgymond átcsomagolása :)
- Önkiszolgáló BI helyett önellátó BI.
- Tableau fénysebességgel működik (300 millió rekordos dataset egy másodpercen belüli firtatása, nem saját proprietary formátumán, hanem 3rdparty adatbázison, no meg interneten keresztül is.

4.
Jópofa volt az Endeca Information Discovery, de én nagyon hiányoltam az Oracle*Text kontextusát.

5.
"BI natív nyelveken" érdekes cím volt, ki nem hagytam volna. ;) Ráadásul újabb löketként meg lehetett kapni a funkcionális nyelvek (itt F#) fontosságát, támogatva annak megértését, miért része egyre inkább egy  informatikai álláshirdetési folyamatnak. Mondjuk hazudnék, ha azt mondanám, mindent értettem az előadásból, meg teljeskörű betekintést nyertem a témába, de, hogy jó irány az nem lehet kétséges.

6.
Jó volt a méltatlanul elhanyagolt Knime kapcsán hallani:
- magáról az eszközről, meg
- a benne implementált szövegbányászattal kombinált hálózat-elemzésről. Nyilván nem a világ első ilyen projektje, de, hogy megy open source alapokon, azért az jó érzéssel tölti el az embert, akkor is ha van még mit fejlődnie a témában.
Kiváncsi vagyok mennyire fog tudni konkurálni a RapidMinerrel, az utóbbit mintha lépéselőnyben lévőnek érezném, noha ez nem mindig volt így.
Az mindenesetre nem semmi, hogy a Knimében 1000 különböző nodetípus van. Ez a "hátastdobás" mindősített esete. ;)

7.
Az utolsó két slideja nagyon tetszett a Twitter-Spamolás klasszifikációjának előadóhölgyétől (mik a fontos változók, mik a konklúziók). De az SVM hihetetlen "mélyrepülése" a projektben alapjaiban ásta alá nálam a hihetőséget.

8.
A basket-value lifting se volt egy sikerült előadás, pláne a sötét hátterű, sötét apróbb betükkel ít szövegezésű slideok révén sem. Épp ideje volt, hogy véget érjen a konferencia vele. ;)

Volt még a dashboard-verseny. Bencének pár óriási poénja volt:
- Tavaly annyira népszerű volt, hogy gondolkodóba esett: ejti a konferenciát és maratoni 48 órás dashboard-versenyt hirdet csak. :)
- A dashboard-versenyzőket szimplán "megélhetési dashboard-készítőknek" titulálta :), buzdítva az üzleti felhasználókat a jövő évi pályázásra.
- Az ember azt hinné, hogy dashboard-bemutatásra eszement kevés az öt perc. Ehhez képest szinte senki nem töltötte ki az öt percet, a győztes meg egyenesen csak két percet beszélt (igaz azt nagyon tartalmasan)

A konkrét Dashboardtól föggetlenül én picit csalódtam a Qlikview-ban (mint eszközben). Amúgy meg biztos megosztja a világot a címkefelhő, de nekem itt bejött. :)

Nem volt Spotfire-es pályázó. Tudom-tudom: övön aluli poén... ;)

Lenyügöző volt látni, hogy valaki saját eszközzel pályázott. Függetlenül a sikerességétől, egy kalapemelést mindenképpen megérdemel.

Én kezdtem szívembe zárni a Pentahós dashboardot, azt hívén, hogy ez is ingyenes open source. De aztán a Tableau nem akadt benne sem konkurensére. ;)

Nincsenek megjegyzések:

Megjegyzés küldése