Magamról

Saját fotó
Főiskolai, majd egyetemi diplomamunkáimtól kezdve világ életemben, adatok, adatbázisok, adattárházak (leginkább Oracle) környékén mozogtam. Mostanság adattárházasként, adatbányászként élem napjaimat.

2013. november 5., kedd

Budapest BI Fórum - nulladik nap ("Training Day")

.
Volt szerencsém résztvenni a mai tárgybeli rendezvényen, hálás vagyok a sorsnak, hogy eljutottam rá. Rég éreztem magam ilyen jól konferencián, a műfajt nekem találta ki Arató Bence, a fórum fő ötletgazdája és szervezője.. :)

Magam részéről, még az értékelés kitöltése elött vagyok, de tuti, hogy a legjobb ötösöket fogom adni (még ha esetleg egyedül is maradok vele, a kollégákkal szemben). :)

Egyetlen - lényeget nem érintő - kifogásom volt csak a mai nappal. Olyan keskenyek voltak az asztalok, hogy ha picit keskenyebbek lettek volna, a cirkuszi kötéltáncosnak is kvázi kihívás lett volna rajtuk végigmenni. ;) Az, hogy billentyűzetet csatolok a notebookomhoz, azt lehetett intenzíven elfelejteni. Plusz sokszor nagyon kicsik voltak a betűk a kivetítés során (de ez az én hibám, miért vagyok ennyire vaksi).

Nagyon jó, sőt zavarbaejtően jó volt a kínálat. Délelött is, délután is három workshop közül lehetett választani. Teljesen jogos, hogy a vizualizáció ekkora teret nyert, ahogy az adatbányászat sem kevésbé fontos téma. ;) Kár hogy Szűcs Imre végül nem tudta megtartani - érdeklődés hiányában? - a RapidMiner-es workshopot, pedig én jelentkeztem rá. :)

Végtelenül sajnáltam, hogy egy időben volt a SciKit Learn workshop illetve Prekopcsák Zoli adatvizualizálós workshopja (amit bővebben egyetemen tanít). Ezek között választani emberfeletti kihívás és nagyon sajnáltam, hogy lemaradtam Zoli sessionjéről. Ráadásul Zoli elmondása szerint intenzíven foglalkozott workshoptól függetlenül is a Tableau-val is :) Meg kéne látogatni az egyetemen azt a kurzust, nem?

Így végül ezeken voltam:

Délelött:
Olivier Grisel
Introduction to Machine Learning with IPython and scikit-learn

Délután:
Almar Klein
Workshop – Creating data visualizations with Python


Parádés volt a workshopok vezetőinek kiválasztása.  A szervező Arató Bence minden kalapemelést megérdemel. A fenti két szakember egyik sem pehelysúlyú, mert hát hiszen arról beszélnek, amin dolgoznak ("aki tudja csinálja, aki nem tudja az tanítja" szindromát teljességgel száműzve).

Olivier a SciKit Learn egyik fejlesztője,
Almar meg az VisVis ("fizfiz") és IEP, úgy mint Interactive Editor for Python megálmodója, kifejlesztője, illetve a VisPy contributora.

Egyikük sem cicózott, meg finomkodott. Rendesen berántották az interakciókba a résztvevő hallgatóságot, nem lehetett lemaradni, nem volt elég távolságot tartóan hallgatni csak az eőadókat :)

Bevallom eleinte egy kicsit féltem attól, hogy 6-7 óra kemény angol kiképzés lesz a két workshop, de pillanatokon belül elszállt az idő, ami azt jelentette, hogy totálisan lekötötte az embert és még csak nem is harcolódott le estére, annyi sikerélmény érte.


Olivier workshopja:

Elkészült egy ilyen friss sok mindenre kiterjedő, gyakorlatokkal is megspékelt nagyobb tutorial.
Ebből szemezgetve dolgoztunk mi is.
Nagyon ajánlom a megtekintését a téma iránt érdeklődőknek, legalább a tartalomjegyzéket.
https://github.com/jakevdp/sklearn_scipy2013

Olivier, csendes, közvetlen, segítőkész, felesleges beszédet hírből sem ismerő előadó volt, aki ráadásul francia nemzetisége ellenére gyönyörűen beszélte az angolt (az én fülemnek).
Olivier rendesen megpörgette  a tempót, kellett kapaszkodni, de cserébe nagyon sok mindenről szó volt és tényleg nagyon jó volt a tutorial.

Tanultam "hátasdobást" érő újat is:
- Ez az IPython tényleg komoly eszköz. :) Nem hiszem, hogy meglepő lenne, hogy én sokkal-sokkal  jobban szeretem ezt a fajtát, mint a Clementine/SAS Visual-Stream találmányát, még akkor is, ha a Visual Streameknek, pont az adatbányászatban látom a legtöbb értelmét.
- RandomizePCA, ami állítólag sokkal hatékonyabban tudja a közismert PCA-t.
- Meg van SVM és SVD után (Linear)SVC is. Az SV után lassan felsorolódik a teljes ABC :)

Öröm látni az "enterprise-ready" adatbányász-eszközök terjedését. By the way valaki hozzáértő elmagyarázhatná nekem alulképzett informatikusnak, hogy a korrupciót nem számbavéve kinek éri meg manapság horribilis pénzkötegeket a SAS-nak belapátolva SAS adatbányászeszközt használni. Egyáltalán miből él meg a SAS, korábbi évek szintjén, vagy növelve bevételeit?
- Ki fog elkezdeni 14.000 oszlopos pl.: Orange Datasetet klikkelgetve elemezni?
- Kinek elég a gyér feature selectionje?
- Hogyan lehet olyan kulcsfontosságú algoritmust használni benne, mint a semi-supervised algoritmusok?
- Hogyan lehet korrekten üzemeltetni, enterprise szinten, hogy a SAS ne szedje le a gatyáját is a felhasználónak?

Almar workshopja:

Szintén nagy tudású, közvetlen, segítőkész, rokonszenves szakember. Én nagyot küzdöttem az angoljával, alig-alig értettem, sajnos, de végül csak kihámoztam a lényeget, meg ami nekem fontos volt. Bár bevallom az OpenGL szekció egy-egy durvább részénél azért ledobtam a láncot (de azt lehet magyar nyelv esetén is)

Nagyon nagy örömömre szolgált, hogy megismerhettem az IEP-t. Ultra-brutál-jó eszköz. Egy élmény vele dolgozni. Egy dolog okoz fejfájást, hogy a Pythonos vizualizáló eszközök robbanásszerűen szaporodnak, ember legyen a talpán, aki érdemben le tudja őket követni.

A tutorialok, feladatok itt is érthetőek, végrehajthatók voltak. Mondjuk nem mondanám, hogy szakértője lettem a témának, de legalább nagyon élvezetes volt ez a fajta találkozás.

Nincsenek megjegyzések:

Megjegyzés küldése