Magamról

Saját fotó
Főiskolai, majd egyetemi diplomamunkáimtól kezdve világ életemben, adatok, adatbázisok, adattárházak (leginkább Oracle) környékén mozogtam. Mostanság adattárházasként, adatbányászként élem napjaimat.

2015. június 7., vasárnap

Alteryx - új Self-BI versenyző

.
Mivel a címbeli Alteryxről már írtam első (gyors) megközelítésben itt a blogon, Gyorsjegyzet az Alteryx-ről (ETL+Prediktív analitika) , így most egy második lassabb megközelítésben venném górcső alá a terméket, számomra izgalmas hét kérdéskörön keresztül, elfogulatlanságra törekedve, semmiképpen nem sales jellegű írásban.
 
(1) Számít-e az ÁR/Költség (abszolút értéke), szoftverbeszerzéseknél

* Tapasztalat, valóság
- Azt gondolom/valószínűsítem, hogy 100-ból közel 100-an "igen"-t mondanak erre a kérdésre.
- De, ha az lenne a felvetés, hogy a csillagrombolós költségvetésű például SAS, visszamérés alapján milyen megtérülési rátával használódik egy cégben, na ilyet nem volt szerencsém látni 30 év alatt sem.
- Pedig a szoftver-beszerzéseknél is, ahogy csomó más területen is, a tárgyilagos, explicit visszamérés kellene legyen a fejlődés motorjának, új szemléletek mérlegelésének, befogadásának az alapja, azt gondolom.
- Én nem vagyok képes mást konkludálni, minthogy az ár/költség nagyon gyenge magyarázó változó a használhatóság, elterjedtség számszerűsítéséhez.

* Egy józan megfontolás alapján:
- Adatbányászat, azon belül a prediktív analitika nagyon komoly és gyors információ- meg pénztermelésre alkalmas (szemben mondjuk egy adattárház megtérülési görbéjével)
- Kinél csapódjon le az így megtermelt jövedelem milyen arányban?
- Nálam, akinél keletkezik, egyéb befektetéseim révén is, ahol a (A) lokálspecifikus infó adott, (B) legális és jó ár-érték arányú eszközök elérhetők, (C) kiaknázási tudás is vehető a piacról, ha nem lenne (elég).
- Avagy a műszakilag sokszor indokolatlan extrapofitra hajtó eszközgyártó cégeknél, akik licence-t, oktatást, konzultációt, supporttal fejelik meg termékeiket borsos áron, mellette belekényszerítve verzió-upgrade ördögien költséges spiráljába? Előre lehúzva a sáp-ot a konkrét termék után, a vásárló meg futhat a pénze után, hogy kitermelje majd aztán esetleg hasznot is hozzon valamikor.
- Nekem szimpatikusabb az előbbi scenárió, vagyis ha én rakom össze magamnak ami nekem kell (ha tudom), külső impulzusokat szabályozott formában beengedve.
- A józan ész sokszor mondatja azt, hogy nem egy nagy monolitikus, brutális árú eszköz old meg jól problémákat, az idő változásához jól alkalmazkodva.

* Az ártényező mérlegelésének egyik nagy vízválasztója lehet: SUPPORT (fizetős) kell vagy nem kell
- ETL/Prediktív analitikára nagyon jó open source eszközök vannak
- A munkahelyem ügyfeleinél perdöntően igénylik a supportot, hogy van-e ingyenes community-opció
- Üzenet: a fizetős (bár régebben community editionben i elérhető volt) Alteryx nem versenytársa mondjuk egy open source/community edition-ös Knime-nak, csak és kizárlóag a fizetős SUPPORT-os közös nevezőn.

- Ártartomány: 10.000 USD – 100.000 USD(SAS, Salford System), persze lehetnek eltérések, outlierek.

Árak-Alteryx
- Desktop: 4.000 USD-től megy 40.000 USD-ig, de a legtöbbünknek elég a 4.000 USD (ha nem kell például térinformatika, vagy spéci adatbázisok)
- Szerver: 85.000 USD. Számora kérdés, hogy ennyiért kinek kellhet egyáltalán ilyen funkcionalitás. Évek hosszú sora alatt nem bírtam rájönni erre.

Alteryx: Olcsóbban kicsit többet és jobbat igyekszik ajánlani, mint a versenytársak. A piac majd eldönti mennyire életképes az árszabása, ami elsőre "kicsit" meredeknek tűnik.



(2) Agilitás támogatásának mértéke
* Tetszik nem tetszik, az agilitás mára központi kérdéssé nőtte ki magát. Olyan területekbe is betör, ahol legkevésbé várná az ember.
* Én bár sosem voltam igazán nagy fanja, értem és megértem a motivációit az agilitásnak.Van ahol van helye és/vagy lehet jól is csinálni. Az igazán nagy baj, hogy lehet "szakmai bűnözni" az agilitás során, és sajnos a gyarló ember sokszor esik bűnbe.
* Sokszor elégtelen tervezés jellemzi, érdemi hatásanalízis nélkül, egyik állapotból másik állapotba való eljutás céljával.
* Egyik mellékterméke a dolognak a dokumentáció teljes háttérbeszorulása (szóbeli meetingek javára), pedig szóban az ember sokkal felelőtlenebbül mond baromságokat, gondol végig kevésbé alaposabban tényezőket, egyszerűen a dolog korlátai miatt.
* Van aki odáig megy, hogy idő hiányában semmit sem olvas/értelmez csak kérdez (n-szer), aminek kellemetlen mellékhatásaként tud jutni bődületes következtetésekre, mert hogy annyira "agilis".
* Adatbányászatot is elérte az agilitás: adatdemokratizálás hátszelében nap mint nap versengünk információkért, következtetés levonásáért.
* A címbeli Self-BI utat tör magának, sok szempontból üdvözölhetően. Alapvetően ez is jó dolog, mint az agilitás, ha jól csinálja egy szervezet.
* A jó kis SQL helyett visual workflow a trendi immáron.
"Bezzeg az én idómben, amikor én voltam fiatal" :DDDDDDDD, alapkövetelmény volt az SQL. Kiváló platform volt információcserére üzleti és technikai területek között. Állítom nem nehéz valami az SQL (pl.: with clause intenzív használata mellett), annyival semmiképpen nem nehezebb, mint ártalmasabb sokszor a túlhajtott visual flow-k átláthatatlansága.
Alteryx: mivel perdöntõen Self-BI és nem Enterprise-Ready eszköz, így könnyedén kiszélesíti az eszközpalettát, az agilitás jegyében.


(3) Dinamikus alkalmazkodás lehetősége
* Monolit eszköz korlátai. Még egy Oracle sem volt képes, hogy termékpalettájában minden egyformán a legjobb legyen. Még a céljai között is az volt, hogy mind komponensben legalább az élmezőnyben legyenek. Amilyen jó volt a rdbms-e mindig is, emlékezzünk rá, hogy egy "Procedure Builder" mekkora közutálatnak bírt örvendeni.
* Rugalmasan lehessen eszközpalettát bõvíteni netán komponenseket cserélni, projekt függvényében. Amihez persze tudás kell. De legalább elmondható, hogy tudás a monolit eszköz kiaknázásához is kell: "nincs ingyen ebéd".
* Apache-projektek egyre inkább követelnek maguknak tért, hálistennek.A dinamikus alkalmazkodás csimborasszója, non-plus ultrája.... :)
Alteryx: -
- C-tõl, R-en át, Vizuális programozás lehetõsége.
- Magam részéről monolitikus wing2wing eszköznek mondanám (calgary db + etl + prediktív analitika + vizualizálás + alkalmazásépítés etc), annak ellenére, hogy nyitott platform meg pluginelhető. Vagy hogy egyes komponensei (db, etl, vizualizálás etc cserélhetők), ami alapjaiban kérdőjelezheti meg egyébként a termék koncepcióját.
- De mindebben legalább trendi, meg szeretik az ügyfelei. 
- Én akkor tudom támogatni ezt a monolitikusságot, ha a visual flow-ban értelmesebben helyet kap az SQL-ezés, az ETL-ezés részeként.
- Nekem is be kell látni, reális létező igény van arra is, hogy egy eszközzel oldhasson meg valaki mindent.


(4) Modularizálás-Integrálás
Alternatívák:
(A) Eszköz törekszik rá, hogy wing2wing lefedjen minden üzleti funkcionalitást. Tipikus példa SAS BW-STAT-BI-OPKUT etc.
(B) Eszköz egy konkrét üzleti funkcionalitásban törekszik nagyot dobni (Adatintegráció, ETL vagy vizualizáció), és nyitottsága révén kívülrõl bõvíthetõ. A legjobb komponensek tudjanak együtt dolgozni.
* Lokális specifikumok (igények, adottságok) integrálása vajon mennyire nehéz.
Alteryx: Bár van benne data blending, vizualizáció, egyértelműen az ETL/Prediktív analitika szélekörű támogatása a legnagyobb erõssége. Mint említettem, számomra az Alteryx alapvetően egyébként nagyon kiváló Self-BI és nem Enterprise-Ready eszköz, a tudását tekintve (például a vállalati folyamatok lokális specifikumainak nehéz integrálhatósága miatt is).


(5) Párhuzamosítás
Két véglet:
* Párhuzamos számolások brute force alapon történnek, hardver-alapon, egyébként sokszor jó skálázódási képességekkel. Analógiaként lásd a brutális árazású Oracle Exadata termékvonalat.
* Tudással kiváltani az extreme számítási igények végrehajtását, hogy ne is legyen rá szükség.
* Én természetesen az utóbbit preferálom teljes mellszélességgel, de az értelmes skálázásnak sem vagyok ellene. Én csak az Oracle Exadatát rühellem nagyon, már koncepcionálisan is.
Alteryx: Inkább utóbbit támogatja, saját magán belül: aztán a belőle kieső modelleket már lehet futtatni párhuzamos rendszereken is.


(6) Döntéselõkészítés BI-eszköz vásárlásánál
Két véglet
* Hit az emberben, emberi tudásban, emberi tudás "aggregálásában", a saját csapatban, hogy több ember közös célért egyre jobban hatékonyabban tud dolgozni
* Vallásos eszközáhítat jegyében egybites döntés alapján "igen-nem" használjuk ezt vagy azt az eszközt, csomó inegzakt homályos információra alapozva.
* Én természetesen az előbbit preferálom, míg az utóbbira látok több példát sajnos.
Alteryx: mindkettõre passzolhat, ezáltal lehet jól és rosszul használni. Alapvetõen drága eszköz („isteníthető vallásos eszközáhítat”), de Self-BI-ként használva agilis projektben megtérülhet. Legmagasabb szintû/legátfogóbb Data Scientist tool, modern követelményekkel összhangban.


(7) Alteryx pozicionálása

BI Kombó nagyszerûségének megítélhetőségi ismérvei

* Teljeskörû BI-lefedettség a komponensek által
* Diszjunktivitás (redundancia- vagy más szóval átfedés-mentesség)
* Kötelezõ=mandatory jelleg a komponensekre, értve ez alatt, hogy van releváns hozzáadott értéke a szereplő komponenseknek: árukapcsolásnak a látszatát is kerülni.
* Magasfokú nagyon szoros integráció a komponensek között
* Üzleti követelmények maximalizálása enterprise feature-k számossága, és szolgáltatott minőségeik
* Technikai követelmények, elvárások minimalizálása, ne kelljen C-ben, SQL-ben programozni tudni ("pokolra alászállni") egy-egy fontos üzleti követelmény teljesíthetősége érdekében (akinek ez szempont, ugye).

Alteryx mint a BI-kombó középsõ tagja Tegyük fel van VirtDB-nk (heterogén adatforrásaink SQL-eléréssel) és van R-ünk (VirtDB + SQL + R)

- Data Blending nem árt ha többen többféleképpen, többféle kedvező kimenettel támogatják.
- Térinformatikai analitika
- Olyan további node-ok érhetõk el pluszban, amik nincsenek R-ben
- Alkalmazás-fejlesztés klikkeléssel
- Enterprise üzemeltetheto-supportált folyamatszervezés
- Csapatmunka (Server-verzióban)
- Tökéletes vizualizáció-elõkészítés Tableau irányába

Kedvenc ábrám az Alteryx- doksiból.
Gyönyörűen mutatja meg az SQL-elemek megfeleltetését a visual-flow elemekre.
És mindez azért izgalmas, mert mutatja egyúttal mennyire könnyű lehet az SQL, jó szemlélettel.



BI-Platformok vezetõ szállítói 2015-Február


Fejlett Analitikai Platformok vezetõ szállítói 2015-Február



Alteryx-konklúzió/predikció
Akkor életképes Self-BI termék (jelenlegi árazási modell szerint), ha
* Dörömbölnek az ajtón a data scientist-kandidálók tömege (feladatokkal), de a Python / R / Octave / SQL kombó túl durva számukra
* Kell egy jó eszköz humán tudás-aggregáláshoz.
* Tavalyhoz képest 29-dik helyről jött fel 19-dikre, közvetlenül az IBM-SPSS termékvonal mögé, a kdnuggets data science-eszközök szavazásán. Ez óriási szó egy újonctól, talán kicsit korán jött elismerés. Ráadásul nagyon magas 40%-os aránya a szavazóknak, akik csak ezt használják...


Analytics, Data Mining, Data Science software/tools used in the past 12 months



Alteryx Demo: File Converter
- Csak két node, amihez 100+ nagyságrendben csatlakozik egyéb hasonló eszköz.
- Láthatjuk a legördülõ listában az input és output formátumok széles választékát
- Meg tud jelenni a VirtDB, ODBC-ként, mindenképpen, de késõbb natívan is akár (mint az Oracle).
- Látszik a Tableau-val való szoros integráció (.TDE állományokon keresztül)
- Napi gyakorlatban használható Data Wrangling tool (nagyságrendileg 100+ hasonló van még az Alteryxben)

Nincsenek megjegyzések:

Megjegyzés küldése