Magamról

Saját fotó
Főiskolai, majd egyetemi diplomamunkáimtól kezdve világ életemben, adatok, adatbázisok, adattárházak (leginkább Oracle) környékén mozogtam. Mostanság adattárházasként, adatbányászként élem napjaimat.

2014. augusztus 25., hétfő

Gyorsjegyzet az Alteryx-ről (ETL+Prediktív analitika)

.
* Nicsak!
Kihívója lett az IBM SPSS Modeler-nek. :)
No meg persze immáron sok tárgybavágó open source cuccnak. ;)
Egy újabb (adatbányászatban kellemes, hatékony, jó támogatású, szemben az ETL-lel, ahol szerintem közel nem ennyire egészséges már, a stream-méretek miatt) visual stream-es eszköz.
Kb. 700MB-ban előadva.

És az mind semmi, úgy pénzes (meg töredékárú) a termék, hogy mintha időben visszautaztunk volna egy "kissé". És ami (szerintem nem kívánatosan) trendszerűen megjelenik mindkettőben: GUI-s felületen ETL + Adatbányászat. (Én ugyanis két külön "szakmának" tartom az ETL-t illetve az adatbányászatot, még ha indokolt is köztük iteráció, például adatgazdagítás célzattal is.

*  A BI.hu-n is csak egy Gartneres Magic Quadrantban szerepel eddig, ráadásul abban szerintem eléggé vitatható módon. A viziónárius tengelyen jóval előrébb sorolva, mint megérdemelné szvsz, viszont a kiforrottsági tengelyen meg hátrébb van sorolva, ami tekintve a platform érettségét, nyitottságát, hatékonyságát legalábbbis fura, főleg hogy még egy RapidMinerhez képest is ekkora a távolság.

* Kezdjük az árral, főleg, hogy "követi" valamennyire az egyébként számára is fontos Tableau-t. 4.000 USD (desktop, 1 user), a Tableau 1.600-2.000 USD-jéhez képest nem lenne sok, még mondanám is, hogy nagyon megéri, főleg az IBM-es 25.000 USD-hez képest. A ciki csak az, hogy ezt évenként kell kicsengetni, és így már rögtön más a leányzó fekvése. De legalább publikus az ár, lehet vele tervezni, szemben az IBM erősen vitatható árképzési gyakorlatával.

* Miért az időutazás feeling (időben visszafele)? Hát mert C/C++ban íródott, nem Javá-ban, vagy legalább Pythonban, mint a Tableau is, bővíteni is így lehet elsősorban.

* Mi jogos a viziónáriusságban? Hát az önkiszolgáló BI (amúgy általam mindig vitatott) erőteljes támogatása, Cloud-technológiák támogatásával is megspékelve. Én értem, hogy egyre okosabbak az analitikusok, egyre inkább nagyobb szabadságot akar a világ a kezükbe adni, egyfajta demokratizálódás jegyében is (mindenki egyformán gyorsan jusson a neki kellő adathoz). Egyre komplexebb infókra van szükség, egyre rövidebb idő alatt.
De ha közben szétesik a vállalati adatmodell, ha ugyanarról az üzleti fogalomról nem egyforma, sőt akár nagyságrendi tévedést is hordozó számok keringenek, akkor logikusan merül fel a kérdés az emberben, hogy hová a nagy kapkodás?

* Érdemes megnézni a technikai specifikációt.  Kellemes benne az
- SPSS/SAS fileformátumok támogatása
- Térinformatika támogatása
- SQLite-tól teradatáig való támogatás, modernkori egzotikumokkal, vadhajtásokkal együtt.
- Külön kiemelném a Pivotal Greenplum-ot, amint a jövő nagy ígéretét.
- Integrált API-k (pl.: Google Analytics)
- Ami leginkább szembetűnik a Data Blending és Cloud feltétlen támogatása

* Érdemes nézegetni a jól megírt prezentációkat.

* Érdemes a folyamatosan bővülő gallériát is nézegetni.

* Hihetetlenül erős a GUI-s felhasználói interface a szoftverben. Végre nem kell egérkilométereket tenni, ha adatot akarunk látni, sőt az egér korrekten használható, szemben az AWT rettenetes örökségét hordozó IBM SPSS Modelerrel.




* Öröm látni a terjedő ZIP-es, XML-es internal file-formátumot.

* Poén volt érzékelni a prediktív analitikának olyan túlhajtását, mint "predictive grouping/csoportosítás". :DDDD Ugye a prediktálás az klasszikusan az osztályozás egy speciális fajtája, míg a csoportosítás egy tök más dolog. Noha én egyébként (szakmával nem igazán egyetérve) nem érzem oly távol egymástól a két "technológiát". Lásd hozzá például a Semi Supervise Learninget, ahol,csak nagyon kevés cimke szokott lenni, nagyon sok csoportosítatlan adathoz.

* Érdemes a 14 napos demót letölteni, kipróbálni (ebben is követi az IBM SPSS-Modellert, trial-módban azt is eddig lehet csak használni teljesértékűen).

* Mindenképpen érdemes szólni a napjainkban már kötelező R-integrációról, no meg a szívünknek oly kedves Tableau-hoz való símulást. :)

* A több, mint 200 node, így csoportosul.


Nincsenek megjegyzések:

Megjegyzés küldése