Magamról

Saját fotó
Főiskolai, majd egyetemi diplomamunkáimtól kezdve világ életemben, adatok, adatbázisok, adattárházak (leginkább Oracle) környékén mozogtam. Mostanság adattárházasként, adatbányászként élem napjaimat.

2015. december 11., péntek

[Data Science] Top5 leginkább (érdemtelenül) túlárazott szoftver

.
- Ez a rövid blogposzt már a DATO-nál elkezdett érlelődni, pedig a SAS vagy RapidMiner már önmagában adott volna elég gyújtóanyagot korábban is :)
- Az alábbiakban csak olyan szoftverek kerülnek elő, amik valamiképpen
(1) előfordultak a praxisomban ÉS
(2) helyet követelnek maguknak.
- Így például a KXEN/SAP vagy Insightful Miner/TIBCO - mivel sosem volt fókuszban nálam - így nem léphettek elő "trónkövetelőkké".

- Nem is olyan könnyű árakhoz hozzájutni, ami  még inkább "visszataszítóvá" tudja tenni a témát (számomra).
- Nekem ne jöjjön senki avval, hogy "ügyfélorientált" meg "személyreszabott" akar lenni a vendor, ezért nem közöl ára(ka)t. Számomra ez sokkal inkább jelent
(1) átláthatatlanságot,
(2) nem tiszta viszonyokat,
(3) sőt korrupciós melegágyat (hiszen annyiba kerül, amennyit "megér" az ügyfélnek).
Ha ez kint nyugatabbra is dívik, bele sem akarok gondolni nálunk itthon milyen lehet a helyzet.
- Az olyan aljasságokról nem beszélve, hogy a kis cégek fizethetik a jóval teljesebb árat publikusan, míg a nagy multik fű alatt
(1) akár kis csomag(!) esetén is
(2) ártárgyalás nélkül indulásként is(!), akár 80%(!) árengedményről indulnak (tapasztalatból mondom: pl.: IBM SPSS Modeler, vagy nálam ilyen az Anaconda vagy a DATO hozzáállása is)
- Félreértés ne essék lehetnek egyedi árajánlatok, egyedi hozzáadott értékekkel, megegyezésekkel, de azt vélelmezem "dobozos" terméknél elvárható valamiféle listaár. Annyira nem rocket science az árképzés, hogy ezt "minden határon túl meg kéne úszni".


1. ANACONDA
A kétes hírű verseny első helyezettje egyértelműen, az én értékelésemben (aminek része ugye az egyébként különállóan szépen könnyedén elérhető nagyon "trendi" okos remek scikit-learn is (függőségeivel együtt is).
A javukra legyen mondva:
+ Anaconda Subscriptions url, világos, egyértelmű, teljeskörű információt ad.
+ A free verzió nagyon elterjedt, nagyon hasznos eszköz.
+ "Numba" nem-CUDA része open source lett, ahogy az "MKL Optimization" is.
Viszont:
- Azért is "nyernek aranyérmet", mert rögtön három termékük is potenciális kandidáló.
- A 10.000 USD-s verzió semmi lényegi érdemi hozzáadott értéket nem ad. Ami érték az 30.000 USD-től indul (iopro, numbapro, cuda, accelarate, etc.)
- A 60.000 USD meg azért "viszi a pálmát", mert az Anaconda open source-csomagokat rámol egybe, amiért egyedül "felel" az az összerámolás, illetve saját proprietary csomagok.
- A 60.000 USD/év még USÁ-ban sem kevés, megkockáztatom még pörgös gazdasági években sem, nemhogy a költségcsökkentések korában. Fel nem fogom hogy állhat össze a termék pénzes ügyfélköre. Az itthoni helyzetről nem is beszélve: ~18 millió forint évente kb. a semmire.
- Mindezt úgy, hogy pár hete 400 USD körüli összegért az összes lényegi PRO* Anacondás proprietary csomag elérhető volt, úgyis hogy az "MKL Optimization" és "Numba" teljes egészében fizetős volt. "Kicsit" emelkedtek az árak ;)




2. DATO
Rögtön a másik nagy "cápa", Python-világban.
A javukra legyen mondva:
+ DATO Prices  szintén egyértelmű árlista
+ Létezik Amazonos EC2-verzió is, de sok közelebbit nem lehet róla tudni (és engem annyira nem is érdekelt a rossz tapasztalatok után, bevallom férfiasan)
Viszont
- 4.000 USD/gép/év olyan szinten túlárazott egy korábban open source termékre, hogy nálam második helyet ér ezen a "negatív listán".
- Nincs közbülső ár az akadémiai szféra és az üzleti szféra között. Az előbbi korlátlanul ingyen bármire használhatja (1 év után, megújíthatóan), az utóbbinak kőkeményen perkálnia kell a teljes összeget. A trial-ban emlegetett "personal licence" nem létezik, csak beetetésre van ott (utána jártam levelezésben a témával foglalkozó posztom óta).
- A cucc csak Python v2.7-re létezik
- Csak külön enviromentként installható nagyon zűrősen.
- A default path Windows-on a %user profiles%, oda csűr be egy közel 2 GB-os anaconda környezetet (megváltoztathatlanul). Ezen azért sokat kellett "agyalnia" valakinek. ;)
- Használhatatlanná teszi az alap grafikus installer a korábban települt Anacondá-t. Valahogy persze biztos lehet workaround-t találni hogy lehessen azt is használni: de talán ennyi is elég ahhoz, hogy egy ilyen szinten kiforratlan termék erős túlárazásáról beszéljünk.
- A cucc a scikit-learn-nel összemérhető, ővénél részben erősen kisebb algoritmus-választékkal. Míg performanciát illetően állítólag jobb, (nem teszteltem eddig). Gondolom a CUDA alkalmazásából eredhet a különbség.
- A Deep Learning-implementáció túlzott ígéretei is tudhatják szkeptikussá tenni az embert, majd meglátjuk igazolja az idő/élet a cég optimizmusát.







Az első két helyezett tehát avval tűnt ki, hogy kvázi a semmire kérnek horror összeget.
A következő cuccok ugyan adnak "valamit", de azt totálisan eltévedt árakon.


3. SAS
- Maximális "kiépítésben" egy szegényes és kvázi egyáltalán nem fejlődő algoritmusválasztékú cuccért közel félmillió dollárt (150 millió forint+ 50 millió évenként) elkérni azért arc kell. ;) Mit mondjak: a hülyének is megéri. Egy szimpla "halott" dobozos termékért, hiszen a munka és a további érdemi tőkeigény csak eztán jön.
- Az IBM SPSS Modeler árképzése sem a visszafogottságáról híres, meg ugye ott egyéb aljasságok is tettenérhetők, de a fasorban sincs ilyen méretű "ár-elszállás", az én meggyőzödésem szerint nagyságrendekkel jobb termékért cserébe.




4.Salford Predictive Modeler Suite
- Nagyon ígéretes, ám élesben, demó-szintről túllépve, rendesen kipróbálhatatlan termék.
- Pár - interpretálás oldalon is erős - algoritmust ad csak, bár azokkal nyertek már versenyeket, a hírek szerint. A Microsoft is csak kevés (szintén ígéretes algoritmust ad, töredék áron).
- Hivatalos "személyre szabott" pár hetes árajánlatból ollóztam az árakat:



5. RAPIDMINER
- Bár csak ötödikek lettek a "szégyenpadon", de inkorrektségben az első helyen vannak (nálam), a hiányzó árakkal.
- Korábban pár hete még RapidMiner Prices linken elérhetők voltak az árak. Ma már nem. És nemcsak a két utolsó hiányzó ár hiányzó mivolta.
- Ha csak a lineáris háromszorozást vesszük: 10.000 USD, 30.000 USD minimum lehet a 2 ASK helyén (sosem érdekelt és már nem is fog, szvsz, így nem jártam utána).
- De mi van ha olyan progresszív a hiányzó árszabás,  hogy be sem merték vállalni? ;)
- Az összes általam látott free-verzió között talán a RapidMineré a legértéktelenebb (pedig sok ipari hulladékot láttam már), ennél szerintem jobb az open source v5.3-as használata is, minden hibájával együtt is.

7 megjegyzés:

  1. Nem akarom megint felhúzni magam, szóval csak tényszerűen a cáfolatok a RapidMiner kapcsán:
    - az árazási kép amit beraktál már hónapok óta nem aktuális, itt van az új árazás: https://rapidminer.com/products/comparison/
    - az ár $1999-$2399 / év, webshopban is meg lehet venni, teljesen transzparens
    - az ingyenes verzióból augusztus óta eltűnt a memóriakorlát, így már sokkal többet nyújt mint a v5.3, ráadásul ismét open-source: https://github.com/rapidminer/rapidminer-studio

    A többi termék kapcsán is rengeteg a félreértés és a tévedés, illetve láthatóan nem gondoltál bele, hogy miért így áraznak a cégek. Sajnálom, hogy megint félinformációkból írtál kritikus posztot...

    VálaszTörlés
    Válaszok
    1. Lehet Zoli, hogy a "felhúzás" elkerülése érdekében azzal tehetnéd a legtöbbet, hogy más blogokat olvasol, ezt meg hagyod a fenébe. Idegesen, feszülten nem jó semmit csinálni, pláne beszólni a másiknak, márpedig nekem csak ez jön le a e blogon való minden megnyilvánulásodból... ;)

      - Örvendetes, hogy az általam leginkább kifogásolt 'Ask"-ok eltüntek a legfrissebb Rapidminer árlistából.
      - Ha megnézted volna az én eredeti linkemet, ahol az árak voltak, ott egy form-ot kellett volna kitölteni az árakhoz, ami egyedisége miatt nem volt opció ennél a posztnál.
      - A te új linkeden sem látszik a memóriakorlát (eltűnése).
      - Ugye megérted, hogy én ennél a posztnál csak a publikus infók alapján nyilvánítottam véleményt? Természetesen minden informatív kiegészítésnek, így a tiédnek is örülök.

      - Az utolsó mondatoddal amit így odakentél, nem tudok és nem vagyok hajlandó mit kezdeni. Ilyet vagy ne írjon az ember, vagy legyen tárgyszerű, mint a Rapidminernél is.

      Törlés
    2. Ne aggódj, nem olvasom már a blogodat, linkként kaptam meg ezt a bejegyzést és ha már elolvastam, tényszerűen megcáfoltam a RapidMinert érintő hibás állításaidat. Minden infó publikus amit leírtam. Mivel open-source, ezért nyilvánvalóan nincs memóriakorlát, azt hittem ez egyértelmű.

      Amit te linkeltél (megnéztem) az is egy élő oldal, ott például a Server komponens áráról lehet érdeklődni. Ez nem azért nem publikus, mert korrupciós melegágyat alkottunk, hanem mert annyira eltérő a felhasználási mód és az ezzel kapcsolatos support igény, hogy nem lehet egyetlen árcetlit ráaggatni. Valaki egyedül feltelepíti és önmagában futtatja, és van olyan is aki privát felhőben skálázza több gépre, integrálja 10+ egyéb vállalati rendszerrel, nagy rendelkezésreállású konfigurációt és 24/7 supportot kér. A kettő között akár két nagyságrend különbség lehet a vendor munkamennyisége (és jogi felelőssége) kapcsán, ezért nem lehet egységesen árazni. Hiába dobozos a szoftver, ha a környezet amibe elhelyezed nem dobozos. A kliens esetén egyszerűbb a környezet, ezért ott a legtöbb vendor tud listaárat megadni.

      Az utolsó mondataim is teljesen tárgyilagosak volt: a többi szoftver kapcsán is vannak tévedéseid, de inkább a családommal töltöm az időt, minthogy kikeressem neked a megfelelő publikus információkat.

      Megint fogtál egy témát, begyűjtöttél némi információt (jópárat hibásan), aztán a további információ-hiányokat feltöltötted a saját ötleteiddel. Az a bosszantó ebben, hogy remek témaválasztásaid vannak, szuper blogposztokat lehetne írni ezekről, csak a személyes indíttatásod elhomályosítja a tényeket és ezért félúton az oknyomozó írásból szurkálódás és rosszindulat lesz. Sajnálom, kár érte.

      Törlés
    3. - Na most akkor olvasod vagy olvasod a blogposztomat? Teljesen összezavartál, nézve az első mondatodat a "nem olvasom & elolvasom"-mal. Csatlakozom hozzád, kérve-kérlek ne kövesd a blogomat, mert csak fárasztasz itt bloggazdai mivoltomban. ;)

      - Akármennyire nagy ember lett belőled a Rapidminer révén, megtanulhatnál viselkedni. Az előző hozzászólásodban NEM voltál tárgyszerű az utolsó mondatodban, illett volna elnézést kérned, miután rámutattam erre. Sértett ovisként törsz-zúzol itt a blogon (visszatérően).

      - Látnivalóan nem fogod fel, hogy publikus és publikus infó között is van különbség. Az egyiket egy klikkeléssel eléri az ember, a másikat utánajárás után nem titkolják el. Mindkettő publikus, mégis van minőségi különbség. Én sajnálom, hogy csak "félinformációk"-ból vagy képes csak reagálni.

      - Érdekes az Alteryxtől, Daton-n át, IBM SPSS meg SAS_ig mindenki tud szerver ára(ka)t adni vagy legalább jelezni, hogy honnan indul az árazás, csak a Rapidminer védelmében születnek ilyen ingerült beszólongatós sorok.

      - Családoddal való több idő eltöltése érdekében a hozzászólásaiddal sem kéne fáradnod (itt a blogomon), mert így a rosszízű rövid beszólongatásoknak önmagukban semmi értelme nincsen.

      - Vegyük észre, hogy itt a blogon személyeskedik és szúrkálódik az végig te voltál, te vagy. És azért mert sértettségből képtelen vagy értelmezetten olvasni, indulatmentesen reagálni. Ha ez összejönne neked, akkor meglehet nemcsak "rosszindulat" jönne le a soraimból. Fogadd ezt el tőlem nagyjából kétszerannyi idősként, aki lassan kikopik a szakmából... ;)

      Törlés
    4. Úgy látom a személyes utálatod a tetőfokára hágott. Nem tudom mivel adtam erre okot, mert ez bizonyosan megelőzi bármely hozzászólásomat itt a blogon. A kommentekért nem kérek elnézést, vállalom amit írtam: remek témájú, de megalapozatlan elemző posztokat írsz és a lukakat tetszőlegesen töltöd fel. Ez a szakmai véleményem, ebben semmi személyes nincs.

      Nyugodtan ekézd a továbbiakban a RapidMinert, vagy akár engem, nem fogok rá többet reagálni. További kellemes ünnepeket!

      Törlés
    5. @Prekopcsák Zoltán.
      Zoli, mivel ez a minősíthetetlen kommentelős tempódat megismételted hónapokkal később is, ezért külön blogposztot szenteltem a trollkodásodnak.
      http://liftinstinct.blogspot.hu/2015/12/prekopcsak-zoltan-rapidminer-trollkodasa.html

      Törlés