Magamról

Saját fotó
Főiskolai, majd egyetemi diplomamunkáimtól kezdve világ életemben, adatok, adatbázisok, adattárházak (leginkább Oracle) környékén mozogtam. Mostanság adattárházasként, adatbányászként élem napjaimat.

2010. augusztus 18., szerda

Adaptive Stream Mining



Ritkán írok egyetlen nap két blogpostot, de érdekesen harmonizál az alábbi könyv a korábbi blogpostomra. Egyébként, esküszöm, abszolút tök véletlen, hogy a mai napon ért össze a kettő.

Érdekes, friss-meleg (2010-es kiadású) könyv jelent meg a tárgybeli témában, 225 oldalon, az IOS Pressnél, egy mesterséges intelligenciával foglalkozó könyvsorozat részeként. Erős WEKÁ-s hátszéllel, hiszen írója a Albert Bifet az új-zélandi Waikato egyetem tudósa. A könyv Amazon -on megrendelhető, 'gyenge' 160 dollárért. /Hát nem egy olcsó darab, főleg oldalszámra vetítve :o)/


Adaptive Stream Mining - Pattern Learning and Mining from Evolving Data Streams
Volume 207 Frontiers in Artificial Intelligence and Applications


Az én különc terminológiám szerint eddig az inkrementális gépi tanulás (Incremental Machine Learning) témájába tartozott az ilyen jellegű stream-mining. Amikor is dől be a csövön bődület mennyiségű adat. Majd limitált tár- és idő-erőforrásokkal kell valamiféle eredményt felmutatni, időben lehetőleg stabil módon (esélyesen folyamatmenedzsmentbe ágyazottan). Ennek megfelelően az idősoroknál is kritikus Change Point Detection tud egy izgalmas probléma lenni. Viszont legalább nem kell foglalkozni olyan jellegű problémákkal, hogy nincs elég tanító adat. :o)

Nekem szívemhez közel álló a téma. Részint mert ahol sok adat van, ott biztos van mit optimalizálni a fejlesztés során több helyen is akár, illetve az én folyamatszemléletembe jól tud a téma beilleszkedni. És akkor még egy szót sem szóltam az asszociációs szabályok iránti vonazalmaimról :o)


Érdekesebb fejezetcímek a tartalomjegyzékből:

I.Introduction and Preliminaries
01 Introduction
    Challenges due to the size of data
    Challenges due to the complexity of data types
    Challenges due to user interaction
02 Preliminaries
    02.1 Classification and Clustering
        02.1.1 Naıve Bayes
        02.1.2 Decision Trees
        02.1.3 k-means clustering
    02.2 Change Detection and Value Estimation
    02.3 Frequent Pattern Mining
    02.4 Mining data streams: state of the art
        02.4.1 Sliding Windows in data streams
        02.4.2 Classification in data streams
        02.4.3 Clustering in data streams
    02.5 Frequent pattern mining: state of the art
        02.5.1 CMTreeMiner
        02.5.2 DRYADEPARENT
        02.5.3 Streaming Pattern Mining

II Evolving Data Stream Learning
03 Mining Evolving Data Streams
    03.1 Introduction
    03.2 Algorithms for mining with change
        03.2.1 FLORA: Widmer and Kubat
        03.2.2 Suport Vector Machines: Klinkenberg
        03.2.3 OLIN: Last
        03.2.4 CVFDT: Domingos
        03.2.5 UFFT: Gama
    03.3 A Methodology for Adaptive Stream Mining
    03.4 Optimal Change Detector and Predictor
    03.5 Experimental Setting
04 Adaptive Sliding Windows
05 Decision Trees
06 Ensemble Methods

III Closed Frequent Tree Mining
07 Mining Frequent Closed Rooted Trees
08 Mining Implications from Lattices of Closed Trees
09 Mining Adaptively Frequent Closed Rooted Trees
10 Adaptive XML Tree Classification

Bibliography

2 megjegyzés:

  1. Érdekes, az úr doktori értekezése hasonló címmel jelent meg:
    http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.157.1206

    VálaszTörlés
  2. Nálam nem él ez a link.
    Ami furcsa, hogy tudtommal a PhD-s disszertációk általában elérhetők szoktak lenni ez meg nem az, így hevenyészett elalvás elötti guglizás után. Az is egy érdekes kérdés, hogy tényleg egy-az-egyben a disszertáció jelent-e meg könyvben.

    Minden esetre a szerző honlapján találtam egy szimpatikus, 86 oldalas prezentációt, gyorstalpalónak. :o)
    http://www.lsi.upc.edu/~abifet/

    VálaszTörlés