Magamról

Saját fotó
Főiskolai, majd egyetemi diplomamunkáimtól kezdve világ életemben, adatok, adatbázisok, adattárházak (leginkább Oracle) környékén mozogtam. Mostanság adattárházasként, adatbányászként élem napjaimat.

2010. április 2., péntek

Társkeresés - Numerátorok

.
Nemcsak ajánlom, hanem olvasom is az adatbányászat blogot. Ami - by the way - eléggé önbizalom csökkentően nagyszerű blog, mind tartalmában, mind formájában, mind pörgésében - ezúton is gratulálok hozzá. Így hirtelenjében első ránézésre nekem már csak egy front (életévek száma) maradt esélyes állni a sarat (a 46+ évem révén). :o)

De félretéve a tréfát, pláne, hogy sokkal-sokkal nagyobb poén kerülhet ablakba... Ott olvasom az alábbi pár napos post-ot

Két új könyv

Ami említést tesz az alábbi könyvről. Érdemes a post-on túlmenően, a recenziót is elolvasni.

Stephen Baker: Numerátorok

Természetesen ma - azaz hogy pontosabban tegnap - postolvasás után első dolgom volt megvenni mindkét könyvet. És mit látok a Numerátorok(=adatbányászok) tartalomjegyzékében? Hogy a 7 nagy fejezet egyike (utolsó), pont a társkeresést veszi górcső alá. Kell-e mondanom ezek után, hogy melyik fejezet olvasásával kezdtem a könyvet? :o) Egy füst alatt felfaltam a sorokat. Először. Aztán másodszor...

A bő húsz oldalas fejezet avval nyit, hogy a házas szerző ráveszi a feleségét, hogy próbáljanak egymásra találni egy ilyen adatbányászós, internetes társkereső révén. Az oldal a Chemistry.com. Az asszony eléggé kevéssé lelkes, de hát mit meg nem tesz az ember az élete párjának. :o) Aztán megidéződik a Chemistry, kiagyalója, éceszgébere, egy antropológus(!) hölgy(!) Helen Fisher is.

Szerzőnk először is próbálja tisztázni mit tud a numerátorokról (előző fejezetek alapján), miben más ez a társkeresés-téma. Igen, a szerelem algoritmusait fürkészni nem kicsit hangzik morbidnak, és igen, a társkereső emberek mindegyike olyan komplex, kvázi mint a világegyetem. Régen Shakespeare többet tudhatott a szerelemről, mint Newton, ma viszont numerátorok tudhatnak robotolni a szerelem laboratórimában. :o)

Szerző visszaemlékszik arra, hogyan jött össze a feleségével. Egy közös barát hozta őket össze, hagyományos megfontolással. Gyors rákérdező mail mi volt a barát motivációja.
A villámgyors válasz:
(1) egyformán jól értett szót mindkettejükkel
(2) humorérzék hasonló volt
(3) mindkettőnél egyformán óriási pozitív energiát észlelt.
Ezután érti meg szerzőnk, hogy miért "Chemistry" lett a társkereső honlap neve. :o)

Szerzőnk elmeséli hogyan próbálja őt személy szerint a társkereső oldal (Helen Fisher) megérteni, többtucat kérdésen keresztül (miközben a feleség kitörni készülő lázadását is el kell fojtania)
* Vannak explicit felmérő kérdések (szőrszálhasogatás, kalandvágy, stb.)
* Vannak spéci feladatok például képekkel, például italozó férfivel és nővel -> ők vajon sze­rel­mes­pár?
* Rákérdeznek arra, hogy a delikvensnél hogyan aránylik a gyűrűsujj és a mutatóujj hossza(!)
* Korábbi sikeres kapcsolatok felidéz(tet)ése is a menün van.
* Önjellemzés kérdésköre sem maradhat el.
* Természetesen a lényeg; a potenciálisan jövendőbeli társ milyenségére való rákérdezésben kul­mi­nál
* Kifejtős szabad szöveget is kell írni (abszolút egyetértek Körmendy Gyurival, amit közvetített egyik Clementine Text Mining-os prezijében, hogy a szabad szöveg léte vagy nem léte egy kérdőívben perdöntő lehet a megértésben pro vagy kontra. -> Ez külön post témája lehetne)
* Kér fotót a Chemistry.com is, amit egyelőre nem elemeznek, de a szerző szerint lehet eljön annak is az ideje. ;)

Szerzőnk megérti, hogy egyrészt keveset ért meg illetve lát át a neki szegezett kérdőíves feladatokból, "csapdákból". De elhiszi, hogy segít megérteni az emberben lévő vágyak, neurózisok legalább egy részét.

Ezután fontos momentum annak elemzése, hogy a társkeresőnek mennyire érdekes/fontos (ha már fizet érte), hogy mesterkéletlen, őszinte meg feltárulkozó legyen, hogy segítse a gépi algoritmust. Világosan kiderül, hogy egyrészt a társkereső magával tol ki, ha megpróbál "okoskodva" túljárni a párosító algoritmus eszén, illetve a hagyományos forma esetén alapdolgokban (fénykép-retusálás, jövedelem, etc) jóval nagyobb tér van a manipulációra. Valójában az nyer, aki jobban érthetővé tudja magát tenni, jobban alá tud dolgozni a gépi algoritmusnak.

Ezután jön az értékelés Helen Fisher antropológus személyes interpretációjában. Innentől - töredelmesen bevallom - kezdtem intenzíven eldobni az agyamat.... ;)

Helen Fisher előszöris úgy véli, a szokványos adatok, közös hobbi, közös érdeklődési körök stb. szinte értéktelenek az igazi pár meglelésében. Sőt lehet azonos az etnikai háttér, a jövedelmi társadalmi pozició, IQ, vallási, politikai nézetek, meggyőzödések, célok. Megfelelhetnek egymásnak kinézetre. Még ennyi sem garancia a sikerességre.

Hormonok fontossága
Helen Fisher ezután elővezeti saját elméletét, a hormonokról. Négy különböző hormon (ösztrogén, tesztoszteron, dopamin és a szterotonin) amin múlik a személyiségünk. Párkapcsolatban meg általuk olyat keresünk, ami hiányzik az emberből, azaz kiegészítésre szorul az egyénben. Helen Fisher négy csoportba sorolja az embereket, aszerint, hogy melyik a domináns hormon. Merthogy így társíthatók jól a kedélyállapotok, személyiségvonások. Itt derül fény az ujjhosszak arányának rejtélyére is, ami például a méhen belül kapott tesztoszteron-hatással korrelál. Itt tudjuk meg mi gyanutlan olvasók, hogy a szóhasználatunk is korrelál a hormonjainkkal. Finomabb alábontásban van elsődleges és másodlagos jellege is az embernek.

CSOPORTOK
Domináns dopamin: "felfedezők", optimista kockázatvállalók
Domináns szerotonin: "építők", higgadtak, szervezettek, jó csapattagok
Domináns tesztoszteron: "igazgatók", 2/3-uk férfi, elemzők, logikusak, gyakran mu­zi­ká­li­sak
Domináns ösztrogén: "egyezkedők", beszédesek, jók a megérzéseik, tudnak bánni az em­be­rek­kel, de túlságos simulékonyságuk a túlságos engedékenység csapdájába vezetheti őket.

Zárójelben megtudjuk Helen Fisher 1.6 millió ember adataival rendelkezik(!) Ennek alapján látja ki milyen valószínűséggel milyen típusú embert keres. Az egyezkedők és igazgatók kölcsönösen vonzódnak egymáshoz, míg fűrkészek vonzódnak az egyezkedőkhöz. Az építők azért szeretik a fürkészeket mert segítenek őket "ellazítani". De az építők szerethetik a kevésbé robbanékony elegyet is, és ezért kereshetik saját fajtájukat is. Stb.

Ezután szerzőnk hosszasan elemzi azt a lényegi kérdést, hogy hány ember közül szeret választani az ember. Bele tud-e 'nyugodni' rögtön az elsőbe? Mi a helyzet az emberi kiváncsisággal? Az érvelés indul a Google "szerencsés napom van" keresésétől (csak egyetlen legjobb találat) és tart a keresőoptimalizálás fejtegetéséig, ami már egy valódi rabló-pandúr játék a résztvevők, és a Google-s algoritmusfaragók között.

Ha mindez még nem lenne elég, akkor jöhet a mobil-telefon a hálózatos (emberi kapcsolatok hálója), meg helymeghatározós / -prediktálós világával, mint perspektíva. Erről is hosszú bekezdések szólnak fejezetünkben. A mobiltelefonálás adatféleségei akkora kincsesbánya a szerzőben lecsapódottak szerint, hogy bármilyen kérdőívet überel.

Egy másik cég, a Match, teljesen más metodológiával dolgozik. Ha van három közös jellemző egy emberben (szintén szereti a kutyákat, kedvenc színe a piros stb.), akkor azonnal megugrik a társkeresők érdeklődése egymás iránt. Mert hogy ezeket apró sorsszerű véletleneknek tudják be az emberek. Már "csak" ezen potenciális kombinációk elemzése van hátra, a sikeres - gépi algoritmussal támogatott - társkeresés segítésére.

A történet vége, hogy a szerző ha nagy nehezen is, némi buktatókkal, de rátalált a feleségére, a Chemistry rendszerével is. ;)


UPDATE-1.

"Természetesen" mi a Numerátorok könyv irodalomjegyzékében az első ajánlott könyv? Ian Ayres Super Crunchers könyve. :o) Apropó, ha pár nappal korábban jut kezembe a könyv, akkor lehet, hogy a blog címe is más lett volna. Még névjegyen is jól mutat: név alatta foglalkozás: numerátor. Kár hogy magyar nyelven van nemkívánatos némi áthallás. ;)

Egyébként felötlött bennem, hogy aki elsőként meg teljesen más területről érkezve evvel a hatalmas és nehéz témával találkozik, hogy "adatbányászat", lehet, hogy ilyen jellegű könyvvel jobban a kedvében lehet járni, mint bármilyen jól megírt ám száraz és/vagy formulalizált ismeretterjesztő cikkel. Ez persze nem mentesíti az adatbányász társadalmat az alól valóban, hogy normális Wikipedia-cikket érdemel a téma...

Adatbányászat vs. Wikipedia

Társkeresés és adatbányászat témát érintő blogpostjaim:
Társkeresés adatbányász alapokon
Társkeresés - Numerátorok
Dr. Helen Fisher mint a szerelem "brittudósa"?
Dr. Helen Fisher kérdőíve társkereséshez
Dr. Helen Fisher - Zárszó
Társkeresés adatbányászati támogatással
Beszéd, mint a sikeres párkapcsolat prediktora?
COMMENT:COM: "Házasság első látásra"

Nincsenek megjegyzések:

Megjegyzés küldése