Magamról

Saját fotó
Főiskolai, majd egyetemi diplomamunkáimtól kezdve világ életemben, adatok, adatbázisok, adattárházak (leginkább Oracle) környékén mozogtam. Mostanság adattárházasként, adatbányászként élem napjaimat.

2017. november 20., hétfő

index.hu: "Tényleg bebizonyította a gép, hogy nem is az ember okozta a klímaváltozást?" II.lépcső

Látom nem úszom meg, hogy egy szinttel mélyebbre ássam magam a témában. :) Ebben a korábbi posztomban amellett érveltem, hogy
(1) proxy adatokon, (2) időben hosszan, (3) teljeskörűen, (4) megbízhatóan, (5) ennyire hiszterizált és pénzügyi szempontból túlterhelt témában, mint a klímamodellezés NEM lehet a címbeli eldöntendő kérdést eldönteni AI/MI-modellezéssel.
Ezt továbbra is maradéktalanul fenntartom, viszont az index (szintén Bolcsó Dániel) ma frissen lehozott egy interjút, Margriet Groenendijk adattudóssal, az IBM Watson adatplatform fejlesztőjével, annak apropóján, hogy előad  - 2017.november 15-én megtörténten - a Budapest BI Fórumon, "Weather and Climate Data: Not Just for Meteorologists" címmel, aminek 41 diás prezentációja itt érhető el.

I.MENET

Ahhoz, hogy a friss interjút kommentálni tudjam, muszáj a fentebb emlegetett előzmény-cikk lényegi részét szakmai szempontból picit részletesebben áttekinteni. Bolcsó Dániel (ebből a szempontból egyébként korrekten) kettéválasztja az ellenérveket (1) szakmai és (2) konteó kategóriákba (lásd hozzá idevágóan a kétértelmű "olajozott együttműködés" alcímet). Az utóbbival semennyire nem szeretnék foglalkozni, mivel állítom a kérdéskör (2) konteó nélkül is korrekten végiggondolható, csapán csak (1) szakma alapján is.

Nézzük akkor a szakmai (ellen)érveket.

A Guardian által megkeresett összes kutató egyetértett abban, hogy a tanulmány hemzseg a komoly módszertani hiányosságoktól és hibáktól, ezért az eredményei használhatatlanok. (A lap egyébként a tanulmány két szerzőjét is megkereste, de ők nem reagáltak.)
"Ez történik, ha az ember már azelőtt levonja a konklúzióit, mielőtt nekiáll a munkának" – mondta az egyik megkérdezett kutató, Gavin Schmidt, a NASA Goddard Űrkutatási Intézet igazgatója.
Tegyük is félre azonnal, hogy ez így ebben a formában nem érv semmire, se pro se kontra (ha már ezt sikerült legelső helyen kiemelnie a cikkszerző Bolcsó Dánielnek).

Mondja a fentieket a legsötétebb termogeddonista klímahisztériakeltők egyike, Gavin Schmidt, a különféle adat- és grafikonhamisítások, meg NASA-s visszaélések után (jó vastag bőrrel az arcán).

Érdemes belegondolni, hogy Trump hatalmas tervekkel érkezett a Fehér házba (pl.: Obamacare-eltörlés és társai), és aztán folyamatosan koppant orra az amerikai demokrácia buktatói révén: de  a NASA-féle Augeiász-istállóját kisöpörte, a Párizsi Klímaegyezményből kirepítette az USÁ-t, maradandónak tűnően.

Vajh miért sikerült neki? Az én "megszokott" teóriám, természetesen hálózatelméleti gyökérzetű. Túl sok érdeksérelemmel járt például az Obamacare eltörlése, míg a klíma hiszterizálása elérhetett egy olyan kritikus tömeget az potenciális döntéshozó ellenzők körében - a "97% konszenzus"-os hazugság ellenében -, hogy a NASA-tisztogatás belefért a jóváhagyható döntések körébe. Lásd idevágóan a Miskolczi Ferenc által is aláírt peticiót.

Na és megáll-e a saját lábán ez a Gavin Schmidt intelem? Lásd később!

Gavin Schmidt komolyanvehetőségére legjobb példa az egyetlen magyar nyelvű idézet tőle:
"A tudományos modellek nem jók vagy rosszak; hanem mindig rosszak. A modellek mindig csak közelítések. Azt a kérdést kell feltenni, hogy egy modell ad-e valami pluszt ahhoz képest, amit egyébként is tudunk. Ha igen, akkor a modellben van potenciál."
Ritkán olvasni ekkora orbitális f*sságot. Ezzel a "blickfangos poén"-nal "mindösszesen" csak az a baj, hogy
- nem ismeri a validált modell fogalmát
- a közelítés-hiba a pontosság problémáját feszegeti nem a rosszaságét.
- a modell által adott plusz lehet jó is vagy rossz is, amit érdemes megkülönböztetni hozzáadott érték szempontjából.
- de az egészben az alaprobléma, amiért teljes a tévút: nem mindegy hogy valaki igazságot keres, avagy prekoncepcióhoz keres modell-bizonyítékot, ahogy az egész NASA-bagázs szereti csinálni.

És végül az indexes Bolcsó Dániel is nyugodtan belegondolhat abba, ha már ezt emeli ki első helyre, hogy az indexen vajon előbb dolgoznak-e és csak aztán adnak címet/konklúziót pláne hatásvadászat kontextusában? Amúgy belerúgva egy jobb sorsra érdemes témába, lejáratva azt. Lásd legutóbb: index.hu: "Harvardi tudósok szerint gazdaságilag legyőztük Amerikát"

Szerinte a módszertan már elvben is hibás. A klímaérzékenység kiszámításakor ugyanis abból indultak ki a szerzők, hogy minden természetes változás teljesen függetlenül történt olyan külső befolyásoló tényezőktől, mint a vulkánkitörések vagy éppen a Nap hatásának változásai. Schmidt szerint ez még a tanulmányon belül máshol leírt állításoknak is ellentmond.
Ilyen marhaságot nem írtak a szerzők, szvsz, ezt Gavin Schmidt agymenése akarja a szerzők szájába adni.

A cikkben ez olvasható (volcan szó csak itt szerepel egyetlen egyszer a cikkben):
"Examination of many of these proxy temperature records shows they typically consist of complex oscillations or cycles about a mean value, with the amplitude and structure of the temperature signal depending on the geographical location considered. In the pre-industrial era, these oscillations represent the compound effect of natural phenomena both internal (e.g. North Atlantic Oscillation, El Nino Southern Oscillation) and external (e.g. solar, volcanic activity)."

Ami értelmezésemben azt jelenti, hogy a proxy-hőmérsékletek az iparosodás elötti időkben klímaszempontból belső (pl.: El Nino) illetve külső (pl.: vulkán) természetes jelenségek összetett hatásának leképződése. Szó nincs arról, hogy "minden természetes változás teljesen függetlenül történt".

Hibáztak akkor is, amikor digitalizálták az adatokat (konkrétan rosszul szkennelhették be őket), így elcsúsztak 35 évet, vagyis Schmidt szerint „ami szerintük 2000, az valójában 1965” – ami nagyon nem mindegy, ha napjaink klímaváltozása a téma.
A NASA-s "Hetesi Zsolt" Gavin Schmidt, aki pont ugyanúgy diszkreditálni akar csak, megértés és párbeszéd helyett, óva int mindenkit, hogy előbb dolgozni kell aztán levonni csak a konklúziót, miközben a linkelt Twitter üzenetében csak a hatásvadász szájkaratét látjuk a 35 évnyi konkrét shiftelődést nem. Vagyis a "konklúziót, munka nélkül". Bagoly mondja verébnek, ugye. Egyébként az alapcikkben világosan hivatkozzák Scafetta-t, hogy és mint foglalkoznak Moberg-gel (lásd hozzá a hokiütős visszaélések elutasítását).

Mi az hogy "adatsor-beszkennelés"? Nehogy már a XXI.században - pl.: Recognitás - OCR-rel kelljen hozzáférni adatsorokhoz. Vagy "véletlenül" elshiftelnek 35 évet a cikkírók, csak azért, hogy bosszantsák Gavin Schmidtet, akit persze nem lehet becsapni és Twitteren tudja is kommunikálni. Az indexes Bolcsó Dániel persze prekoncepciójával összhangban azonnal készpénznek veszi, cseppnyi kételkedés nélkül.

Önmagában a proxy adatok használatával egyébként nem lenne gond. Benjamin Henley, a Melbourne-i Egyetem klímakutatója maga is több tanulmányt írt proxy adatok alapján régi idők klímájáról, mégis azt mondta a Guardiannek, hogy ennek a tanulmánynak sose lett volna szabad megjelennie, de ha már így alakult, legalább vissza kéne vonni. Szerinte érthetetlen, miért csak hat paleoklíma-adatsort használtak, miközben egy idén júliusban megjelent tanulmány például 692-t gyűjtött össze, és a szerzők nem is indokolják meg, miért pont ezt a hatot választották.
Ismét megint a "ne b*ssza már meg" effektus. Az alapcikk 2017.április 22-én adódott le. Ezen számon kérni 2017-es júliusi tanulmányt, hát nem kicsit problémás, lássuk be! ;)

És amúgy meg bizony-bizony a több nem biztos, hogy jobb, főleg, ha a maradék a zajt erősíti. Teljesen helyénvaló lehet a 6 magyarázóerőileg legerősebbnek hitt adatsorral is modellezni, 692 ismeretében is. Persze a konklúzió lehet rossz ("fürdővízzel a gyerek kidobása") ezt én most nem tudom és nem is akarom bevizsgálni/verifikálni, én most csak arra vállalkozom, hogy a legdurvább hülyeségekre irányítsam rá a figyelmet (így is sajnos követhetetlenül nagyon hosszú lesz a poszt)

Arról már nem is beszélve, hogy vissza kéne vonni egy tanulmányt? Mert nem foglalkozott egy hónapokkal későbbi tanulmánnyal? Cenzura kéne, mi?

Henley szerint az is „extrém módon tudománytalan”, hogy a szerzők meg se próbálták azzal igazolni a megközelítésük pontosságát, hogy összehasonlítják a modelljük eredményeit valódi hőmérsékletmérésekkel, így „az eredmények nem támogatják a konklúziókat”.
A visszamérés, ez ennek a blognak is állandó vesszőparipája. A puding próbája az evés, nem pedig egy másik recepttel váló teoretikus összehasonlítás. Speciel ez teljesen jogos kritika. Az alapcikkben a 12-es táblában csak a proxy hőmérsékletek és az ANN-projekciónak is csak a szórását mutatja.

Piers Forster, a Leedsi Egyetem Priestley nemzetközi klímakutató központjának igazgatója szerint a szerzők fogták a múltbeli adatokat, és egyszerűen kivetítették a jelenre, anélkül, hogy megnézték volna, a valóságban közben milyen változás történt.
Azt a szemforgató hipokrita k*rva életbe. :)

Az 1.ábrán látjuk A hivatalos Nasa-Hetesi bagázs erölködését, hogy a tényleg létező CO2-növekedés és a tényleg létező globális átlaghőmérséklet-növekedés közé NEM-létező (értsd tudomány által nem tisztázott) direkt kapcsolatot hazudjanak az átlag-laikus szemébe. Lásd hozzá "bolha lábainak kitépkedése". A bunkó tudós: Egy bunkó elhatározza, hogy biológiával fog foglalkozni. A bolha tanulmányozásával kezdi. Leteszi a bolhát egy papírlap közepére és kiadja a parancsot: "Ugorj!". A bolha ugrik egy nagyot. Ezután levágja a hátsó lábait, majd ismét ugyanazt parancsolja neki. Semmi eredmény. Ezt a parancsot többször, egyre hangosabban, megismétli. Továbbra sincs eredménye. Megfigyeléseit megdicsőülten bejegyzi a kutatási naplójába: "Hátsó lábainak elvesztése esetén a bolha - megsüketül."

Míg a 2.ábrán látjuk Gavin Schmidt friss twitteres "hokiütőjét", lásd hozzá a Természet-világa-s magyar nyelvű cikket magyarázatnak.

Azaz Forster a saját akolmeleg klímahiszterizálós primitivségeiket varrják más nyakába. Ugye milyen rossz viszontlátni? ;) Az 1.ábrán nem tisztázott kapcsolatot vetítenek durván jelenbe és jövőbe, míg a másodikon olyan meredek felívelést prognosztizálnak, aminek múltbéli adatalapjai hiányoznak. A fele és duplája közé sem húzható minimális pontossággal sem az egyenes ilyen módszertannal. Ez semmi  másra nem jó, csak klímahiszterizálásra. Ennyit az adatkapcsolatokról és vetítésekről.

Amúgy az alapcikk modellezésének nem lehet scope-ja egy olyan adatkapcsolat tisztázása, amire a tudomány a mai napig nem volt képes, a legjobb erőinek bevetésével sem. Ezt számonkérni tehát egy 11 oldalas cikktől, minimum aljas megtévesztés.


Azt is tévesen előfeltételezték, hogy minden olyan természetes változás vagy ingadozás, amely az ipari forradalom előtt történt, napjainkig folytatódott volna. Forster szerint nagyon kevés az ilyen periodikus ingadozás, a legtöbb teljesen rendszertelen. Főleg a vulkáni aktivitás kezdi ki ezt a megközelítést, hiszen azt feltételezi, hogy az 1880 előtti vulkanikus tevékenység máig ugyanúgy folytatódik, miközben a valóság ettől igen távol áll. Más kutatások pedig már korábban bizonyították, hogy a klíma véletlenszerű változásai maximum 0,2 fokkal járulhattak ehhez hozzá.
Ez szerintem megint egy értelmetlenség. A vulkáni aktivitás nem szerepel a proxy-adatokban, az alapcikk 1.táblája szerint. Maga a vulkán szó egyszer szerepel csak, akkor is teljesen más kontextusban (lásd fentebb).

A modelljük azt is feltételezi, hogy az egyes helyekről származó közvetett adatok ingadozásai a globális átlagban is hasonló ingadozást jelentenek, ami megint csak hibás előfeltevés. És mivel a már megvalósult 1 fokos változás úgy történt, hogy a szén-dioxid-duplázódásnak még csak nagyjából a felénél járunk, a 0,6 fokos klímaérzékenység biztosan kizárható, meg minden más szám is 1,5 fok alatt.
Én ezt a bekezdést nem értem, de nem is akarom: elhatárolódom tőle. :) Milyen ingadozás mi látszik hogyan az átlagban? Milyen duplázódás jár hogyan a felében?

A szerzők elemzése látszólag úgy működik, mint a varázslat– foglalta össze Steven Sherwood, az Új-dél-walesi Egyetem klímaváltozás-kutatási intézetének igazgatóhelyettese. Szerinte az az érdekes a tanulmányban, hogy éppen azt csinálják a szerzői, amivel a fősodorbeli klímakutatókat szokták vádolni: rövid távú múltbeli adatokat vetítenek rá a jövőre.
Na ez egy korrekt kritikai megállapítás. Ezért veszélyes terület az AI/MI és klímaelőrejelzés házasítása.

Egy klímakutató blogbejegyzése alatt pedig egy gépi tanulással foglalkozó kutató is kommentelt, aki szerint ezen a téren se túl acélos a tanulmány.
Köszönjük az újabb diszkreditálni igyekvő kommentet :)

II.MENET

Na akkor nézzük a hölggyel való interjút, ami ezt a blogposztot generálta:

- Hogyan változtatta meg ön szerint a klímakutatást a big data és a gépi tanulás?
- A klímakutatás szerintem mindig is big datára épült, csak az új technikákkal könnyebbé vált a feldolgozása. Gépi tanulást is sokat használtak, csak statisztikának hívták, ezért ezen a területen inkább hájpról van szó mintsem radikális változásról.
Ez szerintem egy teljesen korrekt vélemény.

Legfeljebb a magyar olvasónak lehet új, ami itt a blogon régóta evidencia, hogy pl.: az IPCC klímamodellezése nem fizikai modellezés, a valóság megértésére, hanem egy hackelt AI-modellezés, hiszterizálásra alkalmas prekoncepciók megtámogatására. 

Ahogy a Big Data és Hype sem valóságtól elrugaszkodott kapcsolat:
Big Data csak hype lenne? I.
Big Data csak hype lenne? II.

- Érdekelne a véleménye arról a tanulmányról, ami azt állította, hogy gépi tanulás alkalmazásával bebizonyította, hogy nem is az ember a felelős a klímaváltozásért, de aztán sok kemény kritikát kapott.
- Nekem úgy tűnt, önkényesen válogatták az adatokat, mintha azokat választották volna ki, amik a legjobban passzolnak az eredményhez. Ha megvannak az eszközeid a gépi tanuláshoz, miért nem használod az összes adatot? Elég elfogult is volt az eredmény. Szerintem ha az összes adatot használták volna, más eredményt kaptak volna.
Ez így általánosságban nagyon inkorrekt és megtévesztő szerintem; hatalmas fekete pont jár érte részemről. Fentebb  már írtam:
- Több nem feltétlen jobb, mivel a zaj rongálhatja a modellezés minőségét.
- Szakmailag szvsz lehet "önkényesen" szelektálni adatsorok között, modellezési iterációk során, magyarázó erőt tekintve, mégha ez végül rossznak is bizonyul.
- A hölgy implicit csalással vádol, szvsz. Ami nem baj, de ennyi kevés azért hozzá.
- Elfogultság? Come on... Bagoly mondja verébnek.
- Az egész interjút tekintve a hölgynek lehetne oka jóval szerényebbnek lennie.

- Milyen valódi lehetőségei vannak az ilyen módszereknek? Megfogalmazható ezek alapján releváns állítás a klímaváltozásról?
- Igen, mert meg lehet figyelni a különböző okait, tudjuk, mekkora a kibocsátás, ismerjük a hőmérsékletnövekedést, megtalálható az összes adat egy adott időszakon belül, ami hatással lehetett erre, és már egy egyszerűbb vizsgálattal is megmutatható, mi okozott mit. A gépi tanulás csak egy eszköz, minden az adatokon múlik.
A nő itt bukik meg, mint Rottenbiller.

Exponenciális/progresszív felfutást (felfutás elött) semmilyen tanuló algoritmus nem tud korrekten kezelni. Na főleg visszamérés lehetősége nélkül. Na ez az áltudomány: előbb lesz Széles Gábornak energiacellája.

Összes adat? Come on....

- Tud mondani gyakorlati példát, hogy az IBM milyen klímaváltozással kapcsolatos projektben működik közre?
- Van például egy kaliforniai projekt, amiben műholdképek alapján vizsgálják az aszályokat, hogy segítsenek meghatározni, hol és hogyan tudnának az emberek jobban spórolni a vízzel szárazságok idején. Például ajánlásokat tesznek, hogy mikor ne töltsd fel az úszómedencédet.
Így keveredik a hazugság az igazsággal. Úszómedence feltöltésének igen/nemje teljesen korrekten kezelhető probléma, szemben a progresszív felfutású globális átlaghőmérsékletnövekedéssel.

- Az előadásában említette, hogy próbált összefüggést találni a New York-i időjárási adatok és a közlekedési balesetek között, de nem járt sikerrel.
- Nem, New Yorkkal legalábbis nem.
- Volt, amivel igen?
- Mivel ez egy nagyon nagy és forgalmas városban volt, sok minden más is befolyásolta a bal0eteket az időjáráson kívül, például a forgalom mértéke, az utak állapota, stb. A vidéki területeken, ahol nincsenek épületek és hasonlók, sokkal nagyobb lehet az időjárás hatása, de erre nincs bizonyítékom.
Ez itt a blogposztban offtopik, klímaszempontból. De tanulságos, merthogy kb. ilyen őszintén kéne a klímatémához is hozzáállni.

- Milyen más esetekben lehetnek még hasznosak az időjárási adatok?
- Például a mezőgazdaságban, ahol meg lehet jósolni, mikor kell majd öntözni a növényeket. A szupermarketek és más boltok is használják annak az előrejelzésére, hogy mikor milyen termékeket fognak tudni eladni. Hotelek is előre tudják tervezni a szobafoglalásaikat az időjárás alapján. Energiacégnek is segít a tervezésben.
Ezek teljesen korrekt jó példák, az úszómedencéhez hasonlóan.

- Egy interneten elérhető korábbi előadását időjárási és twitteres adatok összevetéséről tartotta. Mesélne erről?
- Tavaly a Watson [az IBM mesterséges intelligencia platformja – BD] használatával elemeztem Twitter-üzenetek érzelmi töltetét, azt néztem meg, hogy látszik-e kapcsolat a valós időjárás és aközött, ahogy az emberek beszélnek róla Twitteren. Nem találtam semmit, de a projekt fő célja nem is ez volt, hanem hogy bemutassam rajta a rendelkezésre álló eszközeinket, hogy milyen egyszerűen használhatók és kombinálhatók.
Érdekes demó-játék, de itt offtopik.

- Min dolgozik most az IBM-nél?
- A PixieDust nevű nyílt adatvizualizációs eszközt fejlesztem, most például a térképek megjelenítését akarom sokkal könnyebbé tenni. Ez az adattudósok által használt Jupyter-jegyzetfüzetekben működik, amik nagyon jó és egyszerű módjai az adatok vizualizációjának. A PixieDust ezt teszi egyszerűbbé akkor is, ha az ember nem nagyon tud kódolni. Ez azért érdekes nekünk az IBM-nél, mert része a Data Science Experince nevű felhőplatformunknak, ahol minden eszköz megtalálható, amire az adattudósoknak szüksége van, lehet gyűjteni és tárolni az adatokat, és meg is lehet osztani a projekteket, az egész csapat az adattudósoktól a fejlesztőkig együtt tud dolgozni egy közös környezetben.
Minden ilyen eszköz potenciális ígéret. Mind a térkép, mind a kódolás-nélküliség erős hívószó.

- Manapság egy adattudósnak programozónak is kell lennie, vagy húzható még éles határ a kettő közé?
- Jelenleg homályos a határ a kettő között. Szerintem egy adattudósnak tudnia kell kódolni, mert anélkül nem tudja végezni a munkáját, de legalább meg kell értenie, hogyan működik a fejlesztői munka. És a másik oldalon a fejlesztőknek se árt érteni, hogyan lehet gépi tanulással dolgozni, sokkal gyorsabb a munka, ha ugyanazokat az eszközöket és környezetet használják a csapaton belül.
Ez szerintem egy jóval komplexebb kérdés.
Itt ebben a posztban tárgyaltam ezen a blogon:
Adattudósok klaszterezése
illetve itt
Mi a különbség a Data Miner("adatbányász") és a Data Scientist("adattudós") között?

- A tudományos életből igazolt az IBM-hez, mi a legnagyobb különbség az itteni munkában?
- Ez nyilván nagyon szubjektív, de én régebben mindig sok-sok különböző fájlban, helyben tároltam az adataimat, és mindent magam csináltam, most viszont minden a felhőben folyik, teljesen más a kollaboráció, és ez nagyon jó.
"Felhőt" így kiemelni mint különbség-faktort. Háááát.....

III.MENET

Végezetül nézzük a kérdéses fórum 41 diás prezentációját a hölgynek.

13.dia: Hadcrut 4.x már előrevetíti a problémákat. Nézetem szerint mind a kevés mérés(pont) és kevés mérés, mind "globálissá" aggregálásuk számtalan sebből vérzik. Illett volna rá kitérni a prezentációban.

20.dia gyönyörűen mutatja az általam szajkozott felfutási problémákat. Kár hogy a nő képtelen észrevenni ezt saját ábrájában.
 
A témába vágó blogposztok, itt a blogon:
Laszilo: Gondolatok Dr. Miskolczi Ferenc üvegházelméletéről
****
Mi az, hogy "klímaszkeptikus" és hogy viszonyul a "termogeddonista pánikkeltőhöz"?
Gyorsuló üvegházhatást nem kéne végre újragondolni az IPCC-nél?
Körösi Csaba: Klímaváltozás – Mindenki Akadémiája, 2016-12-01
Hetesi Zsolt leértékelődése hét év távlatában
Az "intelligens" Antalffy Tibor 
Eördögh Árpád: A félreértett globális felmelegedés, 2011-12-05, blogposzt 
index.hu: "Tényleg bebizonyította a gép, hogy nem is az ember okozta a klímaváltozást?"
index.hu: "Tényleg bebizonyította a gép, hogy nem is az ember okozta a klímaváltozást? II.menet"
Prediktálás börtönfenyegetettség árnyékában?
Klímaváltozás: előrejelzési visszásságok
Klímakatasztrófa előrejelzése 

1 megjegyzés:

  1. Klímaváltozásban a kisugárzással és a jelenségnek a felhőképződésre gyakorolt hatásával van a főbibi...

    VálaszTörlés