čtvrtek 12. listopadu 2020

Vliv jerlínu japonského na počet utopených

Úvodní poznámka: Podotýkám, že nejsem vzděláním ani profesí statistik, byť si o sobě myslím, že v datech umím slušně hledat souvislosti i chyby a někdy dokážu (budiž mi odpuštěno, děje se to většinou v sebeobraně a často vůči těm, kteří v tomto oboru mají ještě větší zkušenosti než já) data "kreativně interpretovat", aby potvrdila právě ten pohled, kterému dávám přednost :-). Prosím případné profesionální statistiky a matematiky, aby mi odpustili některé nekorektní a absurdní příklady použité v článku, ale někdy se na podobných příkladech lépe ukazují skryté logické vady.
 
Představme si značně zvídavou osobu, vybavenou navíc některými technologickými vymoženosti současného digitálního světa, pro zjednodušení (a aby to nešlo napadnout soudně) třeba mne. Protože jsem zvídavý opravdu značně a je právě (hypoteticky) červen, při čtení každoroční statistiky utonulých, kterou média občas před létem připomínají, náhodou zjistím, že dlouhodobá čísla se začínají výrazně zvětšovat právě v měsíci červnu. No a pokud bych byl zároveň alergikem (což naštěstí nejsem), byl bych jen krůček od originální myšlenky: Co když právě pyl našeho národního stromu, lípy srdčité, která v červnu začíná kvést, má s počtem utonulých nějakou tajuplnou souvislost, na kterou přede mnou nikdo nepřišel? Nastartuji tedy svou technologickou kohortu: počítače, tabulkové procesory, všeliké datové analyzátory, mobilní aplikace a cloudová propojení a zjistím, že v červnu a červenci vypadají výsledky opravdu slibně. V srpnu už jsou ale lípy odkvetlé a počet utonulých ještě naroste. Jak říkává Hercules Poirot: "Pořád mi něco důležitého uniká, sakrblé!"
 
Protože ale vliv pylu vypadá jako směr pro mé snažení docela nadějně, prozkoumám kompletní pylový kalendář a zjistím, že v srpnu na kvetoucí lípy navážou pozdně kvetoucí jerlíny japonské. Jejich pyl má nejspíš ještě větší účinek, protože v srpnu lidé tonou v řekách a rybnících doslova jako o závod. Dám si tedy práci a vytvořím optimálně vyvážený "lipojerlínový" ukazatel, který podle všech analýz vykazuje vynikající korelaci s vývojem počtu utopenců v běžném roce. Chilku si lámu hlavu, jak je možné, že se lidé občas topí i v zimě, když jsou lípy i jerlíny holé, ale pak mě napadne spásná myšlenka: Doladím svůj "pylový ukazatel" obyčejnou lískou, která práší už v předjaří, pokročilými výpočetními metodami stanovím přesný poměr vah jednotlivých stromů ve výsledném mixu na 56,4% jerlínu, 38,2% lípy a 5,4% lísky. Co na tom, že v létě se lidé topí hlavně proto, že je horko neodolatelně láká k vodě, a v zimě proto, že se s nimi občas propadne tenčící se led? Co na tom, že celá ta úvaha je podobný nesmysl, jako kdybych řekl, že když půjdu pořád jen do kopce, musím logicky časem dojít na vrchol Sněžky, protože ten je u nás nejvyšší? Můj "komplexní pylový ukazatel" postavený na vědeckém základě dokáže vysvětlit vývoj počtu utopených stejně dobře, ne-li lépe než obyčejný rozum a lidská zkušenost. Teď už stačí poskytnout mu dobrý marketing a za chvíli se jerlínový index bude uvádět spolu s indexem cuchavosti vlasů v každodenní předpovědi počasí, a neplavci se budou bát kolem rozkvetlého jerlínu byť jen projít, aby to s nimi nepraštilo do nejbližší louže, zbylé na pěšině po letní přeháňce. 

Prosím, nechápejte mě špatně: i když to teď tak může vypadat, vůbec nejsem proti používání chytrých výpočetních metod na obrovské objemy různorodých dat a hledání doposud netušených a intuitivně neodhalitelných souvislostí, naopak, jsem velkým fandou takových vymazlených postupů. Jen se vždy přimlouvám za následnou kritickou reflexi podobných výsledků a přiměřenou rozumovou oponenturu. Jenže média se většinou podobnými nadbytečnostmi nemají čas ani náladu zaobírat. Poskytnou kusou informaci a jdou dál, poraď si s tím, člověče, jak umíš. Kolik statistických zvěrstev - většinou s cílem co nejvíc postrašit, protože strach prodává informace nejlépe ze všeho - už jsme takhle na stránkách novin, v televizích či na internetu měli možnost v "době covidové" zachytit? Laicky bych předpokládal, že právě profesionální statistici mohou být na životě nejohroženější skupinou koronavirového období, aniž by se sami s příslušným virem někdy přímo setkali, protože bych se divil, kdyby s nimi některé mediální statistické kreace nesekly.
"Nejvyšší počet nakažených za poslední tři dny!" "Čekají nás tisíce mrtvých denně?" hřímají velké litery úterního vydání, které jako obvykle porovnává pondělí s víkendovými dny, protože tam bývá nárůst největší a realita hned vypadá ještě strašlivěji, než jak je strašná doopravdy (a je strašná dost). "Kdo z nás se dožije vakcíny?" a "Bude šestá vlna více smrtící než ta pátá?" Je to podobné, jako když po silném zemětřesení na Lefkadě točili všichni reportéři své zpravodajské šoty u stejné budovy ošklivě poničeného kostela, takže poté, co si spolu se svými kameramany vystáli frontu na nepříliš prostorné zbořeniště, s očima vypoulenýma předstíranou hrůzou vysílali živě do celého světa "pravdivě děsivé" záběry, aby - když bylo dotočeno a materiál odeslaný do redakce - zašli do taverny na vedlejším nároží, tou dobou jako každý den plné nadšených turistů - na chutný drink.  
 
Osobně jsem přesvědčený, že kromě populistických kroků "politických rytířů bojujících s virem nejúspěšněji na světě" svoje důležité polínko přiložila pod kotel českého koronavirového podzimního průšvihu právě média - tím, že dělala vše pro to, aby udržela "hladinku" strachu ve společnosti nepřetržitě na dostatečné úrovni. Když člověka strašíte příliš dlouho, otupí vůči sebevětší hrůze, takže když je ho pak třeba opravdu k něčemu vybudit a rozproudit jeho podřimující pud sebezáchovy, už jen nad proklamovanými riziky mávne rukou: "Vždyť nás už takhle straší od února, ať už mi všichni dají s tím virem konečně pokoj!" A pak je jednoduché říct: "My to s nimi mysleli dobře, ale oni nás ti naši zlotřilí občani, potvory, neposlouchají a nedodržují to, co jsme jim v jejich vlastním zájmu a pro jejich blaho nařídili, či zakázali. A přitom my jsme všechny varovali včas. Pamatujete? V našem "jerlínovém indexu" jsme na možný špatný vývoj poukazovali už před několika měsíci. Jenže strašit lípou a jerlínem, to je jak mluvit do dubu!!"

I když se snažím přehršle mediálních informací o pandemii velmi silně filtrovat, přece jen sám pro sebe dlouhodobě pár údajů sleduji. Nic objevného, žádný speciální všeodhalující a všepredikující jerlínový index jsem nevyvinul; jsou to jen stejná obyčejná data, která vycházejí dlouhodobě na webu ministerstva zdravotnictví: 
 
- nově idetifikovaní nakažení
- aktuálně hospitalizovaní kvůli covidu
- aktuální pacienti s vážným průběhem nemoci
- zemřelí, kteří byli v době úmrtí pozitivní na covid

Nebudu se teď pouštět do diskuse nad tím, zda definice uvedených ukazatelů dává vždy smysl (pssst, ne vždycky!). Ze své zkušenosti ale vím, že i data se spornou definicí mohou - jsou-li jednoduše získatelná a postup jejich získání se v čase nemění - dávat v trendovém grafu velmi užitečné informace, často lepší a účelnější než náročnými způsoby transformované a optimalizované údaje, protože původní spornou definici většinou jen nahradí neméně sporná transformace. Všechna čtyři čísla sleduji vždy za "plovoucích" sedm dní, aby se vyhladily rozdíly v rámci různých dní v týdnu. Absolutní čísla v grafu raději neuvádím, protože jde o součty různého typu a navíc jsou pro různě barevné čáry použita různá měřítka, takže mezi sebou se jednotlivé závislosti porovnávat nedají, jen jedna každá sama za sebe. Ale bylo by to i zbytečné, protože mě stejně zajímá především časový trend, který je, myslím, z grafu pro všechny hodnoty celkem zřejmý. Já si to, jak se graf v čase vyvíjí, samozřejmě sám pro sebe nějak interpretuji, ale rád ponechám na P.T. čtenářích, aby si případně udělali své vlastní závěry a těmi mými se nenechali svést na scestí :-).

 
Celé toto téma s "pylovými ukazateli", hypoteticky zapojeným jerlínem japonským a různobarevnými grafy, by bylo samo o sobě možná celkem zábavné, kdyby ovšem každý bod barevného grafu neznamenal skutečné - a bohužel jen v těch lepších případech i živé - lidi. S emotivně neutrálními čísly se vždycky pracuje lépe, vždyť právě kvůli jejich schopnosti nahradit abstraktní podobou různorodou a místy i tíživou realitu čísla používáme. Jen bychom to odosobnění zase neměli přehnat a zapomenout, co vlastně takový graf popisuje a že každý jeho bod má nebo měl svou konkrétní tvář.
 
Tak nám všem držím palce, ať se v tomhle grafu pokud možno vůbec neobjevíme, a když už, tak až v okamžiku, až se zase vysoká strmá pohoří na grafu promění v širou lehounce zvlněnou rovinu. Snad stihnu ještě před nočním zákazem vycházení skočit k dobřichovické lávce a tamním rozložitým a dnes pohříchu z nepochopitelných důvodů škytajícím starým jerlínům se omluvit, že jsem si je v takové nejapné souvislosti bral na blogu do úst. Věřím, že se jen moudře pousmějí a řeknou: "No dobře, dobře. Každý máme své. Však to vaše "číslo R" taky není zrovna statistický skvost!"
 
Ale jak už řekli, myslím, kdysi dávno nezávisle na sobě Voltaire s Palackým, spočinuv každý z nich ve své době ve stínu podobného starého rozsochatého stromu probouzejícího kreativitu a vznosné zapamatováníhodné myšlénky: "Kdyby nebylo čísla R, museli bychom si ho vymyslet."  To můj jerlínový index pro predikci počtu utopených, podle kterého si už vodníci zvykli efektivně řídit zásobu hrníčků, si svoje místo na statistickém slunci musí teprve vydobýt :-).

Pozn.: A co vám můj blog - pokud ho ještě neznáte - může dalšího nabídnout? Kromě týdeníku Nedělní miniglosy, reflektujícího už víc než 11 let svérázným způsobem politické a společenské dění, najdete na blogu např. cestopisné reportáže z Japonska, z Řecka a dalších míst, jsou tu i - věřím, že většinou humorně laděné - úvahy a fejetony, povídky, básně, hrátky s češtinou, haiku, vzpomínková vyprávění, povídání o knížkách, filmech či pražských zákoutích a také celá řada fotografií doprovázejících četné fotočlánky. Pokud vás na mých stránkách něco zaujme, neváhejte a dejte o mém blogu vědět i dalším lidem, které by mohly moje články potěšit. Děkuji, opatrujte se a těším se zase brzy na shledanou.  

31 komentářů:

  1. Off šem jerlínový index musí být počítán za ideálního bezvětří. Jinak bys musel aplikovat Windův koeficent vířivosti.

    OdpovědětVymazat
    Odpovědi
    1. To je moc komplikovaný přepočet. Počkám si na oko hurikánu :-).

      Vymazat
  2. Náš pan profesor říkal: "Statistika je jako bikiny. Ukáže hodně, ale to co chceme vidět, ne."

    OdpovědětVymazat
    Odpovědi
    1. To je velmi trefné! :-) S dovolením si to poznamenám a budu příležitostně citovat.

      Vymazat
  3. Bezvadný článek. Teorie pylu mě neskutečně pobavila a byla fakt trefná. To, co opravdu často chybí, je ten zdravý selský rozum. Souhlasím také s tím, že na nynější situaci se dost negativně od počátku roku podílela média. A moc se mí líbilo to polidštění grafu.
    Fakt moc pěkně zpracováno! :-)

    OdpovědětVymazat
    Odpovědi
    1. Děkuji. Média jsou zvyklá jít po extrémech, to už patří k jejich přirozenosti, ale v tomhle konkrétním případě to bylo ke škodě. Vlastně přemýšlím, kde by to bylo k užitku a moc mě toho nenapadá, asi nejsem dostatečným extrémistou :-).

      Vymazat
  4. Citát pana profesora by se měl tesat do kamene. Ovšem neměl by se moc veřejně šířit, protože by si ho muhli lidé vyložit velmi špatně, jako něco co nám je zamlčováno. Tedy že situace je mnohem horší než vypadá a že nám tají, to, že do vánoc všichni pokapem... dneska už jsou všichni tak vyděšení že jsou toho i schopni...

    OdpovědětVymazat
    Odpovědi
    1. Je někdy až k neuvěření, jakým třeskutým konspiracím jsou dnes lidé schopni věřit v domnění, že právě oni podstatě věcí dostatečně rozumějí, protože o tom dostali mailem senza článek. Ostatně, ona jistě nebude náhoda, že nám vláda vliv jerlínu na počet utopených doposud tají, přitom o té závislosti musí být dobře informovaná: Jenom ode mě mají na Úřadu vlády nejmíň deset vyčítavých dopisů :-).

      Vymazat
  5. Ještě přesvědčivě ji by vypadalo, kdyby jerlin navazoval na akat že stejně čeledi... A tak si s tím lze hrát do nekonečná... Ale ono nejde ani tak o klasické statistické podvody, jako o mediální prezentaci a senzaci.. Noviny se číst musí a máme téma na zvejkani... Bohužel, pak je někdo zase už nevěří ničemu... vypláceny a někdo

    OdpovědětVymazat
    Odpovědi
    1. Myslím, že tahle závislost by šla na pylu různých druhů stromů namodelovat opravdu velmi přesně :-).

      Vymazat
  6. Moc dobrý a potřebný článek! Musel dát spoustu práce, takže všechna čest :-) Vždycky, když od někoho, kdo statistiku jako disciplínu v životě ani nezahlédl, slyším chvástavé řeči jako "nevěřím žádné statistice, kterou jsem si sám nezfalšoval", něco ve mně umře. A že toho v poslední době je.

    OdpovědětVymazat
    Odpovědi
    1. Některé bonmoty mají smůlu na to, kdo a v jaké souvislosti si je bere do úst :-). Samozřejmě, s každou statistikou se dá kouzlit. Vždyť jen kolik různých protichůdných výkladů mají stejná oficiální koronavirová data!

      Vymazat
  7. Nejdřív jsem si říkala, jestli už z toho všeho neblázníš :-) Ukázalo se, že ne, že to byl jen zajímavý úvod k tomu závažnějšímu. Statistika byl obávaný předmět, kdy jeden vzoreček obsáhl celou tabuli - takže v té se hrabat nebudu... A jinak dobře napsaný článek.

    OdpovědětVymazat
    Odpovědi
    1. Snažím se nebláznit, ale jak vidíš, za daných okolností to jde ztuha :-).

      Vymazat
  8. Cuchavost vlásků plavovlasého chlapečka nám též mnohé prozradí o jeho původu.

    OdpovědětVymazat
    Odpovědi
    1. No vida, říkal jsem si, že i tenhle index by mohl najít své odběratele :-).

      Vymazat
  9. ad. Poirot: "Pořád mi něco důležitého uniká, sakrblé!"
    á, už to mám. R číslo mi uniklo, ono je Vám Ti tak maloučký, nizoučký,... jenže počítá se z tisíců.
    A jak do těch tisíců a toho srabu napasovat tabulkově jedince nakaženýho tak prapodivně, že ho tam snad ani zahrnout nelze. Eh, ještě že se díky šlendriánu nakažení intuitivně zavčas izolovali a nakažená zůstává jen rodina, nikoliv jejich okolí.
    Jen si překotně a co nejrychleji vše otvírejte, ohrozíte jen a jen svou budoucnost a budoucnost svých dětí. I když chápu, je třeba z něčeho žít.

    OdpovědětVymazat
    Odpovědi
    1. Asi nedokážu na váš komentář smysluplně odpovědět, tak aspoň pěkně pozdravím.

      Vymazat
    2. Za pozdrav děkuji :-) I to pomáhá.
      Mohla bych ke svému předchozímu napsat celý román, ale zatím je to s otevřeným koncem. Tak snad jen - chraňte se, jak jen to jde.

      Vymazat
    3. Tak ať se vše ubírá pokud možno správným směrem.

      Vymazat
    4. Děkuji, ale je tam tolik dalších okolností,...
      Já snad začnu znova malovat třeba i ty částečky pylu, aby se to konečně zvrátilo k dobrému. A pak napíšu román s dobrým koncem :-)

      Vymazat
  10. Když jsem skládala rodokmen, všimla jsem si, že počet utopených v létě byl téměř stejný, jako počet utopených v zimě. A ty popisy příčiny úmrtí, když dostal do ruky pero nějaký spisovatel, to byly hotové krimi romány!
    Myslím, že jerlínové ti tvůj malý úlet odpustí :).

    OdpovědětVymazat
    Odpovědi
    1. Máme tu dva krásné rozložité jerlíny; právě při cestě kolem nich, když v srpnu krásně kvetly, mě ta závislost napadla :-).

      Vymazat
  11. quick

    Nevylepšil by statistiku Řepkový index?

    OdpovědětVymazat
    Odpovědi
    1. Takovou odvahu jsem neměl. Co kdyby měl pan Řepka právě jeden z dalších svých blikanců :-).

      Vymazat
  12. Prý všechno souvisí se vším, třeba na jerlín sedl nakažený netopýr a s pylem se pak virus rozšířil a navíc pak ještě plno psychicky slabších lidí skočilo pod vlak, podřezalo si žíly apod.
    Myslím ale, že ta čísla, která na stránce Seznam.cz vídáme, bohužel ve skutečnosti mohou být mnohem horší, protože jsou tam započteni jen ti, kdo prošli zdravotnickým zařízením, nechali se testovat a/nebo přišli umřít do nemocnice.

    OdpovědětVymazat
    Odpovědi
    1. Skutečná čísla jsou samozřejmě větší, nejspíš značně. Ale čím je horší průběh nemoci, tím hůř se to schová, takže se ty rozdíly mezi realitou a statistikou snižují. Ale zase se dostáváme k tomu, co jsem říkal: Pokud se drží metodika stanovení, dá se z trendu usuzovat na spoustu reálných dějů, i když absolutní čísla nesedí.

      Vymazat
  13. Super čtení. Ve své bývalé práci jsem si potvrdila, že "statistika je přesný součet nepřesných čísel" a že "není důležitý čin, ale jeho interpretace a komuniké o něm". To, že novináři a média nás bombardují většinou ještě zveličenými hrůzami a svět mne poslední roky jen děsí, to je smutné. Občas si vzpomenu na dávno minulé doby a na druhý extrém - přehnaně optimistické reportáže ze sklizně obilí, ve kterých nám reportér - před sklízejícím kombajnem - slibuje vynikající úrodu obilí ve vynikající kvalitě zrna, takže hlad nebude :-)))

    OdpovědětVymazat
    Odpovědi
    1. Dnes jsem viděl hned po ránu úderný titulek, že koronavirus ještě nic není, protože v příštím roce můžeme čekat "hladomor biblických rozměrů". V takové chvíli si připouštím dvě kacířské myšlenky: Že staré vylhané reportáže o vynikající kvalitě zrna měly něco do sebe a že výstražné máchání ve Vltavě (dnes samozřejmě bez diváků a jen v podobě on-line přenosu) taky nebyl tak špatný nápad :-).

      Vymazat
  14. Myslím, že podstata konspiračních teorií spočívá v tom, že dá-li si člověk tu práci, najde důkazy v podstatě pro jakékoliv tvrzení. Pylové spiknutí mě moc pobavilo, je to vtipné a je to trefné. Na grafu už nic vtipného není, mohu se jen přidat s přáním, abychom se nestali jeho součástí a pokud budeme spolutvořit nějakou statistiku, tak jako ti, co to nechytili, případně prošli bez příznaků. :)

    OdpovědětVymazat
    Odpovědi
    1. Taky bych si pro své blízké i pro sebe uměl představit dost lepších grafů, jejichž bychom mohli být spokojenou součástí :-).

      Vymazat

Děkuji za váš komentář a těším se zase brzy na shledanou.