Wednesday, March 28, 2012

Jazyk, iHned a Ekonomie

Dnes mě zaujal článek od Ondřeje Blažka na ihned.cz, ve kterém komentuje nový článek Keitha Chena, The Effect of Language on Economic Behavior: Evidence from Savings Rates, Health Behaviors, and Retirement Assets. Jak název napovídá, Chen se ve svém článku snaží nahlédnout na vztah mezi tím, zda při hovoru o něčem, co se má stát v budoucnu, gramatická pravidla vyžadují explicitní používání nějakého budoucího času a tím, jak se lidé rozhodují při plánování vlastní budoucnosti - například šetřením na stáří.

To, že se Ondřej Blažek dostal k této studii, která ještě nebyla publikovaná v recenzovaném časopise, a rozhodl se ji popsat pro čtenáře iHned či Hospodářských novin, je chvályhodné. Jako jedno z hlavních médií věnující se ekonomickým tématům by určitě nebylo pro iHned na škodu přiblížit čas od času nějakou vědeckou práci širší veřejnosti. Nicméně velký problém vidím v tom, že i když se nám může zdát efekt jazyka na spoření na stáří jako úplný nesmysl, faktem zůstává, že jaký druh jazyka novinář zvolí pro svůj článek má obrovský efekt na to, co si čtenáři poté myslí. Dovolím si předpokládat, že valná většina čtenářů po originálním zdroji nesáhne a bude tak spoléhat na objektivitu výkladu novináře. Vezměme si tedy tento příklad za všechny - a bohužel takovýchto "chytlavých" nadpisů, které přímo zkreslují to, o čem píší, jsou prakticky všechny české noviny plné. Je otázka, jestli úmyslem autora je maximalizovat počet přečtení, v kterémžto případě nepochybně chytlavější nadpisy bodují, či je to jednoduše autorova neschopnost interpretovat svůj zdroj.

Nadpis článku na ihned.cz zní: "Jazyk má vliv na to, jak jsme bohatí, říká nová studie. A čeština na tom není dobře". Tento nadpis tedy přímo svádí čtenáře k několika závěrům: (i) Jakým jazykem mluvíš, tak jsi bohatý. (ii) Někteří lidé jsou chudí, protože mluví špatným jazykem. (ii) Čeština je "špatný" jazyk. A tyto závěry jsou podloženy výzkumem jednoho vědce z Yaleu! Projděme tedy společně rychle Chenovu studii, zda to opravdu říká, a zamysleme se nad argumenty.

Už v abstraktu Chen zmiňuje, že bude testovat hypotézu, zda lidé mluvící jazyky bez nutného budoucího času (zkrátím to zde na JBB jako "jazyk bez budoucnosti")  dělají rozhodnutí zohledňující budoucnost více. Není zde absolutně žádná zmínka o kauzalitě - tedy že by tyto jazyky vedly k tomuto chování. Jediné slovní spojení naznačující tento problém je "common causation", což ovšem má v tomto případě jiný význam: jde o to, že ve zkoumaném vztahu mezi JBB a další proměnnou, například spořením na stáří, může být nějaká další proměnná, kterou ve statistické analýze nezohledníme (například protože o ní nevíme či protože ji neumíme změřit), a pokud tato proměnná má například efekt jak na to, zda mluvíme JBB, tak i na to, kolik spoříme, tak můžeme "změřit" i pozitivní vztah mezi spořením a mluvením JBB. Tento problém je v Chenově analýze bohužel adresovaný z mého pohledu nedostatečně, ale k tomu se vrátím konkrétněji níže. Takže abychom to shrnuli, je pravda, že Chen formuluje nulovou hypotézu: JBB má pozitivní efekt na spoření na stáří. Jak ovšem již abstrakt ukazuje, tuto hypotézu přímo netestuje. Pouze předkládá statistické důkazy, které jsou s touto hypotézou konzistentní (například, že korelace mezi spořením a JBB je pozitivní) - jinými slovy Chen dokumentuje vztahy, které jsou podmínkou nutnou (a to ještě jen za určitých okolností) a nikoliv dostačující pro platnost jeho nulové hypotézy.



Článek samotný začíná proargumentováním, proč takováto nulová hypotéza vůbec může dávat smysl. Kombinuje zde výsledky z psychologie a lingvistiky a nakonec formuluje velmi jednoduchý model rozhodování za nejistoty. V zásadě jde o to, že pokud člověk používá JBB, je nucen více přemýšlet o budoucnosti, protože, když jeho partner v rozhovoru nepoužívá explicitního budoucího času, je pořád možné, že o budoucnosti mluví. Formálně je toto zakotveno v systému subjektivních pravděpodobností ("beliefs") o budoucích stavech ("states of the world"). Takže pokud budeme brát výsledky kognitivní psychologie za bernou minci, Chenova nulová hypotéza může dávat smysl. Následně předkládané důkazy pro podporu této hypotézy pochází ze 3 zdrojů: World Values Survey (WVS), SHARE, OECD. Všechna tato data jsou veřejně přístupná, takže v zásadě kdokoliv může Chenovy výsledky zreplikovat, což je důležitá, leč v ekonomii bohužel relativně málokdy se vyskytující vlastnost vědecké práce. Na těchto datech Chen dokumentuje pozitivní korelaci mezi JBB (kde jazyky kategorizuje dle lingvistů) a spořením. Ve VWS používá logistickou regresi indikátoru zda respondent loni spořil/loni nespořil na JBB a další, v SHARE používá lineární regresi stavu spoření domácnosti na JBB a v OECD regresi na úrovni celého státu. Bohužel všechny tyto regrese jsou problémové hned z několika hledisek. Tím nejdůležitějším problémem je identifikace - v tomto případě, zda regresní koeficienty jsou opravdu konzistentním odhadem efektu, který hledáme. Odpověď je, že bohužel ztěží. Bude velmi těžké, aby Chen obhájil, že "omitted variables", tedy faktory ovlivňující či korelované jak s JBB, tak se spořením, opravdu nehrají důležitou roli. Jako příklad můžeme uvést náboženství - je možné, že protestanti v průměru více spoří a jsou též koncetrovaní do zemí mluvících JBB. Takových příkladů se dá najít celá řada (války, feudální uspořádání ve středověku atd.) Bohužel bude poměrně složité najít v datech, která Chen používá, dostatečnou variabilitu, aby se daly takovéto vynechané proměnné přímo adresovat. Dalším problémem, který Chen částečně ignoruje, například je, že data v SHARE mají dvě dimenze: je to soubor domácností v čase. To ale neznamená pouze, že indikátor pro každou domácnost (fixed effect) dovoluje kontrolovat skryté rozdíly mezi domácnostmi, ale též že odchylky (errorterm) jsou autokorelované a tudíž je třeba provést jejich korekci. A mohli bychom pokračovat. Chen si je pravděpodobně vědom, že kauzalitu bude prokazovat těžko a proto se spokojuje jen se zdokumentováním pozitivní korelace (a i zde mu můžeme spoustu věcí vytknout) a nadhozením potencionálně kontroverzního tématu. Na druhou stranu v samotném závěru je Chen naprosto upřímný a sám problémy s identifikací kauzálního vztahu zmiňuje.

Dovolím si nakonec tvrdit, že Chenův článek, jakkoliv provokativní jeho teze může být, má jen pramalou šanci pro publikování v nějakém z nejkvalitnějších ekonomických časopisů. Je v něm na to příliš mnoho technických problémů a nepřesností. Rozhodně ovšem neobsahuje nic, co by se týkalo oněch otázek, které nadpis článku na iHned evokuje. Možná mohl Ondřej Blažek spíše popsat Chenův zajímavý článek v Journal of Political Economy o jeho pokusech s opičkami, které se naučily používat peníze a obchodovat s nimi - například je měnit za banány. Ten, ač snad na podobně kontroverzní námět, má totiž nepochybně lepší úroveň a možná by tak diskuze pod článkem pak nebyly tak jednotvárné. ;-)

No comments: