Getting your Trinity Audio player ready...

Das Paper Can LLM Impro­ve for Expert Fore­cast Com­bi­na­ti­on? Evi­dence from the Euro­pean Cen­tral Bank Sur­vey unter­sucht das Poten­zi­al von gro­ßen Sprach­mo­del­len (LLMs) zur Ver­bes­se­rung der Pro­gno­se­kom­bi­na­ti­on von Exper­ten, basie­rend auf Daten der Umfra­ge unter pro­fes­sio­nel­len Pro­gnos­ti­kern (SPF) der Euro­päi­schen Zen­tral­bank (EZB).

Her­kömm­li­che Metho­den zur Pro­gno­se­kom­bi­na­ti­on ste­hen vor Her­aus­for­de­run­gen wie klei­nen Stich­pro­ben­grö­ßen, feh­len­den Beob­ach­tun­gen und man­geln­der Inter­pre­tier­bar­keit. Das Haupt­ziel der Stu­die ist es, zu bewer­ten, ob LLMs die­se Ein­schrän­kun­gen über­win­den und die Genau­ig­keit von Makro­öko­no­mie­pro­gno­sen ver­bes­sern können.

Die For­scher schla­gen einen Zero-Shot-Lern­an­satz vor, bei dem die LLMs his­to­ri­sche Leis­tungs­da­ten von Exper­ten ana­ly­sie­ren, um Pro­gno­se­mus­ter und ‑ver­zer­run­gen zu erken­nen und auto­ma­tisch opti­ma­le Kom­bi­na­ti­ons­ge­wich­te zu bestim­men, ohne dass eine Fein­ab­stim­mung oder zusätz­li­ches Trai­ning erfor­der­lich ist. Die Metho­dik umfasst Prompt Engi­nee­ring mit drei Schlüs­sel­kom­po­nen­ten: Gewich­tung basie­rend auf his­to­ri­scher Genau­ig­keit, Kom­pen­sa­ti­on von Ver­zö­ge­run­gen und Ver­bes­se­rung von Trends.

Die Ergeb­nis­se zei­gen, dass das LLM-Ensem­ble die ein­fa­che Durch­schnitts­bil­dung über­trifft, ins­be­son­de­re bei kurz­fris­ti­gen Pro­gno­sen (ein Jahr im Vor­aus). Die­ser Vor­teil ist beson­ders aus­ge­prägt bei Indi­ka­to­ren wie dem BIP-Wachs­tum und der Arbeits­lo­sen­quo­te. Die Stu­die stellt fest, dass das LLM-Ensem­ble wider­stands­fä­hi­ger gegen­über Mei­nungs­ver­schie­den­hei­ten unter Exper­ten ist und eine sta­bi­le­re Leis­tung bei unter­schied­li­chen Auf­merk­sam­keits­ni­veaus der Pro­gnos­ti­ker auf­weist. Robust­heits­tests, ein­schließ­lich der Ver­wen­dung alter­na­ti­ver Feh­ler­me­tri­ken und LLM-Model­le, bestä­ti­gen die­se Ergebnisse.

Die Inter­pre­ta­ti­on des LLM-Ensem­bles zeigt einen mehr­stu­fi­gen Denk­pro­zess, der eine feh­ler­ge­steu­er­te Gewich­tung, die Iden­ti­fi­zie­rung und Kor­rek­tur von Ver­zö­ge­rungs­ef­fek­ten sowie die Opti­mie­rung der Trend­kon­sis­tenz umfasst. Dar­über hin­aus kann die Inte­gra­ti­on emo­tio­na­ler Prompts die Pro­gno­se­er­geb­nis­se beein­flus­sen, was die Sen­si­bi­li­tät des Modells für Markt­stim­mung und Erwar­tun­gen unterstreicht.

Die Stu­die kommt zu dem Schluss, dass LLMs die makro­öko­no­mi­sche Pro­gno­se­kom­bi­na­ti­on erheb­lich ver­bes­sern kön­nen, indem sie sta­tis­ti­sche Genau­ig­keit mit ver­hal­tens­be­zo­ge­nen Erkennt­nis­sen ver­bin­den und eine sofort ein­setz­ba­re Lösung für Prak­ti­ker bieten