Getting your Trinity Audio player ready...

Schwer­punkt

Wirt­schafts­wis­sen­schaft­ler wen­den zuneh­mend Tech­ni­ken zur Ver­ar­bei­tung natür­li­cher Spra­che (NLP) an, um die geld­po­li­ti­sche Kom­mu­ni­ka­ti­on zu ana­ly­sie­ren. Die­se Stu­di­en bie­ten zwar wert­vol­le Ein­bli­cke, stüt­zen sich aber häu­fig auf Sprach­mo­del­le, die auf Samm­lun­gen all­ge­mei­ner Tex­te trai­niert wur­den. Die­se Ein­schrän­kung kann dazu füh­ren, dass die Model­le nicht in der Lage sind, die ein­zig­ar­ti­gen Nuan­cen des Zen­tral­bank­we­sens und der Geld­wirt­schaft voll­stän­dig zu erfas­sen. Die neue­re Lite­ra­tur deu­tet dar­auf hin, dass eine Umschu­lung von Sprach­mo­del­len auf domä­nen­spe­zi­fi­sche Daten die Leis­tung bei spe­zia­li­sier­ten NLP-Ana­ly­sen ver­bes­sern kann.

Bei­trag

Wir stel­len CB-LMs (cen­tral bank lan­guage models) vor – Sprach­mo­del­le, die auf einer umfang­rei­chen Samm­lung von Zen­tral­bank­tex­ten neu trai­niert wur­den. Durch die Ver­wen­dung bekann­ter Model­le wie BERT und RoBER­Ta und die Hin­zu­fü­gung von Tex­ten, die auf das Zen­tral­bank­we­sen zuge­schnit­ten sind – dar­un­ter Reden, poli­ti­sche Noti­zen und For­schungs­pa­pie­re – erfas­sen CB-LMs domä­nen­spe­zi­fi­sche Seman­tik, Ter­mi­no­lo­gien und kon­tex­tu­el­le Nuan­cen. Unser pri­mä­res Ziel ist es, CB-LMs zu ent­wi­ckeln und zu ver­öf­fent­li­chen, um die NLP-Ana­ly­se in der Geld­wirt­schaft und im Zen­tral­bank­we­sen vor­an­zu­trei­ben. Dar­über hin­aus lie­fert unse­re umfas­sen­de Bewer­tung ver­schie­de­ner gro­ßer Sprach­mo­del­le (Lar­ge Lan­guage Models, LLMs) in ver­schie­de­nen Trai­nings­um­ge­bun­gen Ein­bli­cke in die Modell­aus­wahl, die auf die spe­zi­fi­schen Auf­ga­ben und tech­ni­schen Anfor­de­run­gen von Zen­tral­ban­kern zuge­schnit­ten ist.

Ergeb­nis­se

Wir stel­len fest, dass CB-LMs ihre Basis­mo­del­le bei der Vor­her­sa­ge von mas­kier­ten Wör­tern inner­halb von Rede­wen­dun­gen der Zen­tral­bank über­tref­fen. Eini­ge CB-LMs über­tref­fen nicht nur ihre Aus­gangs­mo­del­le, son­dern auch die moderns­ten gene­ra­ti­ven LLMs bei der Klas­si­fi­zie­rung geld­po­li­ti­scher Hal­tun­gen aus den Erklä­run­gen des Offen­markt­aus­schus­ses. CB-LMs zeich­nen sich dadurch aus, dass sie nuan­cier­te Aus­drü­cke der Geld­po­li­tik ver­ste­hen, was sie zu wert­vol­len Werk­zeu­gen für Zen­tral­ban­ken bei der Echt­zeit­ana­ly­se und Ent­schei­dungs­fin­dung machen könn­te. In schwie­ri­ge­ren Sze­na­ri­en – wie etwa bei begrenz­ten Daten für die Fein­ab­stim­mung und die Ver­ar­bei­tung län­ge­rer Text­ein­ga­ben – könn­ten die größ­ten LLMs wie ChatGPT‑4 und Llama‑3 70B die CB-LMs jedoch über­tref­fen. Der Ein­satz die­ser LLMs stellt die Zen­tral­ban­ken jedoch vor erheb­li­che Her­aus­for­de­run­gen in Bezug auf Ver­trau­lich­keit, Trans­pa­renz, Repli­zier­bar­keit und Kosteneffizienz.

Zusam­men­fas­sung

Wir stel­len Sprach­mo­del­le für Zen­tral­ban­ken (CB-LMs) vor – spe­zia­li­sier­te Sprach­mo­del­le, die nur mit einem Kodie­rer arbei­ten und auf einem umfas­sen­den Kor­pus von Reden, poli­ti­schen Doku­men­ten und For­schungs­pa­pie­ren von Zen­tral­ban­ken trai­niert wur­den. Wir zei­gen, dass CB-LMs ihre Basis­mo­del­le bei der Vor­her­sa­ge von mas­kier­ten Wör­tern in Rede­wen­dun­gen der Zen­tral­bank über­tref­fen. Eini­ge CB-LMs über­tref­fen nicht nur ihre Basis­mo­del­le, son­dern auch moderns­te gene­ra­ti­ve Lar­ge-Lan­guage-Model­le (LLMs) bei der Klas­si­fi­zie­rung der geld­po­li­ti­schen Aus­rich­tung von Aus­sa­gen des Fede­ral Open Mar­ket Com­mit­tee (FOMC). In kom­ple­xe­ren Sze­na­ri­en, die eine Stim­mungs­ein­ord­nung umfang­rei­cher Nach­rich­ten im Zusam­men­hang mit der US-Geld­po­li­tik erfor­dern, stel­len wir fest, dass die größ­ten LLMs die domä­nen­an­ge­pass­ten rei­nen Enco­der-Model­le über­tref­fen. Der Ein­satz solch gro­ßer LLMs stellt die Zen­tral­ban­ken jedoch vor erheb­li­che Her­aus­for­de­run­gen in Bezug auf Ver­trau­lich­keit, Trans­pa­renz, Repli­zier­bar­keit und Kosteneffizienz.

Quel­le: CB-LMs: lan­guage models for cen­tral banking