Maschi­nel­les Ler­nen (ML) hat ein enor­mes Poten­zi­al für die Wirt­schafts­for­schung und ‑pra­xis, aber nur durch Ver­such und Irr­tum lässt sich aus einer Viel­zahl von Algo­rith­men und Modell­pa­ra­me­tern die bes­te Wahl tref­fen. Bei Zeit­rei­hen­stu­di­en ist es der­zeit kein rei­bungs­lo­ser Pro­zess, in gro­ßem Maß­stab zu tes­ten, wel­che Wirt­schafts­rei­hen zur Ver­bes­se­rung der Model­le hin­zu­ge­fügt wer­den könn­ten. Wirt­schafts­wis­sen­schaft­ler, die kau­sa­le Quer­schnitts­stu­di­en unter­su­chen, könn­ten von der Mög­lich­keit pro­fi­tie­ren, gro­ße kau­sa­le Daten­sät­ze zu simu­lie­ren, um zu tes­ten, wel­che ML-Model­le kom­ple­xe, nicht­li­nea­re Kau­sa­li­tät erken­nen. Eine wei­te­re Her­aus­for­de­rung besteht dar­in, dass Wirt­schafts­wis­sen­schaft­ler im Gegen­satz zu ande­ren Berei­chen, in denen ML ange­wandt wird, in der Regel nicht dazu ange­hal­ten wer­den, ihre Model­le zu doku­men­tie­ren oder deren brei­te­re Aus­wir­kun­gen zu berück­sich­ti­gen – ein wich­ti­ger Punkt, wenn ML von einer Rei­he von Nut­zern im pri­va­ten und öffent­li­chen Sek­tor ver­wen­det wird.

Bei­trag
Ich beschrei­be ginga­do, eine ein­fach zu ver­wen­den­de Open-Source-ML-Biblio­thek mit fünf Haupt­bei­trä­gen. Ers­tens hilft sie den Nut­zern, auto­ma­tisch Hun­der­te von Zeit­rei­hen aus einer Rei­he von offi­zi­el­len sta­tis­ti­schen Quel­len zu erfas­sen. Zwei­tens bie­tet sie auto­ma­ti­sche Bench­mark-Model­le auf der Grund­la­ge von Zufalls­wäl­dern, die in einer Viel­zahl von Fäl­len gut funk­tio­nie­ren, aber von den Benut­zern leicht ange­passt wer­den kön­nen. Drit­tens ermög­licht ginga­do die fle­xi­ble Simu­la­ti­on von gro­ßen und mehr­di­men­sio­na­len Panel­da­ten mit linea­ren und nicht­li­nea­ren Kau­sal­be­zie­hun­gen in den daten­er­zeu­gen­den Pro­zes­sen. Vier­tens erleich­tert es die Modell­do­ku­men­ta­ti­on auf der Grund­la­ge von ML-Best-Prac­ti­ces, ein­schließ­lich ethi­scher Über­le­gun­gen zur Modell­ver­wen­dung, falls zutref­fend. Fünf­tens bie­tet es Hilfs­pro­gram­me für die Ana­ly­se von Zeitreihendaten.

Ergeb­nis­se
Je mehr Wirt­schafts­wis­sen­schaft­ler die prak­ti­schen Anwen­dun­gen von ML erfor­schen, des­to mehr wer­den sie von einem spe­zia­li­sier­ten Werk­zeug­satz pro­fi­tie­ren, der auf den bestehen­den all­ge­mein ver­wend­ba­ren Biblio­the­ken auf­baut. ginga­do soll die­se Lücke fül­len, indem es eine Rei­he von Werk­zeu­gen bereit­stellt, die für eine Viel­zahl von wirt­schaft­li­chen Anwen­dungs­fäl­len hilf­reich sein kön­nen, sowohl unab­hän­gig von­ein­an­der als auch in Kom­bi­na­ti­on. Die Biblio­thek ist mit weit ver­brei­te­ter ML-Soft­ware kom­pa­ti­bel, und die Benut­zer kön­nen sie ent­we­der von der Stan­ge ver­wen­den oder ihre Werk­zeu­ge anpas­sen. ginga­do befin­det sich in akti­ver Ent­wick­lung, so dass neue Funk­tio­nen zu erwar­ten sind.

Quel­le: ginga­do: a machi­ne lear­ning libra­ry focu­sed on eco­no­mics and finance