Permalink

0

Kennen Sie schon … die Korpora-Sammlung von Jan Oliver Rüdiger?

Jan Oliv­er Rüdi­ger, wis­senschaftlich­er Mitar­beit­er am Leib­niz-Insti­tut für Deutsche Sprache (IDS) in Mannheim, hat sich der Entwick­lung soft­waregestützter Meth­o­d­en für die Lin­guis­tik ver­schrieben.

Auf sein­er Web­site find­en Sie eine Zusam­men­stel­lung zahlre­ich­er Kor­po­ra zur kosten­losen Nutzung:

  • Briefe: Jean Paul
  • CEHugeWe­b­Cor­pus
  • DTA-Kor­pus
  • Deutsche poli­tis­che Reden
  • Deutsch­er Bun­destag Druck­sachen
  • Deutsch­er Bun­destag Ple­narpro­tokolle
  • EuroParl – Deutsche Reden
  • Het­WiK – Het­ero­gene Wider­stand­skul­turen
  • KAMOKO
  • kleineanfragen.de
  • NottDeuYTSch
  • One Mil­lion Posts Cor­pus
  • Open­Le­gal­Da­ta
  • Ref­eren­zko­r­pus Alt­deutsch (750‑1050)
  • Ref­eren­zko­r­pus Früh­neuhochdeutsch (1350–1650)
  • Ref­eren­zko­r­pus Mit­tel­hochdeutsch (1050–1350)
  • Ref­eren­zko­r­pus Mit­tel­niederdeutsch / Nieder­rheinisch (1200–1650)
  • TextGrid – Dig­i­tale Bib­lio­thek
  • W2C – Web to Cor­pus
  • Wahl­pro­gramme zur Bun­destagswahl 2021
  • Wikipedia

Alle hier aufge­führten Kor­po­ra (ins­ge­samt über 2 Mrd. Token) sind frei ver­füg­bar und kön­nen kosten­frei zu nicht kom­merziellen Zweck­en genutzt wer­den (siehe All­ge­mein). Voraus­set­zung für die Nutzung ist ein bere­its instal­liert­er Cor­pu­s­Ex­plor­er (kosten­frei / Open­Source). Dieser erlaubt nicht nur die Analyse und Visu­al­isierung der Kor­pus­dat­en, son­dern sorgt auch dafür, dass Sie immer mit aktuell­stem Kor­pus­ma­te­r­i­al arbeit­en (Kor­pus-Autoup­date).

An der Entwick­lung des Cor­pu­s­Ex­polor­er war er auch beteiligt:

Diese Soft­ware ist Open­Source und wurde im Rah­men meines 2020 abgeschlosse­nen Pro­mo­tion­spro­jek­ts (Uni­ver­sität Kas­sel): „Cor­pu­s­Ex­plor­er – Eine Soft­ware zur kor­pus­prag­ma­tis­chen Analyse.“ entwick­elt.

Der Cor­pu­s­Ex­plor­er richtet sich an Korpuslinguist*innen und Text-/Da­ta-Min­ing Inter­essierte. Die Soft­ware vere­int über 50 inter­ak­tive Auswer­tungsmöglichkeit­en unter ein­er nutzer­fre­undlichen Bedienober­fläche. Rou­tineauf­gaben wie z. B. Tex­takquise, Taggen oder die grafis­che Auf­bere­itung von Ergeb­nis­sen wer­den voll­ständig automa­tisiert. Die ein­fache Hand­habung erle­ichtert den Ein­satz in der uni­ver­sitären Lehre und führt zu schnellen sowie gehaltvollen Ergeb­nis­sen. Dabei ist der Cor­pu­s­Ex­plor­er offen für viele Stan­dards (XML, CSV, JSON, R, uvm.) und bietet die Möglichkeit, große Kor­po­ra mit­tels HPC (high-per­for­mance com­put­ing) auszuw­erten.

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.