Einführung in die maschinelle Sprachverarbeitung mit Python

Dieses Tutorial soll das das Seminar „Einführung in die Maschinelle Sprachverarbeitung“ am Institut für deutsche Sprache und Linguistik an der Humboldt-Universität zu Berlin begleiten. Es bietet einen Einstieg in die Programmiersprache Python und soll die praktische Arbeit mit maschineller Sprachverarbeitung im Seminar vorbereiten.

Vorkenntnisse

Es sind keine Vorkenntnisse im Programmieren notwendig. Sie sollten in der Lage sein, das System-Terminal (oder auch Konsole) aufzurufen und Grundbefehle im Terminal auszuführen, sowie im Dateisystem per Konsole zu navigieren. Unter https://tutorial.djangogirls.org/de/intro_to_command_line/ (falls nicht erreichbar auch im Internet Archiv) finden Sie ein Tutorial zu Terminals, zu dem es auch ein Video gibt.

Zeitplan

Setup Software, die für diesen Kurs benötigt wird herunterladen und installieren
00:00 1. Visual Studio Code und die Python-Konsole Was ist eine IDE?
Wie kann man Python Code ausführen?
00:30 2. Einfache Ausdrücke, Datentypen und Variablen Wie kann man einfache Ausdrücke in Python ausführen?
Was sind Datentypen und Variablen?
01:20 3. Zeichenketten und einfache Skripte Wie kann ich Zeichenketten in Python eingeben und darstellen?
Wie kann ich auf diese oder Teile davon zugreifen?
Was muss ich beim Ausführen von Python-Skripten beachten?
03:10 4. Kontrollstrukturen und Listen Wie können Sequenzen von Werten gespeichert werden?
Wie kann ich Code mehrfach ausführen?
Wie kann ich Code nur unter einer bestimmten Bedingung ausführen?
05:30 5. Eigene Funktionen und Module Wie kann ich selbst eigene Funktionen definieren?
Wie können Funktionen aus externen Bibliotheken eingebunden werden?’
06:30 6. Levenshtein-Distanz Wie kann man die Levenshtein-Distanz selbst in Python berechnen?
08:15 7. Texte in NLTK Wie werden Text in NLTK dargestellt?
Wie kann man auf diese Texte zugreifen?
Was kann man mit den Texten an einfachen statistischen Auswertungen durchführen?
10:25 8. Dateien lesen und schreiben Wie können Dateien durch Python verarbeitet werden?
11:05 9. NLTK und eigene Texte Wie kann ich meine eigenen Texte in NLTK einbinden?
12:05 10. POS-Tagger trainieren Wie kann ein POS-Tagger in NLTK trainiert werden?
12:05 11. Textklassifzierung mit Tensorflow Wie kann man mit Hilfe von neuronalen Netzen Texte klassifizieren?
12:05 12. Kollaboratives Arbeiten mit Git Wie kann man gemeinsam Software entwickeln?
Welche Möglichkeiten gibt es den Quelltext zu teilen?
12:05 Ende

Der tatsächliche Zeitplan kann je nach den vom Kursleiter gewählten Themen und Übungen leicht variieren.