Przedmiot przedstawia wprowadzenie do technik przetwarzania danych z naciskiem na dane o charakterze nienumerycznym (znakowym) i mieszanym. Ćwiczenia praktyczne będą oparte głównie na stosowaniu języka Python i jego bibliotek.

Dwa zasadnicze bloki tematyczne to: dane reprezentowane jako tekst, i podstawy baz relacyjnych, modelu relacyjnego i języka SQL. Tematy bardziej szczegółowo:

  1. Podstawy tekstowej reprezentacji danych; kodowania i obsługa operacji wejścia/wyjścia
  2. Ustrukturyzowane dane tekstowe: CSV i pokrewne
  3. Wyrażenia regularne jako narzędzie przetwarzania danych
  4. Główne pojęcia i zasady modelu relacyjnego
  5. Język SQL, podstawy składni; przykład implementacji: Sqlite
  6. Zaawansowany SQL, reguły normalizacji danych
  7. Oprogramowanie bazodanowe klient-serwer
  8. Rozwiązania nierelacyjne: bazy klucz-wartość i bazy "dokumentowe"

Podstawą zaliczenia będą wyniki ze sprawdzianów, polegających na rozwiązaniu paru (np. 3) niezbyt złożonych zadań programistycznych związanych z przerabianymi tematami. W semestrze odbędą się dwa takie sprawdziany, plus sprawdzian dodatkowy w okresie sesji obejmujący całość materiału. Do zaliczenia liczą się punkty osiągnięte przez studenta w dwóch najwyżej ocenionych sprawdzianach.

Jedno z zadań może być ewentualnie zastąpione testem z wiadomości z wykładu.