Data Science

Inhaltsbasierte Bild- und Videoanalyse

  • Type: Vorlesung (V)
  • Semester: SS 2016
  • Time: 18.04.2016
    11:30 - 13:00 wöchentlich
    50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten


    25.04.2016
    11:30 - 13:00 wöchentlich
    50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

    02.05.2016
    11:30 - 13:00 wöchentlich
    50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

    09.05.2016
    11:30 - 13:00 wöchentlich
    50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

    23.05.2016
    11:30 - 13:00 wöchentlich
    50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

    30.05.2016
    11:30 - 13:00 wöchentlich
    50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

    06.06.2016
    11:30 - 13:00 wöchentlich
    50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

    13.06.2016
    11:30 - 13:00 wöchentlich
    50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

    20.06.2016
    11:30 - 13:00 wöchentlich
    50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

    27.06.2016
    11:30 - 13:00 wöchentlich
    50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

    04.07.2016
    11:30 - 13:00 wöchentlich
    50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

    11.07.2016
    11:30 - 13:00 wöchentlich
    50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

    18.07.2016
    11:30 - 13:00 wöchentlich
    50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten


  • Lecturer: Dr.-Ing. Muhammad Saquib Sarfraz
    Prof.Dr.Ing. Rainer Stiefelhagen
  • SWS: 2
  • Lv-No.: 24628
VoraussetzungenKenntnisse zu Grundlagen der Mustererkennung, wie sie im Stammmodul Kognitive Systeme [IN3INKS / IN4INKS] vermittelt werden, werden vorausgesetzt.
BeschreibungBei der immer größer werdenden Masse an leicht verfügbarenMultimediadaten werden Methoden zur deren automatischen Analyse, dieBenutzern dabei helfen können, gewünschte Inhalte zu finden, immerwichtiger. Hierfür werden verschiedene Technologien benötigt. Zum einenmuss der Inhalt der Multimediadaten in einer passenden Formrepräsentiert werden, die eine effiziente und erfolgreiche Sucheermöglicht. Außerdem werden entsprechende audio-visuelleAnalyseverfahren benötigt. Die folgende Suche kann entwedervollautomatisch erfolgen, oder den Benutzer interaktiv in denSuchprozess einbinden.

In dieser Vorlesung werden verschiedene Themen der inhaltsbasiertenBild- und Videoanalyse in Multimediadaten behandelt werden. DieVorlesung beinhaltet unter anderem folgende Themen:

  • Bildsegmentierung und Deskriptoren
  • Maschinelles Lernen für Inhaltsbasierte Bild- und Video-Analyse sowie
  • Suche
  • Videoschnitterkennung und Klassifikation von TV Genres
  • Evaluaierung Inhaltsbasierter Bild- und Videoanalyseverfahren(TrecVid)
  • Automatisches "tagging" von Personen in Fotoalben & sozialen Netzen
  • Personen-/Gesichtsdetektion und -erkennung in Videos
  • Erkennung von Ereignissen
  • Detektion von Kopien
  • Semantik in Bildern und Videos
  • Data mining in sozialen Netzen
  • Suche: Automatische und interaktive Suche / Relevanz-Feedback
  • Werkzeuge und Softwarebibliotheken zur Bild- und Videoanalyse
LehrinhaltBei der immer größer werdenden Masse an leicht verfügbaren Multimediadaten werden Methoden zur deren automatischen Analyse, die Benutzern dabei helfen können, gewünschte Inhalte zu finden, immer wichtiger. Hierfür werden verschiedene Verfahren benötigt. Zum einen muss der Inhalt der Multimediadaten in einer passenden Form repräsentiert werden, die eine effiziente und erfolgreiche Suche ermöglicht. Außerdem werden entsprechende audio-visuelle Analyseverfahren benötigt. Die folgende Suche kann entweder vollautomatisch erfolgen, oder den Benutzer interaktiv in den Suchprozess einbinden.

Das Modul vermittelt Studierenden einen Überblick über wichtige Verfahren zur inhaltsbasierten Bild- und Videoanalyse. Im Einzelnen werden folgende Themen besprochen:

• Bildsegmentierung und Deskriptoren
• Maschinelles Lernen für Inhaltsbasierte Bild- und Video-Analyse
• Videoschnitterkennung und Klassifikation von TV Genres
• Evaluierung Inhaltsbasierter Bild- und Videoanalyseverfahren(TrecVid)
• Automatisches "Tagging" von Personen in Fotoalben & sozialen Netzen
• Personen-/Gesichtsdetektion und -erkennung in Videos
• Erkennung von Ereignissen
• Detektion von Kopien
• Semantik in Bildern und Videos
• Data mining in sozialen Netzen
• Suche: Automatische und interaktive Suche / Relevanz-Feedback
• Werkzeuge und Softwarebibliotheken zur Bild- und Videoanalyse

AnmerkungDie Lehrveranstaltung findet in Deutsch und Englisch statt.
KurzbeschreibungThe number of easily accessible multimedia is increasing drastically. Therefore methods of automatic analysis, which support the users to find the contents requested, are becoming more and more important. For this purpose different technologies are required. On the one hand, the content of the multimedia data is to be modelled in an adequate way, which allows an efficient and successful search, and on the other hand appropriate audio-visual analysis procedures are required. The search can then be either done fully automatically or involve the user interactively in the search process.

This lecture deals with various topics of content-based image and video analysis and includes the following topics:
• Image segmentation and descriptors
• Basic knowledge of machine learning for content-based image and video analysis as well as video cut detection
• Classification of TV genres
• Evaluation of content-based image and video analysis methods
• Automated tagging of persons in photo albums and social networks
• Detection of duplicates (copy detection)
• Semantics in images and videos
• Automatic and interactive search / relevance feedback
• Tools and libraries for image and video analysis

ArbeitsbelastungBesuch der Vorlesungen: ca. 20 Stunden

Vor- und Nachbereitung der Vorlesung: ca. 30 Stunden

Klausurvorbereitung: ca. 40 h

Summe: ca. 90 Stunden

ZielIn dieser Vorlesung werden verschiedene Themen der inhaltsbasierten Bild- und Videoanalyse in Multimediadaten behandelt werden. Die Vorlesung beinhaltet unter anderem folgende Themen:
• Bildsegmentierung und Deskriptoren
• Grundlagen des Maschinelles Lernen für Inhaltsbasierte Bild- und Video-Analyse sowie• Videoschnitterkennung
• Klassifikation von TV Genres
• Evaluierung Inhaltsbasierter Bild- und Videoanalyseverfahren
• Automatisches "Tagging" von Personen in Fotoalben & sozialen Netzen
• Detektion von Duplikaten (copy detection)
• Semantik in Bildern und Videos
• Automatische und interaktive Suche / Relevanz-Feedback
• Werkzeuge und Softwarebibliotheken zur Bild- und Videoanalyse
PrüfungDie Erfolgskontrolle erfolgt in Form einer mündlichen Prüfung im Umfang von i.d.R. 20 Minuten nach § 4 Abs. 2 Nr. 2 SPO.