KIT - more Data Science@KIT

Data Science

Startseite

more Data Science@KIT

Inhaltsbasierte Bild- und Videoanalyse

Type: Vorlesung (V)
Semester: SS 2016
Time: 18.04.2016
11:30 - 13:00 wöchentlich
50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten
weitere...

25.04.2016
11:30 - 13:00 wöchentlich
50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

02.05.2016
11:30 - 13:00 wöchentlich
50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

09.05.2016
11:30 - 13:00 wöchentlich
50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

23.05.2016
11:30 - 13:00 wöchentlich
50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

30.05.2016
11:30 - 13:00 wöchentlich
50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

06.06.2016
11:30 - 13:00 wöchentlich
50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

13.06.2016
11:30 - 13:00 wöchentlich
50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

20.06.2016
11:30 - 13:00 wöchentlich
50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

27.06.2016
11:30 - 13:00 wöchentlich
50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

04.07.2016
11:30 - 13:00 wöchentlich
50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

11.07.2016
11:30 - 13:00 wöchentlich
50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

18.07.2016
11:30 - 13:00 wöchentlich
50.34 Raum -101 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten
Lecturer: Dr.-Ing. Muhammad Saquib Sarfraz
Prof.Dr.Ing. Rainer Stiefelhagen
SWS: 2
Lv-No.: 24628

Links

weitere Informationen

Voraussetzungen	Kenntnisse zu Grundlagen der Mustererkennung, wie sie im Stammmodul Kognitive Systeme [IN3INKS / IN4INKS] vermittelt werden, werden vorausgesetzt.
Beschreibung	Bei der immer größer werdenden Masse an leicht verfügbarenMultimediadaten werden Methoden zur deren automatischen Analyse, dieBenutzern dabei helfen können, gewünschte Inhalte zu finden, immerwichtiger. Hierfür werden verschiedene Technologien benötigt. Zum einenmuss der Inhalt der Multimediadaten in einer passenden Formrepräsentiert werden, die eine effiziente und erfolgreiche Sucheermöglicht. Außerdem werden entsprechende audio-visuelleAnalyseverfahren benötigt. Die folgende Suche kann entwedervollautomatisch erfolgen, oder den Benutzer interaktiv in denSuchprozess einbinden. In dieser Vorlesung werden verschiedene Themen der inhaltsbasiertenBild- und Videoanalyse in Multimediadaten behandelt werden. DieVorlesung beinhaltet unter anderem folgende Themen: Bildsegmentierung und Deskriptoren Maschinelles Lernen für Inhaltsbasierte Bild- und Video-Analyse sowie Suche Videoschnitterkennung und Klassifikation von TV Genres Evaluaierung Inhaltsbasierter Bild- und Videoanalyseverfahren(TrecVid) Automatisches "tagging" von Personen in Fotoalben & sozialen Netzen Personen-/Gesichtsdetektion und -erkennung in Videos Erkennung von Ereignissen Detektion von Kopien Semantik in Bildern und Videos Data mining in sozialen Netzen Suche: Automatische und interaktive Suche / Relevanz-Feedback Werkzeuge und Softwarebibliotheken zur Bild- und Videoanalyse
Lehrinhalt	Bei der immer größer werdenden Masse an leicht verfügbaren Multimediadaten werden Methoden zur deren automatischen Analyse, die Benutzern dabei helfen können, gewünschte Inhalte zu finden, immer wichtiger. Hierfür werden verschiedene Verfahren benötigt. Zum einen muss der Inhalt der Multimediadaten in einer passenden Form repräsentiert werden, die eine effiziente und erfolgreiche Suche ermöglicht. Außerdem werden entsprechende audio-visuelle Analyseverfahren benötigt. Die folgende Suche kann entweder vollautomatisch erfolgen, oder den Benutzer interaktiv in den Suchprozess einbinden. Das Modul vermittelt Studierenden einen Überblick über wichtige Verfahren zur inhaltsbasierten Bild- und Videoanalyse. Im Einzelnen werden folgende Themen besprochen: • Bildsegmentierung und Deskriptoren • Maschinelles Lernen für Inhaltsbasierte Bild- und Video-Analyse • Videoschnitterkennung und Klassifikation von TV Genres • Evaluierung Inhaltsbasierter Bild- und Videoanalyseverfahren(TrecVid) • Automatisches "Tagging" von Personen in Fotoalben & sozialen Netzen • Personen-/Gesichtsdetektion und -erkennung in Videos • Erkennung von Ereignissen • Detektion von Kopien • Semantik in Bildern und Videos • Data mining in sozialen Netzen • Suche: Automatische und interaktive Suche / Relevanz-Feedback • Werkzeuge und Softwarebibliotheken zur Bild- und Videoanalyse
Anmerkung	Die Lehrveranstaltung findet in Deutsch und Englisch statt.
Kurzbeschreibung	The number of easily accessible multimedia is increasing drastically. Therefore methods of automatic analysis, which support the users to find the contents requested, are becoming more and more important. For this purpose different technologies are required. On the one hand, the content of the multimedia data is to be modelled in an adequate way, which allows an efficient and successful search, and on the other hand appropriate audio-visual analysis procedures are required. The search can then be either done fully automatically or involve the user interactively in the search process. This lecture deals with various topics of content-based image and video analysis and includes the following topics: • Image segmentation and descriptors • Basic knowledge of machine learning for content-based image and video analysis as well as video cut detection • Classification of TV genres • Evaluation of content-based image and video analysis methods • Automated tagging of persons in photo albums and social networks • Detection of duplicates (copy detection) • Semantics in images and videos • Automatic and interactive search / relevance feedback • Tools and libraries for image and video analysis
Arbeitsbelastung	Besuch der Vorlesungen: ca. 20 Stunden Vor- und Nachbereitung der Vorlesung: ca. 30 Stunden Klausurvorbereitung: ca. 40 h Summe: ca. 90 Stunden
Ziel	In dieser Vorlesung werden verschiedene Themen der inhaltsbasierten Bild- und Videoanalyse in Multimediadaten behandelt werden. Die Vorlesung beinhaltet unter anderem folgende Themen: • Bildsegmentierung und Deskriptoren • Grundlagen des Maschinelles Lernen für Inhaltsbasierte Bild- und Video-Analyse sowie• Videoschnitterkennung • Klassifikation von TV Genres • Evaluierung Inhaltsbasierter Bild- und Videoanalyseverfahren • Automatisches "Tagging" von Personen in Fotoalben & sozialen Netzen • Detektion von Duplikaten (copy detection) • Semantik in Bildern und Videos • Automatische und interaktive Suche / Relevanz-Feedback • Werkzeuge und Softwarebibliotheken zur Bild- und Videoanalyse
Prüfung	Die Erfolgskontrolle erfolgt in Form einer mündlichen Prüfung im Umfang von i.d.R. 20 Minuten nach § 4 Abs. 2 Nr. 2 SPO.