Support-Vektor-Maschinen für extrem große Datenmengen

Maschinelles Lernen beschäftigt sich mit algorithmischen und statistischen Aspekten des automatischen Trainings adaptiver Vorhersagemodelle aus Daten. Lernsysteme haben in großem Stil Einzug in industrielle Anwendung sowie die Analyse wissenschaftlich relevanter Daten erhalten. Aufgrund ihrer akkuraten Vorhersagen, statistischen Eigenschaften und hohen Flexibilität haben sich Support-Vektor-Maschinen (SVMs) und allgemeiner die gesamte Klasse der Kernelmethoden als eines der Standardverfahren hier fest etabliert. Einer ihrer wesentlichen Nachteile ist allerdings der aufwendige Trainingsprozess, der eine exakte Modellbildung für große Datenmengen unmöglich macht. Die daraus resultierende Verwendung einfacherer (z.B. linearer) Modelle aus rein algorithmischen Gründen ist aus statistischer Sicht abzulehnen, da gerade große Datenmengen eine optimale Voraussetzung für hohe Qualität nicht-linearer Modelle ohne restriktive Annahmen sind. Hier setzt eine Vielzahl von Näherungsverfahren an, die nicht-lineare SVMs auch auf große Datenmengen anwendbar zu machen versuchen. Diese sind allerdings weder vollständig entwickelt, und – im Gegensatz zum exakten SVM-Modell – komplexitatstheoretisch und lerntheoretisch kaum untersucht. Ziel unseres Projekts ist es, diese Lücke zu schließen. Dazu werden wir den Zusammenhang zwischen Trainingszeit und statistischen Lerngarantien sowohl empirisch wie auch theoretisch untersuchen und so den Trade-O verschiedener Verfahren vergleichend untersuchen. Ergänzend werden wir neue (Kombinationen von) Verfahren entwickeln und untersuchen. Die so gewonnenen Erkenntnisse werden die Modellierung relevanter Problemen aus den Bereichen der Astrophysik, der medizinischen Bildverarbeitung, der Fahrerassistenz und der Sportanalyse ermöglichen.

Antragsteller

Ruhr-Universität Bochum: Jun.-Prof. Dr. Tobias Glasmachers (Institut für Neuroinformatik);Technische Universität Dortmund: Prof. Dr. Claus Weihs (Fakultät Statistik, Lehrstuhl für Computergestützte Statistik)

Förderlinie: Projektförderung
Fördersumme: 229.438,00 Euro
Laufzeit: 01.11.2013 – 31.10.2015

Ansprechpartner

Jun.-Prof. Dr. Tobias Glasmachers
Ruhr-Universität Bochum
Institut für Neuroinformatik
Universitätsstraße 150
44780 Bochum

Telefon: 0234 322 5558
tobias.glasmachers (at) ini.rub(dot)de