Anfang des Jahres veranstaltete Google einen Wettbewerb auf Kaggle für YouTube Video Klassifizierung. Google stellte hierfür 7 Million Video mit insgesamt 450.000 Stunden bereit, welche in 4716 Kategorien klassifiziert werden sollten. Das drittplatzierte Team, ein Zusammenschluss von Forschern der Tsinghua Universität und Baidu, haben Ihren Ansatz kürzlich Veröffentlicht.
Sie erreichen mit einer 7 Layer tiefen LSTM Architektur eine Genauigkeit von 82,75 % nach der verwendeten Global Average Precision Metrik.
Die verwendete Architektur des temporal residual CNN, ist wie folgend Dargestellt:
Quelle: Tsinghua Universität, 2017
Zurück