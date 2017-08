Microsoft hat auf der Konferenz Hot Chips 2017 unter der Bezeichnung Project Brainwave eine Deep Learning Acceleration Platform vorgestellt. Sie soll die für cloudbasierte Deep-Learning-Modelle benötigte Flexibilität und Leistung bereitstellen, die wiederum Künstliche Intelligenz in Echtzeit ermöglicht. „Das bedeutet, dass das System Anfragen so schnell verarbeitet, wie es sie erhält, mit einer extrem kurzen Verzögerung“, schreibt Doug Burger, Distinguished Engineer bei Microsoft, in einem Blogeintrag.

Das Brainwave-System besteht aus drei Hauptkomponenten. Die erste Schicht bildet eine massive Infrastruktur aus Field Programmable Gate Arrays (FPGAs). Sie erlaubt Deep Neural Networks (DNN) als Hardware-Microservices bereitzustellen. Dabei wird ein neurales Netzwerk einem Pool von FPGAs zugeordnet. Diese Architektur soll die Latenzzeiten reduzieren, da die eingehenden Anfragen nicht von einer CPU verarbeitet werden müssen.

Die zweite Schicht nennt Microsoft DNN Processing Unit (DPU). Sie werden auf handelsüblichen FPGAs dargestellt, wobei Microsoft ein Design benutzt, das für verschiedene Datentypen verwendet werden kann. Ähnliche Systeme anderer Anbieter sind laut Microsoft auf einen Datentyp beschränkt. Trotzdem erreiche das eigene System eine ähnliche Performance wie die Chips mit einer hardwareseitig vorgegebenen DPU.

Darüber hinaus integriert Project Brainwave einen Software-Stack, der eine Vielzahl von verbreiteten Deep Learning Frameworks unterstützen soll. „Wir unterstützen bereits Microsoft Cognitive Toolkit und Googles Tensorflow, und planen, den Support noch auszuweiten“, ergänzte Burger.

Als FPGA kommt der Chip Stratix 10 der Intel-Tochter Altera zum Einsatz. Mit ihm soll Brainwave eine dauerhafte Leistung von 39,5 Teraflops erreichen. Externen Entwicklern sollen die FPGAs via Azure im kommenden Jahr zur Verfügung stehen.

