Microsoft sortiert 1401 GByte Daten in 60 Sekunden

von Florian Kalenda

Es nutzt dazu ein neues Verfahren namens Flat Datacenter Storage ohne Hierarchien. Mit deutlich weniger Hardware wurde der Rekord von Yahoo aus dem Jahr 2009 überboten. Es handelte sich um 1033 Laufwerke in 250 Systemen. weiter

Microsoft veröffentlicht Roadmap für Hadoop

von Bernd Kling

Die Freigabe von Hadoop für Azure ist für den 30. März vorgesehen. Gleichzeitig soll eine Preview von Hadoop für Windows Server erscheinen. Neben den Hadoop-Distributionen will Microsoft weitere Tools für Big-Data-Analytics bereitstellen. weiter

EMC bringt NAS speziell für Hadoop

von Florian Kalenda und Larry Dignan

Es unterstützt dessen Dateisystem HDFS nativ. CIOs will man eine skalierbare Komplettlösung für den Einstieg in Big Data ohne Bastelarbeit anbieten. EMCs Greenplum-Reihe konkurriert vor allem mit Oracles Big Data Appliance. weiter

Apache erklärt Hadoop zur Final

von David Meyer und Florian Kalenda

Version 1.0 gilt vor allem als Signal an die Außenwelt. Die Datenplattform wird längst von Firmen wie Amazon, Microsoft oder Yahoo eingesetzt. Das Update korrigiert aber auch zahlreiche Fehler und ermöglicht Schreibzugriff über HTTP. weiter

EMC integriert Hadoop in Analyseplattform Greenplum

von Florian Kalenda und Jack Clark

Dadurch entsteht die Greenplum Unified Analytics Platform. Ihre Managementkonsole wird einige Hadoop-Funktionen automatisieren. Über ein Social Network namens Greenplum Chorus sollen die Projektbeteiligten kommunizieren. weiter

Microsoft stellt Big-Data-Projekt Dryad ein

von Anita Klingler und Mary Jo Foley

Es konzentriert sich künftig ausschließlich auf Hadoop. Trotzdem hat der Softwarekonzern ein geringfügiges Update für seinen jüngsten Dryad-Testbuild bereitgestellt. Der stammt von Mitte Oktober und wird die letzte Version bleiben. weiter

Microsoft wird Hadoop-Distributor

von Bernd Kling und Jack Clark

Die Big-Data-Lösung erlaubt die Verarbeitung und Analyse großer Datenmengen mit Clustern. Hadoop ist ein Open-Source-Projekt der Apache Software Foundation. Microsoft will seine Distribution für Windows Server und Azure anbieten. weiter

Oracle kündigt Appliance auf Basis von NoSQL und Hadoop an

von Florian Kalenda und Jason Hiner

Sie soll in der Cloud zum Einsatz kommen und unstrukturierte Daten auswerten. Die nicht relationale Datenbank NoSQL verwenden beispielsweise Facebook und Twitter. Die "Big Data Appliance" könnte etwa Personenprofile erstellen. weiter

Dell und Cloudera stellen Hadoop-Paket zusammen

von Florian Kalenda und Jack Clark

Neben der Apache-Analysesoftware gehört die Management-Lösung Cloudera Enterprise zum Lieferumfang. Dell steuert einen Switch und einen Server bei. Zielgruppe sind etwa Finanzdienstleister, Energieversorger, Forscher und Handelsketten. weiter

EMC integriert Hadoop in Greenplum-Appliance

von Florian Kalenda und Jack Clark

Eine Hardware-Appliance kommt im dritten Quartal, die Software-Version schon früher. Grundlage ist eine eigene Distribution. EMC bewirbt sie als zwei- bis fünfmal so schnell wie andere Hadoop-Versionen. weiter

Cloudera bringt Version drei seiner Hadoop-Distribution

von Florian Kalenda und Larry Dignan

Es handelt sich um ein integriertes und getestetes Software-Paket mit der Analysesoftware selbst und weiteren Werkzeugen. Alle sind jetzt Open Source. Cloudera bietet Firmenkunden dazu Support an. weiter

Open-Source-Software „R“ bekommt Hadoop-Integration

von Anita Klingler und Dave Rosenberg

Mit dem Add-on-Package RevoScaleR macht Revolution Analytics seine Statistik-Software für Datenmengen in Terabyte-Größe nutzbar. Sie sollen innerhalb von Sekunden verarbeitet werden. Auch diverse NoSQL-Datenbanken sowie ein Set gängiger Statistik-Algorithmen sind in dem Paket enthalten. weiter