Eric Baldeschwieler, bei Yahoo in führender Position für die Hadoop-Entwicklung zuständig, hat bekanntgegegebn, dass das Unternehmen künftig seine Kräfte beim Hadoop-Projekt von Apache einbringen werde.
Die hauseigene Yahoo-Distribution von Hadoop werde hingegen eingestellt, schreibt Baldeschwieler im Yahoo-Entwicklerblog. Im Zuge der Neuausrichtung auf Apache verschwinden alle Referenzen zu Hadoop von den Yahoo-Seiten, wie “developer.yahoo.com/hadoop”. Zudem werden die Versionsverwaltungen abgeklemmt (“yahoo.github.com/hadoop-common”).
Yahoo werde sich bei Apache an der Hadoop-Entwicklung dergestalt beteiligen, dass gehärtete Binary-Releases für Yahoo und andere Hadoop-Nutzer für den Einsatz in ihren Clustern bereitstehen. Aus Hadoop soll durch die Mithilfe Yahoos unter dem Dach von Apache “die” Open-Source-Plattform für große Datenmengen entstehen. Dazu müssen aber erst die beiden Entwicklungszweige von Yahoo und Apache abgeglichen werden.
Yahoo will seine Version “hadoop-0.20-sustaining”, die mit Patches und Fixes bei den rund 40.000 Yahoo-Nodes im Einsatz sei, bei Apache unter “hadoop/common/branches/branch-0.20-security” einstellen. Die Übertragung habe bereits begonnen, schreibt Baldeschwieler. Yahoo schlägt vor, diese Version Hadoop 20.100 zu nennen und die Community darüber abstimmen zu lassen, ob daraus ein Apache-Release werden könne.





