[Blockierte Grafik: http://www.oreilly.de/catalog/covers/collintellger.s.gif]
Bildverlinkung geniest die freundliche Genehmigung des O'Reilly-Verlages.
- Authoren: Toby Segaran
- Übersetzer: Thomas Demmig
- Verlag: O'Reilly
- Ausgabe: 1.Auflage 2008
- Sprache: deutsch
- Umfang: 367 Seiten
- ISBN: 9783897217805
ZitatAlles anzeigen
„Kollektive Intelligenz
analysieren, programmieren & nutzen“rezensiert von
T.Hinze
Vorwort
Begriff "Kollektive Intelligenz":
"Kollektive Intelligenz ist ein emergentes Phänomen. ... So versteht eine soziologische Interpretation unter kollektiver Intelligenz gemeinsame, konsensbasierte Entscheidungsfindung; ... Das Internet vereinfacht wie nie, dezentral verstreutes Wissen der Menschen zu koordinieren und so deren kollektive Intelligenz nutzbar zu machen."Gerade das Nutzbarmachen von Informationen aus verschiedenen Datenquellen, wie sie das Internet zu Hauf bietet, ist Kernthema dieses Buches. Auf dem Buch-Cover heißt es dann auch:
"User-Daten und UGC für Ihre Web 2.0-Apps nutzen: Dieses Buch erläutert anschaulich, wie aus User Generated Content mit den richtigen Algorithmen "kollektive Intelligenz" destilliert werden kann ..."
Das Thema selbst kann ein sehr komplexes sein und hat bisher eine Unmenge an verschiedenen Algorithmen hervorgebracht. Der Autor setzt sich in diesem Buch mit diesen auseinander bzw. setzt diese ein, um Erkentnisse aus den zugrunde liegenden Daten zu gewinnen.Eins vorweg: es ist eine sehr spannende Reise in die Welt der Datenanalyse.
zum Inhalt
Das Buch behandelt eingehend auf beeindruckend wenig Seiten die komplexesten Methoden und Analysen des sogenannten "Data-Mining".
Es unterteilt sich in die nachfolgend gezeigten Kapitel, wobei jedes einen für sich stehenden Ansatz beschreibt:
1) Einführung in die kollektive Intelligenz
2) Empfehlungen geben
3) Gruppen bilden
4) Suchen und Bewerten
5) Optimierung
6) Dokumente filtern
7) Modellieren mit Entscheidungsbäumen
Aufbauen von Preismodellen
9) Komplexe Klassifikation: Kernel-Methoden und SVMs
10) Unabhängige Merkmale finden
11) Entwickeln von Intelligenz
12) Zusammenfassung der Algorithmen
13) Fremdbibliotheken
14) Mathematische FormelnDas Cover wirbt mit dem Satz: "Die Faszination der Algorithmen entdecken" und hat damit absolut Recht. Zudem vermittelt es neben dem reinen Programmcode sehr anschaulich die Ideen, die dann in Code gegossen werden. So dreht sich eine komplexe Beispielaufgabe um die Findung einer optimalen Lösung für die Flugticketbuchung, bei der verschiedene Anforderungen, wie geringe Wartezeiten, geringe Kosten, etc., mit der Fülle an Flugroutendaten abgeglichen werden muss. Bei der einleitenden Betrachtung merkt man schnell, dass der Vorgang per Hand ebenfalls nicht trivial ist und der Autor zeigt vorab verschiedene Herangehensweisen auf, ehe er Code präsentiert.
Gerade durch die Vorbetrachtungen zu den Einzelthemen gewinnt man die notwendigen Aha-Effekte und lernt wie man mit verteilten Daten/API's usw. Umgehen muss bzw. kann.Dem geneigten Leser offeriert T. Segaran das Tor zur Welt der Datenanalyse auf glaobaler (Internet-) Ebene. Alle Beispiele sind in Python verfasst. Dies hat einen unschlagbaren Vorteil: die Codes sind klein und sehr gut lesbar. Der Lernende muss sich somit nicht mit Barrieren der Programmiersprache herumplagen, sondern kann direkt das Wissen für sich extrahieren.
Die Themenbreite des Buches ist trotz seiner relativ geringen Seitenzahl erstaunlich hoch. Für Programmierer, die auf dem Gebiet des Data-Mining bzw. der Analyse von kollektiven Daten tätig werden wollen, bietet das Buch sehr viel "Input" und sensibilisiert für das "Wo und Wie".
Fazit
Die Komplexität der Themen steigt mit zunehmender Seitenzahl und viele spätere Lösungen greifen auf frühere Beispiele und deren Umsetzung zurück. Als wirklich einfach zu lesen, würde ich das Buch nicht bezeichnen, da es recht kompakt die Probleme abhandelt. Als Leser muss man sich intensiv mit den aufgezeigten Lösungen befassen, um sie später in noch komplexeren Aufgaben anwenden zu können.Trotzdem bietet das Buch einen waren Schatz an Möglichkeiten, Analyse-/ Aufbereitungsalgorithmen sowie intelligenten Lösungsansätzen, die man sonst nur weit verstreut im Netz findet. Dieses Buch bietet all dies auf sehr kompakten Raum und wird ein treuer Begleiter in Projekten, die genau diese "kollektive Intelligenz" nutzen wollen.
Für mich ein sehr gelungenes Werk, welches meinen Horizont für verteilte Daten im Netz deutlich erweitert hat. Für eine klare Kaufempfehlung.
Torty