Innehåll
Vidare, litteratur, länkar etc
Kommersiella system som kan vara intressanta att kolla in
Flera av dessa är mycket dyra!
- SQL Server 2000 har en data mining-modul
- Data Mining sakerna i Oracle 9i
- Oracle 9i Personalization
- Knowledge Seeker
- SPSS Clementine
- SAS
Fria system att "leka med" eller studera
- SGI's MLC
Ett välkänt och kompetent system skrivet i C++.
Har dock inte lyckats kompilera det på Linux.
- Weka
Det system som jag visar.
- R
Mer inriktad som statistisk analys men har t.ex. beslutsträd, kluster
och mycket annat.
Rekommenderad litteratur etc
Detta är de bästa mer djuplodande böckerna jag har läst.
Det finns mängder av introduktioner för mer affärssinnade.
Mycket papers finns också.
- Tom Mitchell Machine Learning
Mer teoretisk introduktion om ämnet machine learning.
Används ofta som kursbok.
- Witten & Frank Data Mining
Rätt pragmatisk introduktion för bl.a. utvecklare.
Behandlar Weka (se nedan).
Just nu min bibel!
- Dorian Pyle Data Preparation for Data Mining
Pragmatiskt om hur man förbereder, bearbetar och analyserar data för DM,
och även en hel del tips om tolkningar etc.
- Hand, Mannila, Smyth Principles of Data Mining
En introduktionsbok i Data Mining som betonar statistikerperspektivet.
- Han och Kamber Data Mining Concepts and Techniques
En av de få böcker som faktiskt behandlar DM med databaser som utgångpunkt.
- "Data Mining with SQL Server 2000"
Har ännu inte läst denna, men verkar lovande.
- www.kdnuggets.com
Innehåller mycket intressant info!
- http://citeseer.nj.nec.com/cs
har mycket artiklar och referenser inom datalogi, machine
learning, data mining .
- UCI data repository
Här finns mycket testdata som bl.a. används för att att göra benchmarks på
data mining-algoritmer.
Eller bara att leka med.
Vissa finns konverterade till Arff-format i denna Jar-fil.
Andra (numeriska) standardexempel finns här.
Innehåll
created by
hakank