« Bayesian Networks | Main | Komplexa system och software engineering »

juni 24, 2003

En egen sökmotor - nästan

Hittade Open Source-projektet Carrot2 skrivet i Java. Tomcat rekommenderas som web server.

Carrot2 är en "klustringsmotor" som samlar sökresultat från en sökmotor och grupperar dem sedan i kluster, lite som t.ex. turbo10.com. En av finesserna är att det också finns filter, t.ex. stemmer för engelska, så att man kan manipulera med sökorden. I demon finns det en olika kombinationer av sökmotor+filter+klustringsalgoritmer att välja mellan. Det finns en demo av systemet. Den är lite slö, men man ser i alla fall hur de har tänkt sig.

Man kan ladda ner systemet här. Jag installerade systemet, vilket tog en liten stund i och med att man måste mixtra med lite XML-filer för Tomcat. Det är dock inga svårigheter om man följer installationsinstruktionerna .

Det enda jag ännu har fått att funka är dock förfabricerade demo-sökningar, så systemet är - ännu - inte användbart som en lokal sökmotor. Det ska bli intressant att följa utvecklingen.

Posted by hakank at juni 24, 2003 10:15 FM Posted to Machine learning/data mining | Sökmotorer