Wissensexploration.de Knowledge Mining & Discovery: Text, Web und Data Mining, Suchtechnologien, explorative Datenanalyse | Web Crawling Strategien und Information Retrieval im Web, fokussierte Web Crawler, semantisches Wissen und Informationsextraktion | > Empowering Business Intelligence.
Themen:   Home Artikel Text Mining Fokussierte Crawler Web IR KDD Software Literatur Impressum
Text Mining
Links | Kommentare

Text Mining - Zusammenfassung

Text Mining ist ein junges Forschungsgebiet, das mit dem Versprechen verbunden ist eine Technologie darzustellen, die ihren Benutzern intelligente Schnittstellen zur Textrezeption und zugleich inhaltsorientierte Textanalysen anbietet um Daten zu explorieren und kontextsensitiv aufzubereiten (vgl. Mehler und Wolff, 2005, S.1).

Ziel des Text Mining ist die Transformation freier Texte in derartige Form, dass Data Mining Methoden möglich werden. Die Interpretation und Evaluation der Ergebnisse erfolgt dabei stets in Anbetracht einer klar definierten Zielstellung.
Visualisierungstechniken erlauben es auch ohne klare Zielsetzung die Texte zu explorieren. Hier wird die Vision wissensorientierter Ansätze des Text Mining zur automatischen Exploration und Wissensgewinnung zumindest teilweise erfüllt.
Zwischen der Forderung wissensorientierter Ansätze, die Explorationslast dem Text Mining System zu überlassen und methodenorientierten Ansätze bei der die Explorationslast auf Seiten des Rezipienten liegt, besteht in der Praxis ein Kompromiss zwischen Massendatentauglichkeit, Fehlertoleranz und Robustheit auf der einen und analytischem und semantischem Auflösungsvermögen auf der anderen Seite (vgl. Mehler und Wolff, 2005, S. 7). Ein Beispiel dafür ist das Feld der Informationsextraktion.
Der Aspekt der Massendatenanalyse verweist dabei auf den Begriff „Web Mining“, der Anwendung von (Text) Mining Methoden auf das Web (vgl. Mehler und Wolff, 2005, S. 7).

An Softwarelösungen zur Wissensexploration (im Sinne des Knowledge Mining) gibt es eine Fülle am Markt. Anbieter erfindet dafür einen eigenen Wortschatz ("distilling knowledge", "empowering BI", "Linguistic DNA" etc.), weshalb folgende Anbieterübersicht und Analyse etwas Klarheit bringen soll: weiter zur Text Mining Software