Wissensexploration.de Knowledge Mining & Discovery: Text, Web und Data Mining, Suchtechnologien, explorative Datenanalyse | Web Crawling Strategien und Information Retrieval im Web, fokussierte Web Crawler, semantisches Wissen und Informationsextraktion | > Empowering Business Intelligence.
Themen:   Home Artikel Text Mining Fokussierte Crawler Web IR KDD Software Literatur Impressum
Software
Links | Kommentare

Text Mining Software Temis

Temis bietet eine Reihe von Text Mining Lösungen. XeLDA bietet computerlinguistische Komponenten u.a. zur Sprachidentifikation, Segmentierung und Tokenisierung, morphologische Analyse inklusive „word sense disambiguation“, Bestimmung des Kontexts von Worten und Sprachwendungen.

Insight Discoverer Extractor ist ein IE System. Texte werden zuerst morphologisch und syntaktisch analysiert. Im zweiten Schritt werden Extraktions-Regeln angewandt, die die Texte mit Hilfe von Wörterbüchern (z.B. Wordnet) und speziellen Regeln semantisch auszeichnet. Es gibt eine Reihe an vordefinierten Extraktionsregeln und Wörterbüchern. Die Personalisierung ist auch möglich. (http://www.temis-group.com/fichiers/t_downloads/file_18_ID_Extractor_(en).pdf)

Insight Discoverer Clusterer verwendet die extrahierten Informationen des Insight Discoverer Extractor um Dokumente zu Clustern.

Insight Discoverer Categorizer wird zur Kategorisierung von Dokumenten in eine oder mehrere Kategorien einer Taxonomie, zur Indexierung (Identifikation von Themen in einem Dokument im Vergleich mit den bereits indexierten Dokumenten) und für die automatische Distribution von Dokumenten an bestimmte Personen oder Organisationseinheiten verwendet. (http://www.temis-group.com/fichiers/t_downloads/file_24_ID_Categorizer_(en).pdf)

Dateitypen: über 50 Formate (u.a. Microsoft Word, PDF, HTML)
Sprachen: Englisch, Französisch, Deutsch, Italienisch, Holländisch, Spanisch, Portugiesisch, Tschechisch, Griechisch, Ungarisch, Polnisch, Russisch.
Plattform: Windows NT, 2000, XP Workstation und Server.

URL: http://www.temis-group.com