Web Content Mining
Web Content Mining befasst sich mit der Erkennung von Regularitäten in den Inhalten innerhalb von Social-Media-Quellen.Web Content Mining ist ein Anwendungsgebiet für die Social Media Analyse nach und während eines Social Media Monitorings, die auch das Erkennen von Tonalitäten aus dem Social Web beinhaltet. Oft bestehen die Inhalte der Daten im Social Web aus unstrukturierten Daten, wie Text-Dokumenten, semi strukturierten Daten wie HTML-Dokumenten und stärker strukturierten Daten wie Tabellen oder dynamisch generierten HTML-Seiten. Grundsätzlich bestehen die Inhalte einer Social-Media-Website aus verschiedenen Datentypen, wie Texten, Bildern, Audio-, Video-, Metadaten und Hyperlinks. Web Content Mining von multiplen Datentypen wird als „Multimedia Data Mining” bezeichnet und kann als Instanz von Web Content Mining verstanden werden. Hauptsächlich bestehen die Inhalte des Social Webs jedoch aus unstrukturiertem Text. Text Mining kann als Instanz und übergeordnetes Forschungsgebiet von Web Content Mining verstanden werden. Die verwendeten Methoden sind allgemeine Data Mining Methoden, wobei statistische und computerlinguistische Verfahren die Transformation der Texte in eine (für das Data Mining) adäquate Form realisieren. Dies geschieht innerhalb eines Monitorings mit Hilfe von Social Media Monitoring Tools.