Text Analytics Toolbox

Text Analytics Toolbox zawiera algorytmy i wizualizacje pozwalające na wstępne przetwarzanie, analizowanie i modelowanie informacji zawartych w tekście. Modele utworzone za pomocą toolboxa mogą mieć zastosowanie w analizach opinii, zarządzaniu predykcyjnym i wyodrębnianiu tematów (topic modeling).

Text Analytics Toolbox zawiera narzędzia do przetwarzania niesformatowanego tekstu ze źródeł takich jak dzienniki zdarzeń, kanały informacyjne, ankiety, raporty pracownicze i media socjalne. Poza wczytywaniem całych dokumentów, możliwe jest wyodrębnianie konkretnych słów kluczowych, reprezentacja tekstu w postaci zbiorów liczb oraz tworzenie modeli statystycznych.

Wykorzystując techniki uczenia maszynowego (LSA, DSA, word embedding) i wielowymiarowe zbiory danych tekstowych utworzone przez Text Anaylitcs Toolbox, w połączeniu z innymi źródłami danych można tworzyć modele uczenia maszynowego wykorzystujące szereg różnych typów danych jak np. tekstowe i numeryczne.

Kluczowe cechy

  • Przetwarzanie wstępne tekstu i normalizacja.
  • Algorytmy uczenia maszynowego m.in. LSA i LDA.
  • Trenowanie typu word embedding i możliwość importowania modeli z word2vec, FastText i GloVe.
  • Wykresy typu Word Cloud i Text Scatter.
  • Import danych z dokumentów PDF i Microsoft Word.
  • Statystyki TF-IDF i częstotliwość występowania słów.

Dowiedz się więcej

Wypróbuj produkty

Sprawdź możliwość bezpłatnego przetestowania produktów firmy MathWorks

Dowiedz się więcej