Text Analytics Toolbox
Text Analytics Toolbox™ zawiera algorytmy i wizualizacje pozwalające na wstępne przetwarzanie, analizowanie i modelowanie informacji zawartych w tekście. Modele utworzone za pomocą toolboxa mogą mieć zastosowanie w analizach opinii, zarządzaniu predykcyjnym i wyodrębnianiu tematów (topic modeling).
Text Analytics Toolbox zawiera narzędzia do przetwarzania niesformatowanego tekstu ze źródeł takich jak dzienniki zdarzeń, kanały informacyjne, ankiety, raporty pracownicze i media socjalne. Poza wczytywaniem całych dokumentów, możliwe jest wyodrębnianie konkretnych słów kluczowych, reprezentacja tekstu w postaci zbiorów liczb oraz tworzenie modeli statystycznych.
Wykorzystując techniki uczenia maszynowego (LSA, DSA, word embedding) i wielowymiarowe zbiory danych tekstowych utworzone przez Text Anaylitcs Toolbox, w połączeniu z innymi źródłami danych można tworzyć modele uczenia maszynowego wykorzystujące szereg różnych typów danych jak np. tekstowe i numeryczne.
Kluczowe cechy
- Przetwarzanie wstępne tekstu i normalizacja.
- Algorytmy uczenia maszynowego m.in. LSA i LDA.
- Trenowanie typu word embedding i możliwość importowania modeli z word2vec, FastText i GloVe.
- Wykresy typu Word Cloud i Text Scatter.
- Import danych z dokumentów PDF i Microsoft Word.
- Statystyki TF-IDF i częstotliwość występowania słów.