WSGURerayter - отбор самых уникальных статей

WSGURerayter предназначен для анализа массы текстов и отбора из них с самым уникальным содержимым.
Главное окно программы:

Для работы с программой необходимо:
• Поместить в каталог с исходными статьями файлы с расширением .html. В каждом файле должна находиться одна статья.
• Указать каталог, куда будут перемещены отобранные статьи
• В поле «Отобрать из общей массы» ввести количество отбираемых статей с самым уникальным содержимым.
• Поле «использовать максимум слов» необходимо заполнить целым положительным числом не менее 10 с учетом стоп слов.
• Качественный, но более медленный анализ – время анализа увеличивается примерно в 2 раза, но используются более точные алгоритмы.
• Файл stopwords.txt содержит стоп слова, которые не учитываются при анализе.
Для ускорения работы алгоритмов, программа работает только с русскими словами. По индивидуальному запросу возможно подключение и английских слов. Приобрести программу можно здесь С уважением, Максим Гусев http://www.wsgu.ru/

<<< Глобализация областей деятельности