Настройка библиотеки Hunspell

Библиотека Hunspell может дополняться под нужды пользователя.

Словарь hunspell состоит из двух файлов:

  • Первый файл (.dic) - содержит список "корней" слов (стемов) со специальными метками, флагами.

  • Второй файл (.aff) - содержит группы аффиксов, обозначенные флагами.

Файлы можно редактировать, добавляя свои слова и правила.

Описание формата см. в официальной документации.

Пример: слово "процессный".

  1. Откройте файл словаря ru_RU.dic, кодировка KOI8-R.

  2. Добавьте строку "процессный/A":

    • A - прописывается латиницей. Это флаг, обозначающий к какой группе аффиксов (второй файл .aff) относится данное слово (Рисунок 1).

  3. Сохраните файл в домашней директории OpenSearch в ./hunspell.

  4. Перезапустите OpenSearch.

../../../_images/image42.png

Рисунок 1 – Пример добавления слова "процессный"