Краулер файловой системы Filesystem

Извлекаемые объекты

В результате сканирования из источника извлекаются метаданные следующих типов объектов:

  • Файл

  • Каталог

С версии 2.13 в качестве Root директории указывается HostName сканируемого сервера. Перед запуском сканера необходимо провести очистку информационной системы.

Для файлов следующих форматов извлекаются метаданные о структуре файла:

  • CSV (Разделители: запятая, точка с запятой, табуляция и вертикальная черта)

  • XLSX, XLS

  • JSON

  • XML

При сканировании файлового ресурса исключаются системные и скрытые файлы.

Настройка разрешений для учетной записи

Для учетной записи пользователя необходимо настроить разрешение на чтение сканируемых файлов и директорий.

При сканировании DFS директорий необходимы разрешения на целевом сервере, на котором хранятся сканируемые файлы и директории.

Имя целевого сервера (srv2) и путь указывается в свойствах, на вкладке DFS в разделе «Список ссылок» (Referral list):

Вкладка DFS

Рисунок 1 – Вкладка DFS

Загрузка файлов и библиотек

Загрузка дополнительных библиотек не требуется.

Параметры подключения к источнику

Таблица 1 – Параметры Filesystem краулера

Название

Описание

Название

Уникальное название подключения к источнику, обязательный параметр.

Источник

Тип сканируемого источника: - linux — сканирование директории на удалённом linux-хосте - shared — сканирование общей директории на удалённом windows-хосте

Описание

Описание создаваемого подключения.

Пользователь

Имя пользователя, от имени которого выполняется сканирование файлов на удалённом хосте, обязательный параметр. Пример для доменной учётной записи: Login@domain.ru

Пароль

Пароль пользователя, от имени которого выполняется сканирование файлов на удалённом хосте, обязательный параметр.

Имя хоста или IP-адрес

Имя хоста или IP-адрес, на котором размещаются файлы, обязательный параметр. При сканировании DFS директорий указывается имя хоста или IP-адрес целевого сервера.

Директория

Указывается путь до сканируемой директории. Примеры: - Для shared: \\Имя_хоста_или_IP\myFiles\test_files - Для linux: /dir1/myFiles/test_files При сканировании DFS директорий указывается путь на целевом сервере.

Лимит размера файла

Лимит размера файла для парсинга структуры (в мегабайтах). Из файлов, превышающих указанный лимит, не будут извлечены колонки. Примеры: - empty — лимит 10 МБ - 10 — лимит 10 МБ - 100 — лимит 100 МБ Установка слишком высокого лимита может повлиять на скорость сканирования источника.