Операция консолидации данных (duplicateJob)¶
Операция предназначена для объединения кластера записей, их очищения и сопоставления записей из таблиц.
Операция выполняет объединяет кластера записей, но не производит поиск дублирующихся записей. После объединения кластеров дубликатов операция снова проверяет получившиеся наборы записей на дубликаты (т.е. уже сами объединенные записи могут сформировать кластера).
Для поиска новых / обновления существующих дубликатов записей используется Операция сопоставления данных (matchingJob).
Параметры операции¶
Имя пользователя (поле ввода). Логин учетной записи, от имени которой будут выполняться действия операции.
Наборы правил (выпадающий список). Перечень наборов правил, которые будут обработаны операцией (будут консолидированы, обновлены или удалены кластера только для выбранных правил).
Размер блока (поле ввода). Размер блока загружаемых данных. По умолчанию 1024.
Назначенная сущность (выпадающий список). Сущность, записи которой будут консолидированы по выбранным наборам. Если оставить параметр пустым - будут консолидироваться записи по каждой сущности.
Пропустить пересопоставление в хранилище PostgreSQL (флаг). При включении будет пропущен перерасчет кластеров по данным таблиц сопоставления из хранилища PostgreSQL.
Размер блока пересопоставления для PostgreSQL (поле ввода). Размер блока загружаемых данных при перерасчете кластеров по данным таблиц сопоставления из хранилища PostgreSQL (по умолчанию 1024).
Когда применяется¶
Операция запускается в случаях:
Если необходимо объединить кластера дубликатов записей, найденных ранее (в ходе работы Операции сопоставления данных (matchingJob)).
Если производились значимые изменения в таблицах сопоставления записей.
Если есть сомнения в актуальности кластеров дубликатов.
Периодичность запуска определяется администратором системы с учетом рабочих задач по обслуживанию Юниверс MDM.
С помощью триггеров можно настроить последовательное выполнение операций matchingJob > duplicateJob.