Основные понятия¶
- Атрибут¶
Характеристика объекта, которая имеет название и значение. Атрибуты могут иметь разный тип, в зависимости от предназначения. Типы атрибутов: Простой тип, Ссылка на справочник, Перечисление, Локальное перечисление.
Пример: атрибут "Производитель" со значением "Япония", атрибут "Адрес" со значением адреса.
- Бизнес-процесс¶
Описание процесса, предназначенного для согласования каких-либо изменений по заранее настроенному алгоритму (на основе нотации BPMN). Это отдельный компонент системы, который выполняет необходимые задачи в процессе работы (например, согласование изменений записи).
Пример: бизнес-процесс трехэтапного согласования записей для реестра "Закупки сырья".
- Валидация¶
Проверка и подтверждение соответствия данных заранее определенным требованиям качества. Проверка призвана выявлять бессмысленные, неинформативные, некорректные или ошибочные данные.
Правило качества в режиме валидации создает ошибки качества.
Пример: валидация формата номера телефона.
- Вложенный объект¶
Объект модели данных, который представляет собой набор вложенных атрибутов. При настройке атрибутов реестра вложенный объект выбирается в качестве основы (шаблона) для комплексного атрибута. Один вложенный объект может быть использован в нескольких комплексных атрибутах.
- Входящая связь¶
Запись, в которую приходит связь (конечная точка связи).
- Дедупликация¶
Устранение дубликатов записей каким-либо образом. Например, через ручное последовательное объединение кластеров дубликатов или запуск операции дедупликации данных.
- Единица измерения¶
Описание измеряемых величин и их параметров. Любая единица измерения содержит базовую единицу, к которой сводятся все остальные.
Пример: объем, валюта, масса. В единице измерения "Масса" базовой единицей можно считать килограмм. Все значения атрибутов в граммах, центнерах, тоннах при поиске записей будут конвертироваться в килограммы.
- Задача¶
Заявка на внесение изменений в данные. Представляет собой шаг бизнес-процесса и создается автоматически (например, при публикации черновика записи). Запуск бизнес-процесса создает столько задач, сколько предусмотрено шагов в процессе.
Пример: задача на согласование записи руководителем группы операторов данных.
- Запись¶
Описание объекта и его характеристик. Характеристики объекта описываются атрибутами.
Запись представляет собой данные, размещенные в информационной структуре (в реестре/справочнике). Может быть либо исходной, либо эталонной.
Пример: в реестре "Клиенты" записи будут содержать всю информацию о заказчиках, их реквизиты, контакты и т.п.
- Иерархический справочник¶
Объект модели, данные в котором содержатся в виде иерархического дерева записей, имеющих определенный набор атрибутов. Данные в справочнике меняются редко и имеют справочный характер. Справочник не поддерживает задание связей.
Пример: справочник общероссийских классификаторов
- Информационная система¶
Совокупность технических единиц, позволяющих получать метаинформацию из нескольких систем одного и того же источника данных.
- Источник данных¶
Сторонние информационные системы, данные из которых направляются в систему. Каждый источник данных имеет свой уровень доверия (вес), что решает конфликты в данных.
Пример: система-источник с данными из CRM имеет вес 80; системный источник данных имеет вес 100.
- Исходная запись¶
Запись, которая может быть недостоверной. Такая запись будет подвергаться обработке правилами данных, функциями обогащения данных, ручной проверке данных операторами и т.п. Из одной или нескольких исходных записей может быть сформирована эталонная запись.
- Исходящая связь¶
Запись, из которой выходит связь (исходная точка связи).
- Качество данных¶
Уровень пригодности данных для бизнеса: показатель, насколько данные ошибочны, какой уровень разночтений, противоречий в данных и т.д.
- Комплексный атрибут¶
Вид атрибута, который может содержать в себе несколько атрибутов. При создании комплексного атрибута выбирается вложенный объект, который, в свою очередь, содержит в себе ряд простых атрибутов. С точки зрения записи, комплексный атрибут представляет собой отдельную группу атрибутов. В записи можно создать несколько наборов значений комплексного атрибута (например, несколько наборов документов). Каждый такой набор документов является экземпляром комплексного атрибута.
Пример: атрибут "Документы", который содержит в себе атрибуты "Паспорт", "Снилс", "ИНН", "Свидетельство о рождении" и пр.
- Консолидация записи¶
Объединение (merge) нескольких записей в единую эталонную запись по определенным правилам. Процесс объединения записей, помеченных как дубликаты (т.е. объединенных в кластер дубликатов). При консолидации записей определяется запись-победитель, именно ее EtalonID присваивается записи, являющейся результатом консолидации.
- Массив-атрибут¶
То же, что простой атрибут. Отличается тем, что массив-атрибут поддерживает ввод нескольких значений атрибута.
- Метка безопасности¶
Параметр безопасности ограничивает доступ пользователя (роли пользователей) к отдельным атрибутам записей реестра/справочника.
Пример: метка безопасности скрывает от определенной роли пользователей атрибуты с персональными данными клиентов.
- Модель данных¶
Полное описание. Информационная структура данных, которая указывает какие данные в каком виде, и в каком месте будут храниться. В широком смысле модель состоит из объектов: реестров и справочников. Также к модели данных как информационной структуре относятся источники данных, единицы измерения и перечисления. При загрузке данных из других систем в Юниверс MDM все данные укладываются в структуру данных.
Краткое описание. Описание структуры данных, содержащее в себе реестры/справочники, а также единицы измерения, перечисления и источники данных.
- Обогащение данных¶
Изменение данных по определенным правилам в ходе работы правил качества. Обогащение призвано модифицировать данные таким образом, чтобы они были заполнены унифицированно, либо дополнялись новой информацией.
Пример: для реестра "Паспорт покупателя" формирование значения атрибута "Покупатель" формируется из значений атрибутов "Имя покупателя", "Адрес доставки" и "Контакты" реестра "Клиенты".
- Ошибка качества данных¶
Сообщение о том, что данные не соответствуют правилу качества. Ошибка может содержать сообщение об ошибке, уровень серьезности ошибки и т.д.
Пример: неверно заполнен формат даты или атрибут записи оказался пустым.
- Перечисление¶
Набор возможных вариантов значения атрибута.
Пример: атрибут "Статус заказа" выбирает одно из значений: ждет оплаты, в процессе, доставляется и т.п.
- Период актуальности¶
Промежуток времени, в течение которого та или иная версия Записи является достоверной. При наличии нескольких периодов запись актуальна в тот период, который попадает на текущую дату.
Пример: версия записи с акционной ценой на товар актуальна только в период с 26.01.2010 по 31.03.2010.
- Правило качества¶
Правило, которому должны соответствовать данные. Правило качество содержит в себе функцию обработки данных и режим работы. Если данные при создании или изменении не соответствуют правилу качества, то создается ошибка качества данных.
Пример: проверка контрольной суммы серийного номера, проверка регистра текста, автоматическое удаление лишних пробелов.
- Простой атрибут¶
Вид атрибута, который задает один атрибут определенного типа (см. Атрибут).
- Расконсолидация¶
Разъединение или отсоединение (unmerge) записей.
- Реестр¶
Объект модели данных, который содержит данные в виде записей с набором атрибутов. Данные в реестре могут меняться или дополняться со временем. Реестр создает сложные структуры атрибутов и поддерживает задание связей с другими реестрами/справочниками.
Примеры: "Зоны доставки", "Офисная техника", "Клиенты".
- Связь¶
Отношения между записями в разных реестрах/справочниках. Связи могут быть разных типов.
Пример: атрибут "Производитель" реестра "Товар" имеет связь с атрибутом "Название страны" справочника "Страны".
- Согласование¶
Процесс подтверждения или отклонения изменений, внесенных в данные. Согласование производится в задаче.
- Справочник¶
Объект модели данных, который содержит данные в виде записей с набором атрибутов. Данные в справочнике меняются редко и имеют справочный характер. Справочник не поддерживает задание связей.
Пример: словарь терминов, производственный стандарт, нормативы на изделие.
- Функция обработки данных¶
Действие, или последовательность действий, которое производится с данными. Функции используются в правилах качества и либо проверяют входящие значения, либо модифицируют их.
Пример: сложение 2 чисел, склеивание 2 значений атрибутов, проверка заполненности атрибута.
- Черновик записи¶
Специальный режим работы с моделью данных, предоставляющий среду для безопасного редактирования записи. Все вносимые изменения содержатся в черновике для последующей публикации. При этом черновики не влияют друг на друга, и не влияют на опубликованную модель данных до момента публикации. Черновики управляются модулем черновиков. Каждый черновик хранится в базе данных в сериализованном виде.
- Черновик модели данных¶
Специальный режим работы с моделью данных, предоставляющий среду для безопасного изменения реестров / справочников / вложенных объектов, а также их частей: свойств, атрибутов, связей, консолидации, классификации. Все вносимые изменения содержатся в черновике для последующей публикации. При этом черновики не влияют друг на друга, и не влияют на опубликованную модель данных до момента публикации. Черновики управляются модулем черновиков. Каждый черновик хранится в базе данных в сериализованном виде.
- Экземпляр бизнес-процесса¶
Копия бизнес-процесса, которая создается при инициации изменений. Например, если бизнес-процесс настроен на реестр "Производители", то при попытке оператора отредактировать запись этого реестра будет создан экземпляр бизнес-процесса, в результате которого будет запущена процедура согласования изменений в записи.
Пример: бизнес-процесс трехэтапного согласования записи "Закупка песка" для реестра "Закупки сырья".
- Экземпляр комплексного атрибута¶
Экземпляр создается при заполнении записи реестра. В записи комплексный атрибут представляет собой имя группы и набор атрибутов. Каждый заполненный набор атрибутов является экземпляром. При настройке модели данных можно указать минимум и максимум возможных экземпляров для комплексного атрибута. Также при настройке модели в свойстве "Ключевой атрибут" можно указать способ получения идентификаторов экземпляров. Идентификатор позволяет точно указывать требуемый экземпляр комплексного атрибута: это используется в задачах интеграции системы.
- Эталонная запись¶
Запись, которая может считаться актуальной и не содержащей ошибок, разночтений и т.д. Обычно эталонная запись может быть получена путем ее проверки правилами качества данных, объединения с потенциальными дубликатами, получением данных из достоверных систем-источников и т.д.
Эталонная запись также может называться "Золотой записью".