Пользовательские функции очистки


Реализация своей функции

Ниже приведен пример простой cleanse функции, которая принимает имя пользователя из INPUT_PORT_1 и выводит полное имя пользователя в OUTPUT_PORT_1.

В примере отображается:

  • Самостоятельная конфигурация (configure() call);

  • Добавление полей (userService, module, two configuration variables);

  • Использование входных/выходных параметров

package tests;

import java.util.Objects;

import org.springframework.beans.factory.annotation.Autowired;
import org.unidata.mdm.core.dto.UserWithPasswordDTO;
import org.unidata.mdm.core.service.UserService;
import org.unidata.mdm.data.configuration.DataConfigurationConstants;
import org.unidata.mdm.data.module.DataModule;
import org.unidata.mdm.dq.core.context.CleanseFunctionContext;
import org.unidata.mdm.dq.core.dto.CleanseFunctionResult;
import org.unidata.mdm.dq.core.type.cleanse.CleanseFunction;
import org.unidata.mdm.dq.core.type.cleanse.CleanseFunctionConfiguration;
import org.unidata.mdm.dq.core.type.cleanse.CleanseFunctionExecutionScope;
import org.unidata.mdm.dq.core.type.cleanse.CleanseFunctionInputParam;
import org.unidata.mdm.dq.core.type.cleanse.CleanseFunctionOutputParam;
import org.unidata.mdm.dq.core.type.cleanse.CleanseFunctionPortFilteringMode;
import org.unidata.mdm.dq.core.type.cleanse.CleanseFunctionPortInputType;
import org.unidata.mdm.dq.core.type.cleanse.CleanseFunctionPortValueType;
import org.unidata.mdm.dq.core.type.constant.CleanseConstants;
import org.unidata.mdm.system.type.annotation.ConfigurationRef;
import org.unidata.mdm.system.type.annotation.ModuleRef;
import org.unidata.mdm.system.type.configuration.ConfigurationValue;
import org.unidata.mdm.system.type.module.Module;

/**
* @author Mikhail Mikhailov on Feb 16, 2021
*/
public class TestCleanseFunction implements CleanseFunction {

    @Autowired
    private UserService userService;

    @ModuleRef(DataModule.MODULE_ID)
    private Module dataModule;

    @ConfigurationRef(DataConfigurationConstants.PROPERTY_DATA_NODES)
    private ConfigurationValue<String> nodes;

    @ConfigurationRef(DataConfigurationConstants.PROPERTY_DATA_SHARDS)
    private ConfigurationValue<Long> shards;

    /**
    * This function configuration.
    */
    private static final CleanseFunctionConfiguration CONFIGURATION
        = CleanseFunctionConfiguration.configuration()
            .supports(CleanseFunctionExecutionScope.LOCAL)
            .input(CleanseFunctionConfiguration.port()
                    .name(CleanseConstants.INPUT_PORT_1)
                    .displayName("User name")
                    .description("User name to resolve")
                    .filteringMode(CleanseFunctionPortFilteringMode.MODE_ONCE)
                    .inputTypes(CleanseFunctionPortInputType.SIMPLE)
                    .valueTypes(CleanseFunctionPortValueType.STRING)
                    .required(true)
                    .build())
            .output(CleanseFunctionConfiguration.port()
                    .name(CleanseConstants.OUTPUT_PORT_1)
                    .displayName("Full name")
                    .description("Resolved full name or null")
                    .filteringMode(CleanseFunctionPortFilteringMode.MODE_ALL)
                    .inputTypes(CleanseFunctionPortInputType.SIMPLE)
                    .valueTypes(CleanseFunctionPortValueType.STRING)
                    .required(true)
                    .build())
            .build();

    /**
    * Constructor.
    */
    public TestCleanseFunction() {
        super();
    }

    /**
    * {@inheritDoc}
    */
    @Override
    public CleanseFunctionConfiguration configure() {
        return CONFIGURATION;
    }

    /**
    * {@inheritDoc}
    */
    @Override
    public CleanseFunctionResult execute(CleanseFunctionContext ctx) {

        CleanseFunctionResult output = new CleanseFunctionResult();
        CleanseFunctionInputParam param1 = ctx.getInputParam(CleanseConstants.INPUT_PORT_1);

        String result = null;
        if (param1 != null && !param1.isEmpty() && param1.isSingleton()) {

            String input = param1.toSingletonValue();
            UserWithPasswordDTO uwp = userService.getUserByName(input);
            if (Objects.nonNull(uwp)) {
                result = uwp.getFullName();
            }
        }

        output.putOutputParam(CleanseFunctionOutputParam.of(CleanseConstants.OUTPUT_PORT_1, result));

        return output;
    }
}

Пример пометки атрибута с ошибкой при валидации

Модуль: org.unidata.mdm.dq.core

Пример добавления атрибута с ошибкой в отчет

public class SomeValidationFunction extends AbstractBasicCleanseFunction {
    /**
    * Executes a cleanse function in the given context.
    */
    @Override
    public CleanseFunctionResult execute(CleanseFunctionContext ctx) {

        //Создаем результат выполнения функции валидации
        CleanseFunctionResult output = new CleanseFunctionResult();

        //Достаем параметр из порта 1
        CleanseFunctionInputParam param1 = ctx.getInputParam(CleanseConstants.INPUT_PORT_1);

        //Тут, например, проверили, что есть такой параметр и туда пришел атрибут
        if (param1 == null || param1.isEmpty()) {
            //Такого порта нет или атрибут туда не пришел - отправили в результат false
            output.putOutputParam(CleanseFunctionOutputParam.of(CleanseConstants.OUTPUT_PORT_1, Boolean.FALSE));
        } else {

            boolean[] isValid;
            for (int i = 0; i < param1.getAttributes().size(); i++) {

                //Достаем атрибут из порта
                Attribute attribute = param1.getAttributes().get(i);

                //Проверка...

                //Если не прошла валидацию, то добавляем в отчет атрибут
                if (!isValid[i]) {
                    output.addSpot(new DataQualitySpot(param1, attribute.toLocalPath(), attribute));//порт, путь к атрибуту, само значение атрибута
                }
            }

            //Отправили в результат итог
            output.putOutputParam(CleanseFunctionOutputParam.of(CleanseConstants.OUTPUT_PORT_1, BooleanUtils.and(isValid)));
        }

        return output;
    }
}

Результат выполнения функции валидации

org.unidata.mdm.dq.core.dto.CleanseFunctionResult

Указаны только сигнатуры методов, отвечающих за указание атрибута с ошибкой

/**
  * CF execution result.
  * Результат выполнения функции валидации
  */
  public class CleanseFunctionResult {
      /**
      * Gets failed paths collection at whole.
      * Возвращает весь список путей к атрибутам, в которых случилась ошибка валидации
      *
      * @return failed paths collection
      */
      public List<DataQualitySpot> getSpots();
      /**
      * Adds a failure/problem spot as object.
      * Добавляет в список новое место с ошибкой валидации
      *
      * @param failure the failure to add
      */
      public void addSpot(DataQualitySpot failure);
      /**
      * Adds failure/problem spots to the spots collection.
      * Добавляет список мест с ошибкой валидации к списку результата
      *
      * @param failures the spots to add
      */
      public void addSpots(Collection<DataQualitySpot> failures);
      /**
      * Returns true, if this result contains failed validation paths.
      * Возвращает true, если результат содержит места с ошибкой валидации
      *
      * @return true, if this result contains failed validation paths.
      */
      public boolean hasSpots();
}

Отметка об атрибуте с ошибкой

org.unidata.mdm.dq.core.type.io.DataQualitySpot

Указаны только методы для создания объекта ошибки в функции валидации

/**
  * Failure/problem spot - not found/missing/malformed/invalid input attributes.
  * Место с проблемой/ошибкой - входящий атрибут не найден/отсутствует/некорректный/невалидный
  */
  public class DataQualitySpot {
      /**
      * The input.
      * Входящий параметр функции валидации
      */
      private final CleanseFunctionInputParam input;
      /**
      * Local path in the record, being examined.
      * Локальный путь к атрибуту в записи, в котором возникла ошибка функции валидации
      */
      private final String path;
      /**
      * The value. May be null (for missing attributes).
      * Значение атрибута, может быть null в случае отсутствия проверяемого атрибута
      */
      private final Attribute attribute;
      /**
      * For spots, denoting incomplete paths.
      * Для отображения неполных путей. Используется, когда нет атрибута
      * Например, сюда можно комплексный атрибут, внутри которого произошла ошибка.
      * Или саму запись, если нет более конкретного атрибута
      */
      private final DataRecord container;
      /**
      * Constructor.
      * @param path the path
      */
      public DataQualitySpot(String path);
      /**
      * Constructor.
      * @param input the input param
      * @param path the path
      * @param attribute the attribute
      */
      public DataQualitySpot(CleanseFunctionInputParam input, String path, Attribute attribute);
      /**
      * Constructor.
      * @param input the input param
      * @param path the path
      * @param container the container
      */
      public DataQualitySpot(CleanseFunctionInputParam input, String path, DataRecord container);
      /**
      * {@inheritDoc}
      */
      @Override
      public String toString() {
          return new StringBuilder()
                  .append(input.getPortName())
                  .append(" > ")
                  .append(path)
                  .append(" = ")
                  .append(attribute)
                  .toString();
      }
}