Knowledge Discovery in Database – (Extração de conhecimento)

Knowledge Discovery in Database – (Extração de conhecimento).

Por Fernando Rebouças

A sigla KDD significa “Knowledge Discovery in Database” , referente à extração de conhecimento , um processo de extração de informações provinda de base de dados. As informações extraídas possuem uma relação de interesse por assunto e de validade por cada dado extraído.

Nos anos 80, esse conjunto de processos surgiu para dar vazão ao trabalho sobre o volume de bases de dados que se expandiam exponencialmente, sendo o necessário para automatizar a exploração de cada base de dado e reconhecimento de padrões de modelagem de informação.

Esse tipo de extração segue etapas, cada etapa gera um conjunto de conhecimentos , de informação de difícil detecção em métodos mais lentos ou tradicionais de leitura e análise. Refere-se às informações de grande valor para uma tomada de decisão;

A extração de conhecimento, além das informações empíricas, possui a capacidade de detectar e colher informação mais profundas e “escondidas” entre os bancos de dados. Na prática, se assemelha ao conceito do data mining (mineração de dados), tema já abordado em outro texto.

O Knowledge Discovery in Database segue uma série de etapas planejadas em sequencia, havendo a possibilidade de retorno às etapas já executadas que apresentaram descobertas de informações finalizadas ou ausentes. Busca-se uma informação de grande importância que, sobretudo, sirva para a decisão sobre um determinado projeto e ação.

O KDD está implementado ao Sistema de apoio à decisão, cuja sigla é SAD. Está envolvido com a tecnologia da informação, pois os bancos de dados apresentam depósitos de conhecimento potencial que podem revelar vários níveis de relações e regras específicas sobre determinado assunto e hábito.

O KDD é uma extração de descoberta de conhecimento que em seu processo segue fases específicas:

– Definição do problema;

– Seleção dos dados;

– Limpeza dos dados;

– Pré-processamento dos dados;

– Codificação dos dados;

– Enriquecimento dos dados;

– Mineração dos dados (Data Mining);

– Interpretação dos dados.

As tarefas de KDD são:

– Regras de Associação;

– Classificação;

– Clustering.

Cada tarefa são dependentes à ação e interesse do usuário, pois cada tarefa é responsável por uma informação específica que refere-se a algoritmo diferente para cada tipo de informação. As principais tecnologias usadas no KDD são a de Organização de dados (data warehousing), Distribuição de Banco de Dados, Sistemas especialistas, Redes neurais, e Interfaces.

Entre o KDD e os Sistemas de Informação, há uma importante relação de utilização. Os Sistemas de Informação são compostos por conjunto de dados relevantes e disponíveis, cada dado provém de uma fonte de dados armazenada em memória permanente. A extração do KDD seleciona e processa cada dado para identificar padrões novos, sua precisão e modelá-los.

Referências:

http://pt.wikipedia.org/wiki/Extra%C3%A7%C3%A3o_de_conhecimento

www.heliorocha.com.br/graduacao/sisinfo/…/TEI/AulaKDD.pdf

http://www.dct.ufms.br/~mzanusso/Data_Mining.htm

 

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *