Estado da Arte e Justificativas

Com a grande utilização de sistemas de bancos de dados e a diversidade das aplicações, cresce a necessidade de se permitir o acesso integrado a informações distribuídas, de forma heterogênea, autônoma e transparente ao usuário. Faz-se necessário, portanto, prover um ambiente de informação aberto e integrado, buscando-se promover a interoperabilidade dos sistemas envolvidos. Essa interoperabilidade, entretanto, ainda é um problema que tem desafiado empresas e universidades [vonPaumgartten94]. No sentido de permitir a comunição destes sistemas, muitas pesquisas vêm sendo desenvolvidas nas áreas de banco de dados heterogêneos e interoperabilidade de sistemas [Kim95]. Estas pesquisas são principalmente direcionadas à definição do modelo de dados de referência utilizado, à definição do esquema global, à definição de esquemas de dependências no caso da não utilização de esquemas globais [Rusikiewick91], ao controle de acesso e atualização concorrente dos dados, à otimização de consultas, à gerência de transações [daSilva95] e à definição de uma interface inteligente e uniforme [Sutcliffe95].

As pesquisas na área de Sistemas de Banco de Dados Distribuídos e Heterogêneos (SBDDH) têm focalizado principalmente a solução de conflitos causados pela autonomia dos bancos de dados componentes. Embora não haja um consenso entre pesquisadores, na literatura podem ser apontadas duas estratégias clássicas para integração de bancos de dados:

No enfoque de acoplamento forte os conflitos entre sistemas de banco de dados múltiplos são reconciliados a priori em um ou mais esquemas (federados) compartilhados. Neste enfoque, os usuários somente podem interagir com um ou mais esquemas federados que intermedia o acesso para os bancos de dados componentes. Multibase [Landers82] é um dos sistemas mais antigos que adotam esta estratégia. Algumas implementações mais recentes propõem a adoção de um modelo orientado a objetos como uma base para integração [Bukhres92,Shan95]]. Este enfoque permite que os usuários possam acessar os dados sem tomar conhecimento de como estes estão distribuídos, deixando porém o usuário com pouca liberdade para escolher que bancos de dados devem ser acessados e como os dados devem ser transformados. Outra desvantagem deste enfoque é que mudanças no esquema compartilhado são muito difíceis de serem realizadas.

No enfoque de acoplamento fraco [Litwin87,Litwin88] os usuários interagem com os bancos de dados componentes diretamente. Neste caso, a interoperabilidade semântica é feita com o suporte de uma linguagem de manipulação de banco de dados múltiplos, rica o suficiente para resolver conflitos. A vantagem deste enfoque é que não requer uma pré-integração e permite aos usuários acesso irrestrito para todas as fontes de informações disponíveis. Porém, este enfoque delega para o usuário a responsabilidade de entender as diferenças semânticas, o que não é realístico dado o grande número de fontes de dados disponíveis atualmente.

Mais recentemente, um novo enfoque para integração usando a abordagem de representação de conhecimento tem sido sugerido [Arens92, Collet91]. Neste enfoque, a integração é alcançada através da construção de um modelo semântico global que unifica as diversas representações e interpretações nos bancos de dados componentes. Esta abordagem difere da estratégia do sistema de esquema global no sentido de que a riqueza da linguagem de representação permite que sejam representados não só os detalhes dos esquemas, mas também a semântica por trás destes.

As estratégias de integração discutidas acima só fornecem um suporte satisfatório para sistemas pequenos e estáticos [Goh94]. O tipo de aplicação que o FLASH se propõe a estudar, por outro lado, impõe problemas de heterogeneidade, escalonabilidade e evolução, que são característicos de SBDDH de grande escala em ambiente dinâmico. É nesta linha de pesquisa que o grupo de banco de dados pretende atuar.


2. Objetivos

  • Instalar e integrar bases de dados utilizando SGBDs distintos (O2, DB2, Informix, Oracle, etc);
  • Integrar esquemas conceituais e lógicos considerando os enfoques de banco de dados distribuídos federados e multi-banco de dados;
  • Definir um modelo de referência;
  • Desenvolver interfaces inteligentes através de sistemas multi-agentes;
  • Implementar aplicações de banco de dados distribuídos heterogêneos;
  • Acompanhar as iniciativas internacionais no desenvolvimento de padrões de interoperabilidade entre sistemas;
  • Pesquisar a implementação de sistemas de informação distribuídos via Internet, possivelmente utilizando a World Wide Web (WWW).

3. Originalidade

A integração de sistemas relacionais e orientados a objeto não tem sido abordada de forma sistemática. Estudando este problema, o FLASH vai contribuir com soluções originais na área de integração de SGBDs heterogêneos. A integração de SGBDs heterogêneos tem se concentrado em sistemas centralizados. O estudo de SGBDs distribuídos é recente e mais um ponto original do FLASH.


4. Impacto Econômico/Social e Riscos Tecnológicos

O projeto de Sistemas de Gerenciamento de Banco de Dados Distribuídos e Heterogêneos tem uma relevância destacada para as empresas e indústrias que possuem um parque computacional heterogêneo a nível de máquinas e software. No momento atual, constata-se através dos diferentes processos de atualização e evolução tecnológica, uma grande preocupação das empresas em garantir os investimentos realizados (software e hardware) e ao mesmo tempo migrar para novas plataformas. Neste processo, a maior dificuldade é como conviver de forma eficiente com um ambiente, em geral, heterogêneo.

Algumas questões práticas são colocadas pelas empresas que não encontram soluções prontas em livros, nem em fornecedores no mercado. Dentre estas questões podemos citar:

  • Como, a partir de novas aplicações que justificassem o uso de SGBDOO, teríamos um diálogo com os SGBD relacionais implantados?
  • Como garantir uma boa integração entre as bases de dados já existentes em SGBD relacionais e os novos SGBD orientados a objetos desenvolvidos?
  • Como integrar esquemas conceituais e lógicos em ambientes heterogêneos?
  • Como garantir ao usuário a transparência na utilização de SGBD, sistemas operacionais e redes de computadores distintos?

Os experimentos de integração de SGBDs heterogêneos e distribuídos no FLASH vão buscar soluções para várias das questões acima. Os resultados do projetos terão impacto nas empresas e organizações onde tais questões são parte do dia-a-dia da administração e integração de sistemas.


5. Atividades de Treinamento e Intercâmbio

Estão previstas visitas científicas dos pesquisadors às outras instituições participantes para acompanhamento dos experimentos realizados pelas equipes envolvidas. A participação dos pesquisadores em congressos, simpósios e workshops nacionais (SBBD, SEMISH,etc) e internacionais (VLDB e conferências específicas em BD heterogêneos) é de fundamental relevância. É importante também que pesquisadores internacionais que desenvolvam pesquisas correlatas visitem as instituições participando dos experimentos ou ministrando cursos avançados de interesse da área.