
Estado da Arte e Justificativas
Com a grande utilização de sistemas de bancos
de dados e a diversidade das aplicações, cresce a necessidade
de se permitir o acesso integrado a informações distribuídas,
de forma heterogênea, autônoma e transparente ao usuário.
Faz-se necessário, portanto, prover um ambiente de informação
aberto e integrado, buscando-se promover a interoperabilidade dos
sistemas envolvidos. Essa interoperabilidade, entretanto, ainda
é um problema que tem desafiado empresas e universidades
[vonPaumgartten94]. No sentido de permitir a comunição destes
sistemas, muitas pesquisas vêm sendo desenvolvidas nas áreas de
banco de dados heterogêneos e interoperabilidade de sistemas
[Kim95]. Estas pesquisas são principalmente direcionadas à
definição do modelo de dados de referência utilizado, à
definição do esquema global, à definição de esquemas de
dependências no caso da não utilização de esquemas globais
[Rusikiewick91], ao controle de acesso e atualização
concorrente dos dados, à otimização de consultas, à gerência
de transações [daSilva95] e à definição de uma interface
inteligente e uniforme [Sutcliffe95].
As pesquisas na área de Sistemas de Banco de
Dados Distribuídos e Heterogêneos (SBDDH) têm focalizado
principalmente a solução de conflitos causados pela autonomia
dos bancos de dados componentes. Embora não haja um consenso
entre pesquisadores, na literatura podem ser apontadas duas
estratégias clássicas para integração de bancos de dados:
No enfoque de acoplamento forte os conflitos
entre sistemas de banco de dados múltiplos são reconciliados a
priori em um ou mais esquemas (federados) compartilhados.
Neste enfoque, os usuários somente podem interagir com um ou
mais esquemas federados que intermedia o acesso para os bancos de
dados componentes. Multibase [Landers82] é um dos sistemas mais
antigos que adotam esta estratégia. Algumas implementações
mais recentes propõem a adoção de um modelo orientado a
objetos como uma base para integração [Bukhres92,Shan95]]. Este
enfoque permite que os usuários possam acessar os dados sem
tomar conhecimento de como estes estão distribuídos, deixando
porém o usuário com pouca liberdade para escolher que bancos de
dados devem ser acessados e como os dados devem ser
transformados. Outra desvantagem deste enfoque é que mudanças
no esquema compartilhado são muito difíceis de serem
realizadas.
No enfoque de acoplamento fraco
[Litwin87,Litwin88] os usuários interagem com os bancos de dados
componentes diretamente. Neste caso, a interoperabilidade
semântica é feita com o suporte de uma linguagem de
manipulação de banco de dados múltiplos, rica o suficiente
para resolver conflitos. A vantagem deste enfoque é que não
requer uma pré-integração e permite aos usuários acesso
irrestrito para todas as fontes de informações disponíveis.
Porém, este enfoque delega para o usuário a responsabilidade de
entender as diferenças semânticas, o que não é realístico
dado o grande número de fontes de dados disponíveis atualmente.
Mais recentemente, um novo enfoque para
integração usando a abordagem de representação de
conhecimento tem sido sugerido [Arens92, Collet91]. Neste
enfoque, a integração é alcançada através da construção de
um modelo semântico global que unifica as diversas
representações e interpretações nos bancos de dados
componentes. Esta abordagem difere da estratégia do sistema de
esquema global no sentido de que a riqueza da linguagem de
representação permite que sejam representados não só os
detalhes dos esquemas, mas também a semântica por trás destes.
As estratégias de integração discutidas
acima só fornecem um suporte satisfatório para sistemas
pequenos e estáticos [Goh94]. O tipo de aplicação que o FLASH
se propõe a estudar, por outro lado, impõe problemas de
heterogeneidade, escalonabilidade e evolução, que são
característicos de SBDDH de grande escala em ambiente dinâmico.
É nesta linha de pesquisa que o grupo de banco de dados pretende
atuar.
2. Objetivos
- Instalar e integrar bases de dados
utilizando SGBDs distintos (O2, DB2, Informix, Oracle,
etc);
- Integrar esquemas conceituais e lógicos
considerando os enfoques de banco de dados distribuídos
federados e multi-banco de dados;
- Definir um modelo de referência;
- Desenvolver interfaces inteligentes
através de sistemas multi-agentes;
- Implementar aplicações de banco de dados
distribuídos heterogêneos;
- Acompanhar as iniciativas internacionais
no desenvolvimento de padrões de interoperabilidade
entre sistemas;
- Pesquisar a implementação de sistemas de
informação distribuídos via Internet, possivelmente
utilizando a World Wide Web (WWW).
3. Originalidade
A integração de sistemas relacionais e
orientados a objeto não tem sido abordada de forma sistemática.
Estudando este problema, o FLASH vai contribuir com soluções
originais na área de integração de SGBDs heterogêneos. A
integração de SGBDs heterogêneos tem se concentrado em
sistemas centralizados. O estudo de SGBDs distribuídos é
recente e mais um ponto original do FLASH.
4. Impacto Econômico/Social e Riscos
Tecnológicos
O projeto de Sistemas de Gerenciamento de
Banco de Dados Distribuídos e Heterogêneos tem uma
relevância destacada para as empresas e indústrias que possuem
um parque computacional heterogêneo a nível de máquinas e
software. No momento atual, constata-se através dos diferentes
processos de atualização e evolução tecnológica, uma grande
preocupação das empresas em garantir os investimentos
realizados (software e hardware) e ao mesmo tempo migrar para
novas plataformas. Neste processo, a maior dificuldade é como
conviver de forma eficiente com um ambiente, em geral,
heterogêneo.
Algumas questões práticas são colocadas
pelas empresas que não encontram soluções prontas em livros,
nem em fornecedores no mercado. Dentre estas questões podemos
citar:
- Como, a partir de novas aplicações que
justificassem o uso de SGBDOO, teríamos um diálogo com
os SGBD relacionais implantados?
- Como garantir uma boa integração entre
as bases de dados já existentes em SGBD relacionais e os
novos SGBD orientados a objetos desenvolvidos?
- Como integrar esquemas conceituais e
lógicos em ambientes heterogêneos?
- Como garantir ao usuário a transparência
na utilização de SGBD, sistemas operacionais e redes de
computadores distintos?
Os experimentos de integração de SGBDs
heterogêneos e distribuídos no FLASH vão buscar soluções
para várias das questões acima. Os resultados do projetos
terão impacto nas empresas e organizações onde tais questões
são parte do dia-a-dia da administração e integração de
sistemas.
5. Atividades de Treinamento e Intercâmbio
Estão previstas visitas científicas dos
pesquisadors às outras instituições participantes para
acompanhamento dos experimentos realizados pelas equipes
envolvidas. A participação dos pesquisadores em congressos,
simpósios e workshops nacionais (SBBD, SEMISH,etc) e
internacionais (VLDB e conferências específicas em BD
heterogêneos) é de fundamental relevância. É importante
também que pesquisadores internacionais que desenvolvam
pesquisas correlatas visitem as instituições participando dos
experimentos ou ministrando cursos avançados de interesse da
área.