Autores

5712
Gustavo de Oliveira Fernandes
2626,299
5713
2626,299

Informações:

Publicações do PESC

Título
Cálculo Da Similaridade Entre Planilhas Eletrônicas
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
25/9/2014
Resumo

A maior parte dos usuários usa planilhas eletrônicas como ferramenta para armazenamento de dados. Mas em muitas ocasiões não são seguidos em um padrão e nem uma regra de formatação de dados bem definida. Além disso, o compartilhamento desordenado de planilhas cria o grave problema de redundância e de falta de confiabilidade dos dados nelas armazenados. Tais comportamentos podem acabar gerando conclusões equivocadas em estudos, indicando informações mal fundamentadas para decisões de negócio, ocasionando perdas financeiras às empresas ou, simplesmente, atrapalhando a produtividade das pessoas. Este trabalho lista os problemas ocasionados pela má utilização de planilhas de dados e aponta os impactos decorrentes deles, apresenta métricas de comparação das planilhas, exemplifica como essas métricas podem auxiliar no controle de erros das planilhas e, finalmente, propõe uma arquitetura de migração de planilhas para bases de dados relacionais.

Abstract

Most part of computer end-users use electronic spreadsheets as a data storage tool. However, most commonly, no data pattern nor formatting template are used. Besides disorderly replication of spreadsheet files leads to a serious redundancy and lack of data reliability problem. Such conducts may cause misguided conclusion in academic researches, or improper business decisions based on defective data (which may cause huge negative financials results), or simply affecting people productivity. This research lists the problems caused by spreadsheet software misuse and points out some of their impacts, presents spreadsheet comparison metrics, exemplifies how these metrics may avoid spreadsheets error based data and, finally, proposes a software architecture to transform spreadsheet data into relational databases.

Topo