Informações:

Publicações do PESC

Título
Identificação de Contextos Lingüísticos em Linguagens Desconhecidas Geradas por Cifras de Blocos
Linha de pesquisa
Inteligência Artificial
Tipo de publicação
Tese de Doutorado
Número de registro
Data da defesa
10/10/2011
Resumo

Este trabalho define e demonstra uma metodologia para identificar n-cifras de blocos. O trabalho demonstra também que tal metodologia pode ser utilizada para classificar e identificar criptogramas a partir do modo de operação e da chave criptográfica. A metodologia é baseada em técnicas de Recuperação de Informações e demonstra que o sucesso na identificação se deve à correta separação dos criptogramas em grupos, a qual é possível devido à existência de propriedades intrínsecas nos modelos matemáticos dessas cifras, que criam contexto lingüístico (ou assinatura) nos criptogramas. Tal contexto lingüístico pode ser evidenciado a partir de um identificador de contexto. Logo, os criptogramas podem ser tratados como textos claros escritos em uma linguagem desconhecida, onde cada linguagem é determinada por uma combinação qualquer de parâmetros criptográficos. Assim, qualquer técnica capaz de classificar textos claros, levando em conta a distribuição estatística dos elementos do conjunto léxico (ou conjuntos léxicos) usado por tais textos, pode também classificar criptogramas.
São formulados resultados teóricos de que as cifras de blocos geram linguagens desconhecidas e que se pode identificar estas cifras (ou uma combinanção de parâmetros criptográficos) a partir de identificadores de contexto lingüístico contidos nestas linguagens. Os resultados teóricos apresentados são válidos para qualquer linguagem desconhecida. Tal metodologia é considerada, por analogia, como um “ataque de distinção”.

Abstract

This thesis defines and demonstrates a methodology to identify N blocks ciphers. The work also demonstrates that this methodology can be used to classify and identify cryptograms from the operation mode and the encryption key. The methodology is based on techniques of Information Retrieval and demonstrates that success in identifying is due to the correct clustering of cryptograms in groups, which is possible due to the existence of intrinsic properties in mathematical models of these ciphers that create linguistic context (or signature) in cryptograms. Such linguistic context may be evidenced from a context identifier. Therefore, the cryptogram can be treated as plain texts written in an unknown language, where each language is determined by any combination of cryptographic parameters. Thus, any technique able to categorize plain texts, taking into account the statistical distribution of elements in the lexical set (lexical sets) used by such texts, can also categorize cryptograms.
Theoretical results are formulated that block ciphers generate unknown languages and which can be identified these ciphers (or a combination of cryptographic parameters) from the linguistic context identifiers contained in these languages. The theoretical results presented are valid for any unknown language. This methodology is considered, by analogy, as a "distinguishing attack."

Topo