Acervo, Rio de Janeiro, v. 35, n. 2, maio/ago. 2022

Organização do conhecimento em arquivos | Dossiê temático

Sistemas de organização do conhecimento no contexto da arquivologia

Aportes metodológicos para seu desenvolvimento

Knowledge organization systems in the archival science context: methodological contributions for their development / Sistemas de organización del conocimiento en el contexto del archivo: aportes metodológicos para sus desarrollos

Thiago Henrique Bragato Barros

Doutor em Ciência da Informação pela
Universidade Estadual Paulista Júlio de Mesquita Filho (Unesp). Professor adjunto do Departamento de Ciência da Informação e do Programa de Pós-Graduação em Ciência da Informação da Universidade Federal do Rio Grande do Sul (UFRGS), Brasil.

bragato.barros@ufrgs.br

Carine Melo Cogo Bastos

Mestra em Ciência da Informação pela UFRGS, Brasil.

carinecogo@yahoo.com.br

Adriana Carla Ribeiro dos Santos

Mestranda em Ciência da Informação pela Universidade Federal do Pará (UFPA), Brasil.

s.adrianacarla@yahoo.com.br

Resumo

Busca-se neste artigo refletir sobre os caminhos de construção de sistemas de organização do conhecimento no contexto da arquivologia, pensando essa relação como espaço de instrumentação e experimentação. Trabalha-se com taxonomias, tesauros e ontologias, e conclui-se que analisar as convergências entre os campos da organização do conhecimento e da arquivologia apresenta-se como terreno fértil para aprimorar a construção de instrumentos de representação e automatizar parcialmente os processos de acesso e uso.

Palavras-chave: sistemas de organização do conhecimento; arquivologia; tesauros; taxonomias; ontologias.

Abstract

This article seeks to work on the ways to build knowledge organization systems in the context of archival science, thinking this relationship as a space for instrumentation and experimentation. We work with taxonomies, thesaurus, and ontologies, and conclude that to analyze the convergences between the fields of knowledge organization and archival science presents a fertile ground to improve the construction of representational instruments and partially automatize the access and use processes.

Keywords: knowledge organization systems; archival science; thesaurus; taxonomies; ontologies.

Resumen

Este artículo busca trabajar los caminos de la construcción de sistemas de organización del conocimiento en el contexto de la archivística, pensando esa relación como espacios de instrumentación y experimentación. Trabajamos con las taxonomías, tesauros y ontologías, y concluimos que analizar las convergencias entre los campos de la organización del conocimiento y de la archivística presentase como terreno fértil para mejorar la construcción de instrumentos de representación y automatizar parcialmente los procesos de acceso y uso.

Palabras clave: sistemas de organización del conocimiento; archivística; tesauros; taxonomías; ontologías.

Introdução

Perspectivas tipicamente atreladas à organização e representação na realidade dos arquivos são cada vez mais presentes na literatura da área, especialmente a partir da década de 1990. Essa literatura é ainda mais significativa quando levamos em conta perspectivas epistemológicas. Destacamos aqui os estudos de Yakel (2003); Henttonen e Kettunen (2011); Henttonen (2012; 2015); Packalén e Henttonen (2016); Barros e Moraes (2012; 2013); Barros (2016); Barros e Gomes (2018); Barros e Sousa (2019); Guimarães e Tognoli (2015); Tognoli, Rodrigues e Guimarães (2019); Alencar e Cervantes (2019a, 2019b), para citar alguns. Os estudos mencionados trabalharam, em maior ou menor grau, aspectos da representação, organização do conhecimento, classificação, descrição, indexação, entre outros.

Assim, é possível perceber que são temáticas que têm se intensificado em produção e destaque. Por outro lado, a comunidade que trabalha com o assunto não é grande, e o que se percebe é que existe, na maioria dos casos, uma vinculação muito mais teórico-conceitual que aplicada. A abordagem mais aplicada deve possibilitar a experimentação e o uso de sistemas de organização do conhecimento (SOC) na ambiência dos arquivos. Textos como “Os processos de representação do conhecimento arquivístico: elementos históricos e conceituais da classificação e descrição”, de Barros e Tognoli (2015) e “Archival knowledge conceptual frameworks for recent terminology in the KO domain”, de Tognoli, Rodrigues e Guimarães (2019), sinalizam que a organização do conhecimento no contexto dos arquivos concentra-se fortemente ao redor do trabalho classificatório e descritivo, que são por si só processos que se relacionam com a gestão, preservação e acesso aos documentos arquivísticos. Acredita-se que esse seja o caminho já traçado até aqui, no entanto, compreende-se que a aplicação e criação de sistemas não deva ficar unicamente atrelada a essas atividades, uma vez que reduzem o processo a perspectivas mais procedimentais e a um passo a passo do que à construção de sistemas a partir de domínios específicos.

É importante sinalizar que, na realidade brasileira, como é perceptível pelos trabalhos elencados anteriormente, acreditamos que a aproximação da arquivologia com a ciência da informação, especialmente no ambiente da organização da informação e do conhecimento, tem privilegiado debates que abordam temáticas típicas da área de organização do conhecimento (SOC).

Buscamos no texto ora apresentado discutir, a partir das premissas de Zeng (2008), de outros trabalhos próprios e de outros autores, como podemos aplicar os tesauros, ontologias e taxonomias no contexto dos arquivos, compreendidos aqui como sistemas de organização do conhecimento complementares àqueles tradicionalmente desenvolvidos no contexto da arquivologia.

Organização do conhecimento e arquivologia: um relacionamento em consolidação

A organização do conhecimento enquanto campo tradicionalmente representa uma especialização para a ciência da informação, isto é, um palco de estudo institucionalizado social e cientificamente para discutir teorias e metodologias relacionadas a vários processos de representação e organização: “a organização do conhecimento [...] como um campo distinto, considerado hoje como uma subárea (ou com um link com a ciência da informação)” (Mazzocchi, 2018, tradução nossa).

Trata-se, portanto, de um campo que irá buscar estudar aspectos da construção de tesauros, vocabulários controlados, taxonomias, ontologias, ou seja, uma gama de instrumentos-processos que visam à busca e apropriação do conhecimento, tradicionalmente ligados à biblioteconomia e à ciência da informação.

Assim, os processos tradicionalmente vinculados à organização e representação do conhecimento, evidentemente, estão atrelados às bibliotecas e à informação para a ciência. Nesse sentido, os processos de leitura, análise e construção de linguagens especializadas estão, em sua maioria, relacionados a esse universo. Porém, conforme a própria trajetória da organização e representação do conhecimento, a maior preocupação é o conteúdo e sua representação – ainda que, no caso dos arquivos, o contexto seja o elemento primordial dessa organização.

O processo de construção dessa área pode ser fundamentado nestes autores: Cutter (1837-1903), Richardson (1860-1939), Sayers (1881-1960) e, também, Bliss (1870-1955), que usou o termo KO (knowledge organization) em dois importantes livros, The organization of knowledge and the system of the sciences, de 1929, e The organization of knowledge in libraries and the subject-approach to books, de 1933 (Mazzocchi, 2018), como destacamos em outros textos publicados sobre o tema (Barros; Laipelt, 2021; Barros; Sousa, 2019).

No universo de atuação da KO, de acordo com Hjørland (2008), dois grandes grupos de ferramentas-processos podem caracterizá-la. São eles: 1) processos de organização e representação do conhecimento: indexação, catalogação, análise de assunto, classificação; 2) sistemas de organização e representação do conhecimento gerados de/para esses processos. Sendo estes últimos os primordiais para a efetiva organização.

Tomando como base Mazzocchi (2018) e Hjørland (2008), percebe-se que os SOC são fundamentais para os processos de representação e recuperação, porém sua maior problemática se dá pelas mudanças rápidas que ocorrem nas comunidades de usuários dos sistemas. Essa difícil tarefa comum aos SOC (de construção, aplicação e uso) perpassa também a realidade dos arquivos. Tal movimento pode ser visto nos arquivos desde o século XIX, com a reordenação do arquivo nacional francês, visando ao rearranjo intelectual de seus fundos, até o desenvolvimento de sistemas de descrição/classificação em ambiente web, ou seja, todos os instrumentos de organização e representação preliminares e incompletos.

Em relação aos SOC, são por definição sistemas utilizados para um campo vasto de itens, dentre eles as ontologias, os cabeçalhos de assunto, os tesauros e os esquemas de classificação. Cada um deles tem uma função e um fundamento tecnológico distinto e é usado em uma variedade de agrupamentos sociais. Seu objetivo final é cumprir a missão da própria organização do conhecimento (OC): facilitar a recuperação e o acesso.

Já o relacionamento entre organização do conhecimento e arquivologia hoje se encontra plenamente em consolidação, tal é o fato da comunidade arquivística na organização do conhecimento ter discutido no passado recente, e continuar discutindo, premissas arquivísticas nos ambientes típicos da OC tradicional, citando aqui nominalmente a International Society for Knowledge Organization.

Acredita-se aqui, portanto, em uma OC integradora que busque contribuir para além de seu próprio campo de atuação, visando auxiliar na construção de melhores sistemas de organização do conhecimento no âmbito dos arquivos.

Para fins de síntese e esquematização, vamos discutir um esquema orginalmente apresentado por Zeng (2008), conforme Figura 1:


Figura 1 – Síntese das estruturas e funções dos SOC. Fonte: Zeng (2008)


O esquema apresentado pela autora tem um fundamento clássico dos SOC, sua escadaria semântica que vai dos menos estruturados (glossários e dicionários) para os mais (ontologias e tesauros), ou seja, quando falamos de SOC, estamos falando de uma gama bastante variada de esquemas, que possibilitam a recuperação e disseminação da informação.

No universo arquivístico, os sistemas são predominantemente hierárquicos, e poderíamos compreendê-los como sistemas de categorização (nível 4 na escadaria), que tradicionalmente visam diminuir a ambiguidade, controlar o vocabulário e estabelecer relacionamentos hierárquicos. Isso acontece em ambas as funções destacadas anteriormente com os espaços tradicionalmente analisados para aplicação de preceitos da OC (classificação e descrição).

No entanto, quando vamos para uma análise da literatura de Schellenberg (1956), Foscarini (2006) e Henttonen (2012; 2015), para citar apenas alguns autores, dos mais clássicos aos mais recentes, e quando vamos para as iniciativas nacionais como as canadenses e australianas, veem-se fundamentalmente o reducionismo e a pouca mobilidade, adaptabilidade e fundamento semântico nesse tipo de SOC, ou seja, na arquivologia pacificou-se uma perspectiva e pouco se avançou para além dela; pela própria Figura 1 apresentada anteriormente, vê-se sua limitação.

Nos estudos já destacados, especialmente no tocante à classificação, percebe-se a limitação dos planos de classificação tipicamente funcionais, um problema que, analisando-se a literatura de OC, fica evidente que é mais semântico que contextual, ou seja, a rigidez das relações semânticas dificulta seu uso por parte do usuário.

Em um primeiro momento, a falta de compreensão do instrumento acontecia no ambiente de documentos em papel. Pode-se perceber isso nos inúmeros estudos que visam adaptar planos de classificação concebidos no passado para documentos produzidos atualmente, como vemos em Schimdt e Pinto (2019), para citar apenas um estudo dentre tantos outros com essa premissa, ou seja, o problema veio dos sistemas tradicionais de classificação e permanecem nos híbridos e digitais.

Vejam, compreendemos que a hierarquia do ponto de vista classificatório no contexto arquivístico é fundamental, mas não deve ser a única perspectiva. A administração tornou-se cada vez mais decentralizada, e o grande acúmulo documental deixou de ser em mesas nas repartições, passando a acontecer em servidores e nuvens públicas ou empresariais.

Quando analisamos a complexidade da descrição arquivística, percebemos que seu maior problema se dá devido à subjetividade dos resumos-síntese que são construídos nos mais variados instrumentos, e que os pontos de acesso são muitas vezes puramente descritivos e não temáticos. Fazemos aqui duas perguntas retóricas: eles são, afinal, construídos para quem? Para os arquivistas ou para quem irá utilizá-los?

Voltando para a classificação, a aplicação da análise funcional para a construção de planos de classificação pode ter como resultado um sistema hierárquico, autorreferencial, que busca, sem ser nomeado como tal, controlar o vocabulário e estabelecer relações semânticas. Como a base é a organização em si (estatutos, regimentos, regulamentos, dispositivos legais), observamos traços ao que desde o célebre texto de Duranti (1997) chamamos de archival bond. O archival bond é fundamental do ponto de vista da concepção do sistema, ou seja, premissa essencial para construção do SOC, mas não tem como ser a única, pois vínculo arquivístico é parte do sistema, não sua única premissa.

Nessa perspectiva, uma classificação categoriza as funções da organização, mas seria totalmente incapaz de capturar os modos de uso dos documentos, ou mesmo como os diferentes setores de uma determinada administração irão nomeá-los.

Em consequência disso, como já destacamos em outros textos (Gomes et al., 2020; Barros, 2020), qualquer um que tenha que utilizar o esquema, mas não tenha participado da sua concepção, terá problemas para utilizá-lo, ou seja, será necessário antes de tudo compreender como a categorização foi feita, os termos que controlam suas entradas, para aí finalmente utilizar. Isso torna-se ainda mais grave quando percebemos o caráter primordial da classificação arquivística, como apontado por Sousa (2003 e 2022), ou seja, os erros cometidos na categorização tendem a se repetir ao longo do processo de gestão, preservação e uso.

Destacamos aqui os problemas de como tradicionalmente são elaborados os SOC em ambientes arquivísticos, ao mesmo tempo que sinalizamos considerar que mais do que discutir sobre o relacionamento entre organização do conhecimento e arquivologia, é necessário realizá-lo, no sentido de que existe uma urgência por categorizações mais bem documentadas (suas políticas e diretrizes) e que facilite o uso de quem necessariamente precisa utilizá-las.

Nossa perspectiva no texto ora apresentado é propor um esquema a partir de pesquisas realizadas anteriormente, para aplicação no contexto arquivístico de taxonomias, tesauros e ontologias em um estudo exploratório-experimental.

Taxonomias em ambientes arquivísticos

O conhecimento é registrado sempre em documentos, independentemente do seu formato ou suporte; é um conjunto organizado de informações disponíveis, admitindo os mais diversos usos, de maneira indiscriminada (Barité, 2001). Os documentos de arquivo são preservados, em um primeiro momento, por razões administrativas devido ao seu valor legal ou probatório, bem como por seu valor histórico.

Assim, os arquivistas, ao elaborar instrumentos de busca e estruturar sistemas de representação das informações dos documentos e suas temáticas, atuam como intermediários e organizadores do conhecimento. O armazenamento e a organização da informação estão diretamente relacionados ao objetivo de provar fatos, contar algo ou difundir o conhecimento para gerar novos conhecimentos. Dessa forma, “este conhecimento, se registrado, adquire um novo estatuto de informação que poderá ser socializado e potencialmente incorporado por algum indivíduo para gerar novo conhecimento” (Smit, 2012, p. 95).

Guimarães (2008) diz que, no âmbito da ciência da informação, a organização e a representação do conhecimento apresentam natureza mediadora, configurando-se em um conjunto de processos que estabelecem a intermediação entre um conhecimento que, uma vez produzido, foi materializado e socializado, de tal forma que possa servir de base para a geração de um novo conhecimento. Por sua vez, esse novo conhecimento, uma vez materializado e socializado, pode igualmente ser objeto de nova organização e representação, caracterizando aquilo que se pode denominar como fluxo helicoidal da informação.

As classificações em arquivo não são uniformes, dado que estão automática e diretamente relacionadas à organização produtora desses documentos. Dessa maneira, os arquivistas utilizam legislações, estatutos e organogramas do órgão que os auxiliam nessa atividade.

De acordo com Barros e Sousa (2019a), a base para a construção de sistemas de organização do conhecimento consiste nas estruturas organizacionais, visto estas oferecerem subsídios para a modelagem dos sistemas de organização do conhecimento. Igualmente, contribuem para a construção de melhores esquemas de classificação no desenvolvimento do fazer arquivístico, produzindo melhores resultados na representação, disseminação e acesso às informações por seus usuários finais.

Os arquivistas, nesse contexto, atuam diretamente com a atividade de representação em função da interpretação que esse profissional faz do acervo arquivístico de uma instituição.

Também se faz necessário entender o conceito, o qual é fundamental para a construção, organização e representação do conhecimento. O conceito é uma “unidade de conhecimento que surge pela síntese dos predicados necessários relacionados com determinado objeto e que, por meio de sinais linguísticos, podem ser comunicados” (Dahlberg, 1978, p. 12, tradução nossa).

Dahlberg também define o termo como “a forma verbal de um conceito, o componente que convenientemente sintetiza e representa um conceito com o propósito de designá-lo e comunicá-lo” (Dahlberg, 1978, p. 76, tradução nossa).

Na arquivologia, é a partir dos documentos de arquivo que se podem elaborar representações sobre o que é abordado nestes, como uma forma de garantir a recuperação da informação, pois é necessário tornar mais eficiente o armazenamento e o acesso às informações. A classificação de documentos baseada no princípio de proveniência e auxiliada pelo contexto de produção documental seria a base para elaboração de esquemas de representação do conhecimento. Assim,

a representação do conhecimento é feita por meio de diferentes tipos de sistemas de organização do conhecimento (SOC), que são sistemas conceituais que representam determinado domínio por meio da sistematização dos conceitos e das relações semânticas que se estabelecem entre eles. (Bräscher; Café, 2008, p. 8)

Nesse sentido, tais sistemas são instrumentos ou ferramentas que vão auxiliar os usuários a encontrar a informação de maneira mais rápida, eficaz e segura, pois foram elaborados levando-se em consideração o contexto de geração da informação registrada em documento de arquivo.

A grande maioria das instituições busca soluções que resolvam seus problemas de desorganização de arquivos. Com o enorme volume documental acumulado e a falta de acessibilidade aos documentos arquivísticos, recebem propostas de sistemas informatizados que prometem soluções milagrosas em curto espaço de tempo, o que, em grande parte, negligencia a estrutura que produziu, utilizou e acumulou o acervo. Esse é um dos problemas que os SOC podem auxiliar a sanar.

Na biologia, a taxonomia é um sistema de classificação desenvolvido por Lineu (naturalista sueco do século XVII) para agrupar e categorizar as espécies de seres vivos, em que se propôs uma hierarquia de semelhanças entre eles, dividindo-os em cinco grupos: reino, classe, ordem, gênero e espécie. Aquino et al. (2009) acrescentam que as taxonomias surgiram no campo da biologia e, por lá, são utilizadas há muito tempo, tendo se tornado alvo de estudos na ciência da informação, em que seu aparecimento e uso estão relacionados com as formas automatizadas de criação da informação.

A taxonomia pode ser definida como “um vocabulário controlado de uma determinada área do conhecimento e, acima de tudo, um instrumento ou elemento de estrutura que permite alocar, recuperar e comunicar informações dentro de um sistema sob uma premissa lógica” (Terra et al., 2005, p. 1). Assim, na ciência da informação, a taxonomia é um sistema de organização do conhecimento que classifica e facilita o acesso às informações, no qual se organizam as informações por categorias, normatizando as relações hierárquicas existentes entre elas.

Nesse contexto, a taxonomia é uma solução que pode ser escolhida para atender à demanda de maneira sucinta ao classificar as informações contidas nos documentos de arquivo, auxiliando a representar e estabelecer os conceitos por meio de um sistema de organização do conhecimento.

A classificação hierárquica é muito utilizada em esquemas de classificação na arquivologia. As taxonomias auxiliam os usuários a compreenderem como o conhecimento pode ser categorizado e, quando representam conceitos, oferecem um mapa e servem como guia nos processos de conhecimento. Sendo assim,

a taxonomia deverá ser usada como instrumento complementar à atividade de classificação de documentos, devendo ser pautada pelos seguintes passos: 1. classificar o documento conforme o plano de classificação de documentos de arquivo; 2. identificar no primeiro ou segundo nível de termos da taxonomia a área utilizada na classificação dos documentos; 3. utilizar os termos dos diversos níveis da taxonomia como descritores (termos de indexação) em complemento à classificação dos documentos; e 4. verificar a coerência da classificação combinada com a indexação nas dimensões funcionais e temáticas, respectivamente com os documentos. (Sousa; Araújo Júnior, 2017, p. 53)

A taxonomia é um sistema de organização do conhecimento dos mais simples, menos estruturado, e pode ser aplicado em qualquer universo e contexto organizacional, além de ser uma ferramenta de gestão que auxilia a realizar a organização em si, com um olhar voltado ao usuário e a quem realmente utiliza e precisa da informação. Também pode-se dizer que as taxonomias possuem um caráter dinâmico e apresentam necessidade de atualização, manutenção frequente e constante validação de conceitos que já foram preestabelecidos juntamente aos usuários, os quais são fundamentais, dado que auxiliam na classificação das informações e na modelagem dos sistemas de organização do conhecimento em conjunto com os arquivistas. Dessa maneira, “as taxonomias são estruturas classificatórias para organizar as informações de uma determinada instituição num dado contexto. Nesse sentido, são diferentes, tendo em vista que refletem o tipo de organização e informação da instituição que representam (Aquino et al., 2009, p. 206).

Sendo assim, ao construir taxonomias, os arquivistas utilizarão princípios classificatórios para elaboração desses instrumentos, em que é necessário estabelecer a categorização das classes: “a categorização é um processo que requer pensar o domínio de forma dedutiva, ou seja, determinar as classes de maior abrangência dentro da temática escolhida” (Campos; Gomes, 2008, p. 5).

Portanto, a aplicação de taxonomias deve ser um momento anterior à própria construção do plano, ou seja, a partir do relacionamento entre o domínio institucional, usuários do sistema e arquivistas. Constrói-se uma estrutura de relações hierárquicas que atendam a comunidade que efetivamente irá utilizar o plano, ou seja, os usuários são parte do sistema e não meramente usuários.

Ontologias no contexto dos arquivos

Conforme destacamos nas sessões anteriores, especialmente a partir da escadaria semântica, as ontologias estão no topo, no sentido de que elas possuem características associativas e de relacionamento, na medida em que possibilitam a construção de instâncias ontológicas passíveis de serem compreendidas por máquina. Contexto é fundamental para modelar domínios a partir de ontologias, e seu propósito faz-se necessário, quando classificamos estamos subdividindo um domínio em classes; a diferença entre as taxonomias e ontologias está justamente no formato e forma da construção das relações.

Ontologia é um termo polissêmico que significa coisas distintas no campo da ciência da computação, filosofia e ciência da informação. No nosso contexto, quando falamos de ontologias estamos falando de um SOC baseado fundamentalmente em relações semânticas entre os termos e conceitos de um domínio. Tomando por base Gruber (1995), ontologias são “uma conceituação explícita”, ou seja, estamos falando de um sistema formal com instâncias claras que relacionam conceitos e termos; sua potencialidade se dá justamente pela necessidade de explicitar as relações semânticas.

Outra citação, de Guarino (1998), estabelece que a ontologia se refere a um “artefato de engenharia, construído por um vocabulário específico usado para descrever uma realidade, com premissas explícitas com uma intenção de significar palavras de um vocabulário”.

Em linhas gerais, as ontologias são uma especialização do SOC anteriormente trabalhado, mas que se institui para além das relações hierárquicas. Os termos e conceitos estabelecem relacionamento para além das relações hierárquicas e se fundamentam também em relações associativas.

A fim de tipificar, fizemos um pequeno exercício no software Protégé (Figura 2).


Figura 2 – Ontologia do conceito de gestão de documentos feito no Protégé. Fonte: elaborado pelos autores (2021)


Buscamos evidenciar a relação taxonômica inicial das ontologias, quer dizer, antes de se pensar em instâncias ontológicas, é necessário ter dimensão das relações hierárquicas semânticas entre os termos, no exercício apresentado, fazendo uma pequena entrada da gestão de documentos e os termos relacionados à gestão documental tradicionalmente atrelada à avaliação, classificação, uso e produção documental. Assim, as ontologias buscam descrever explicitamente as relações semânticas de determinados termos. Van Heijist, Schreiber e Wielinga (1997) definem da seguinte maneira: “Ontologias terminológicas assim como o léxico especificam termos que são utilizados para representar um domínio discursivo”. Do ponto de vista das ontologias, já publicamos três trabalhos sobre a temática dois, especificamente trabalhando com ontologias termológicas no contexto arquivístico (Barros; Gomes, 2018; Gomes et al., 2020).

Nesses textos, defendemos que a ontologia terminológica pode facilitar o desenvolvimento de sistemas de classificação arquivística, dadas as características e necessidades de explicitamente definir conceitos e termos.

Os elementos constituintes da classificação arquivística são o conjunto de ações desempenhadas pela administração que produziu os documentos, assim a construção da ontologia se dá a partir do próprio desenvolvimento da classificação, ou seja, à medida que se constituem informações sobre o órgão produtor, no contexto da categorização taxonômica que se faz, se constroem as instâncias e relacionamentos, na ontologia.

Com base em uma ontologia da área do direito, apresentamos aqui algumas figuras de instâncias e sua explicitação (Figura 3).


Figura 3 – Instâncias de um objeto físico na ontologia LKIF no Protégé. Fonte: Hoekstra et al. (2007)


O conceito a ser definido de objeto físico tem relações associativas e hierárquicas no âmbito dessa ontologia e ainda traz, do ponto de vista da ontologia, uma definição do que vem a ser um objeto físico: “um objeto físico é uma entidade física que consiste de matéria e tem uma extensão espacial e temporal” (tradução nossa), ou seja, a ontologia é um SOC que permite profundidade ao domínio que modela.

Por meio dela também conseguimos construir um mapa visual que permite a compreensão semântica pela máquina (Figura 4).


Figura 4 – Dependências entre os LKIF módulos. Fonte: Hoekstra et al. (2007)


Cada nodo, na figura acima, representa uma relação semântica passível de ser compreendida por um sistema de recuperação, possibilitando contextualizar os conceitos, ou seja, a ontologia no contexto arquivístico funcionaria com um instrumento misto que tem possiblidade de ser utilizado para além de um ciclo documental fechado e em todas as funções arquivísticas, e na classificação permite a compreensão das relações hierárquicas de forma contextual, o reúso em diferentes contextos e uma busca por meio de sistema de recuperação, para além da dimensão hierárquica.

Nas Figuras 5 e 6, continuamos nesse mesmo fundamento, buscando demonstrar as potencialidades das ontologias no contexto arquivístico.


Figura 5 – Conceitos relacionados com local e mereologia.1 Fonte: Hoekstra et al. (2007)



Figura 6 – Conceitos relacionados com tempo e mudança. Fonte: Hoekstra et al. (2007)


Em ambas as figuras se estabelecem quatro nodos conceituais que relacionam, no âmbito desse domínio específico, como os conceitos se comportam, como podemos compreendê-los. A ontologia de uma estrutura organizacional administrativa significa que as relações entre os vários departamentos de uma determinada estrutura administrativa podem ser correlacionadas no âmbito da ontologia, funcionando ao mesmo tempo que referencia para a classificação, fundamento para a construção da descrição e da relação conceitual entre os diferentes organismos administrativos e também com termos a serem indexados em um sistema de recuperação. Evidenciamos abaixo essa relação (Figura 7):


Figura 7 – Exemplo de ontologia no contexto arquivístico. Fonte: Barros e Gomes (2018)


Está representado o contexto administrativo em suas relações funcionais, ou seja, o organismo possui missões institucionais, que se relacionam com funções jurídico-administrativas. Essas funções estão atreladas a atividades e documentos, e esses documentos relacionam-se hierárquica e semanticamente entre si. Esses conceitos/termos funcionam como chaves para a classificação e para o sistema de recuperação.

Como se pode verificar, a partir da ontologia é possível visualizar um plano de classificação e, diante da necessidade de qualquer alteração na estrutura organizacional, a ontologia pode ser facilmente modificada, servindo como um guia para a transformação da classificação e para a recuperação da informação.

Por exemplo, pode ser necessário que a organização tenha um de seus departamentos para desempenhar uma nova função, ou pode ser necessário encerrar as atividades de um departamento. Se tais situações ocorrerem, o acréscimo de uma nova função, ou a exclusão de um dos departamentos existentes, pode ser representado na ontologia de forma bastante simplificada, permitindo ao arquivista realizar a mesma modificação no sistema de classificação.

A construção da ontologia anterior ao sistema de classificação é útil principalmente para esses casos e, ainda, possibilita seu reúso para a recuperação em um sistema de recuperação, portanto, as taxonomias e ontologias são ferramentas poderosas para serem utilizadas nos domínios jurídico-administrativos.

Tesauros no contexto dos arquivos

Os tesauros são SOC comumente utilizados no contexto da biblioteconomia e da ciência da informação, sua aplicação na arquivologia é esporádica e são poucos os modelos a serem seguidos pela comunidade, o que se convencionou chamar de tesauro funcional, que é aquele que busca de certo modo atender ao documento jurídico-administrativo. “Um tesauro funcional controla o vocabulário que designa a razão de ser do documento (sua função) e não o que ele contém (assunto). A sua construção partirá do plano de classificação e o reordenará. Nunca é demais salientar que um tesauro funcional não substitui tal plano” (Smith; Kobashi, 2003, p. 45).

Na arquivologia, o tesauro funcional pode contribuir de várias formas. É um instrumento que opera como índice de termos do plano de classificação; como índice para encontrar séries documentais a serem eliminadas; provê pontos de acesso ao usuário, permite uso de sinônimos ou outros termos não adotados para a terminologia (Smit; Kobashi, 2003). Assim, o que é dito a respeito dos tesauros também pode ser dito sobre as ontologias, ou seja, mais do que a estrutura do SOC, o fundamental é ter clareza sobre sua utilidade, contexto e fundamento.

A diferença entre os domínios científicos e jurídico-administrativos acaba evidentemente por influenciar os processos de produção documental e construção dos processos organizacionais. Assim, o pensamento base é de que o tesauro tradicional não seria indicado para organizar arquivos. No entanto, existem tesauros para arquivos, especialmente os históricos, que privilegiam o conteúdo temático. Por exemplo: o espanhol Tesauro del Patrimonio Histórico Andaluz, o inglês United Kingdom Archival Thesaurus (Ukat) e os franceses Thesaurus W: vocabulaire normalisé pour la description des archives administratives locales contemporaines e Archives de Cannes. Os tesauros citados desenvolvem basicamente três listas: assuntos, instituições e localidades geográficas (Giménez-Chornet; Escrig-Giménez, 2011). Porém, tais tesauros não consideraram a orientação da norma internacional para gestão de arquivos (ISO 15.489) ao hierarquizarem assuntos e não funções (Gibbons; Shenton, 2003).

Foi por esse motivo que o National Archives of Australia (NAA), em conjunto com o governo australiano, passou a desenvolver uma metodologia de classificação para esses documentos, e também com vistas à organização de registros na web, baseado no contexto de uso e criação de cada registro e, posteriormente, no seu assunto (National Archives of Australia, 2000).

O tesauro funcional proporciona novas maneiras de acesso à informação arquivística e maior confiança no sistema. Porém, para o desenvolvimento e uso adequado dos tesauros funcionais, é necessário planejar e estabelecer o plano de classificação arquivístico, principalmente, pelo fato de que ele reflete as funções e atividades que são desenvolvidas nas instituições. É um instrumento que oferece soluções para a arquivologia, no que diz respeito ao sistema de informação, tanto para a padronização e o controle terminológico, quanto para diminuir os problemas referentes ao acesso à informação arquivística. Assim, a utilização de uma linguagem normalizada referente ao contexto e à cultura organizacional de uma instituição é um dos fatores primordiais para se obter o processo de produção, organização e disseminação da informação.

O plano de classificação na arquivologia é um instrumento consolidado, porém, na prática, necessita de instrumentos que contribuam com questões relacionadas à padronização terminológica. Isso faz com que o uso de um instrumento de representação e recuperação da informação direcionado aos usuários/pesquisadores provoque neles uma maior confiança ao realizarem suas pesquisas.

Ao se tratar da construção de um tesauro funcional na arquivologia, deve-se considerar o plano de classificação, como já foi argumentado anteriormente, porque o tesauro funcional influencia consideravelmente as funções e atividades que são desenvolvidas pelas instituições.

Dessa forma, o uso do tesauro funcional na arquivologia pode ocasionar grandes vantagens, como foi apresentado por Alencar (2017), conforme destacado no Quadro 1.

Quadro 1 – Vantagens do uso do tesauro funcional na arquivologia


Fonte: Rousseau e Couture (1998) apud Alencar (2017); Lopes (2002) apud Alencar (2017); Bellotto (2014) apud Alencar (2017); Mundet (2001) apud Alencar (2017); Smit; Kobashi (2003) apud Alencar (2017).

Nosso entendimento de que o tesauro funcional auxilia o arquivista na organização e representação da informação é um instrumento que pode atuar como ponte de acesso, auxiliando na busca de informações pelos sistemas, indicando quais são as melhores estratégias de busca.

Quando se fala na construção do tesauro funcional, é bom destacar que se trata de um trabalho que deve abranger a instituição, os produtores dos documentos, usuários e o arquivista, além de outros profissionais que podem contribuir na sua construção, adaptando as realidades informacionais das instituições.

Existem poucas pesquisas de abordagem dos tesauros funcionais na arquivologia que tratem da relação da organização, representação e uso da informação. No entanto, as normas de descrição na arquivologia tratam da necessidade do uso de instrumentos que trabalhem com a perspectiva de padronização e controle terminológico. O mesmo vale para as taxonomias e ontologias, no entanto, talvez com objetivos e nível de aplicabilidade distintos, se voltarmos para a escadaria semântica de Zeng (2008), é fundamental que exista clareza nos objetos e na forma de aplicação dos três diferentes SOC aqui apresentados.

Segundo Vogel e Kobashi (2019), o instrumento mais adequado a ser desenvolvido são os tesauros funcionais. As autoras afirmam que o tesauro tradicional é desenvolvido de forma temática, e que essa estrutura seria adequada aos arquivos permanentes, sendo o ideal, em relação aos arquivos correntes e intermediários, os tesauros funcionais (2019).

O tratamento da informação, independentemente de seu suporte, é o objeto de estudo da arquivologia. Por isso, o uso do tesauro funcional nas práticas e metodologias da área contribui nas formas de representação e recuperação da informação, permitindo, assim, uma socialização da informação de modo eficaz.

Os tesauros funcionais são instrumentos importantes, além de promoverem o acesso preciso à informação, também possibilitam, na fase permanente, o oferecimento de subsídios para que os usuários/pesquisadores possam compreender o contexto de produção dos documentos pertencentes aos arquivos permanentes.

O profissional da informação, no caso, o arquivista, respalda-se na necessidade de disponibilizar a informação, no entanto, para que este profissional tenha êxito nesse objetivo, é fundamental o uso de instrumentos que contribuam com essa perspectiva.

Diante do exposto até o momento, pode-se afirmar que a utilização do tesauro funcional para nortear a organização, especificamente a recuperação da informação arquivística, contribuirá para assegurar o princípio da proveniência, ao materializar em sua estrutura relações (hierárquicas, de associações, de relacionamentos e de equivalências) na forma de descritores normalizados para representar as atividades e funções contidas nos documentos. Isso faz com que a informação orgânico-funcional esteja assegurada na memória documentária arquivística.

Conclusões

Buscou-se neste texto discorrer a respeito dos sistemas de organização do conhecimento aplicado aos arquivos, em um estudo exploratório que visa demarcar a aplicação e as limitações da aplicação de três tradicionais SOC no ambiente dos arquivos. A descrição aqui feita ainda é provisória, no sentido de que as pesquisas que desenvolvemos sobre a temática com alunos em nível de pós-graduação ainda precisam de mais experimentação, exercício e prática. No entanto, uma clareza que temos é que os instrumentos de organização e recuperação de documentos arquivísticos não podem permanecer parados no tempo e inalterados, quer em relação aos problemas decorrentes da realidade digital ou da eminência de sistemas de recuperação automatizados.

Acreditamos sinalizar um caminho que vários poderão percorrer, assim como nós temos percorrido com nossos estudantes. Convidamos todos os pesquisadores da área da arquivologia para fazerem o mesmo, porque compreendemos que temos muito a ganhar do ponto de vista da prática e da metodologia de tratamento dos documentos arquivísticos.

Referências

ALENCAR, M. F. Organização e representação do conhecimento na arquivística: abordagens para a construção de tesauros funcionais. 2017. Dissertação (Mestrado em Ciência da Informação) – Universidade Estadual de Londrina, 2017.

______; CERVANTES, B. M. N. Organização e representação do conhecimento arquivístico: em busca de um método para construção de tesauro funcional. Em Questão, Porto Alegre, v. 25, n. 1, p. 368-389, 2019a.

______; ______. Acesso à informação arquivística: uma aproximação teórica da vertente pós-custodial com o tesauro funcional. Informação & Sociedade: Estudos, v. 29, n. 2, p. 85-100, 2019b. Disponível em: https://periodicos.ufpb.br/index.php/ies/article/view/38287/22774.

AQUINO, I. J.; CARLAN, E.; BRÄSCHER, M. B. Princípios classificatórios para a construção de taxonomias. Ponto de Acesso, Salvador, v. 3, n. 3, p. 196-215, dez. 2009.

BARITÉ, M. et al. Diccionario de organización del conocimiento: clasificación, indización, terminología. 6. ed. corregida y aumentada. Montevideo: CSIC, 2015.

______. Organización del conocimiento: un nuevo marco teórico-conceptual en bibliotecología y documentación. In: CARRARA, K. (org.). Educação, universidade e pesquisa. Marília: Unesp Marília Publicações; São Paulo: Fapesp, 2001.

BARROS, T. H. B. Touching from a distance: concept theory and archival hierarchical classification. In: INTERNATIONAL ISKO CONFERENCE, 16., 2020, Aalborg, Denmark. Proceedings… Würzburg: Ergon-Verlag, 2020. p. 465-469.

______. A indexação e a arquivística: aproximações iniciais no universo teórico da organização e representação do conhecimento. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, Florianópolis, v. 21, n. 46, p. 33-44, maio/ago. 2016. Disponível em: https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2016v21n46p33/31600.

______; GOMES, D. L. Classification and knowledge organization systems: ontologies and archival classification. In: RIBEIRO, F.; CERVEIRA, M. E. (org.). Challenges and opportunities for knowledge organization in the digital age. v. 16. Würzburg: Ergon-Verlag, 2018. p. 103-111. Disponível em: https://www.ergon-verlag.de/isko_ko/downloads/aiko_vol_16_2018.pdf.

______; LAIPELT, R. C. F. Uma análise de domínio da área de organização e representação do conhecimento no contexto do periódico Em Questão. Em Questão, v. 27, n. 4, p. 438-468, 2021.

______; MARTINS, V. R. A informação orgânica enquanto um objeto interdisciplinar: as relações entre a arquivística e a ciência da informação no âmbito da representação em arquivos. Ágora: arquivologia em debate, Florianópolis, v. 25, n. 51, p. 132-149, 2015.

______; MORAES, J. B. E. Archival classification and knowledge organization: theoretical possibilities for the archival field. In: INTERNATIONAL ISKO CONFERENCE, 12., 2012, Mysore. Proceedings... Würzburg: Ergon, 2012. p. 272-276.

______; SOUSA, B. T. R. R. Organização do conhecimento e arquivologia: abordagens metodológicas. Informação & Informação, Londrina, v. 24, n. 2, p. 76-92, maio/ago. 2019.

______; TOGNOLI, N. T. Os processos de representação do conhecimento arquivístico: elementos históricos e conceituais da classificação e descrição. In: GUIMARÃES, J. A. C.; DODEBEI, V. Organização do conhecimento e diversidade cultural. v. 3. Marília: Fundepe, 2015. p. 94-99.

BRASCHER, M.; CAFÉ, L. Organização da informação ou organização do conhecimento? In: ENANCIB, 9., São Paulo, 2008. Diversidade cultural e políticas de informação. São Paulo: USP, 2008.

CAMPOS, M. L. A. Linguagem documentária: teorias que fundamentam sua elaboração. Niterói: Eduff, 2001.

______; GOMES, H. E. Taxonomia e classificação: o princípio de categorização. DataGramaZero, v. 9, n. 4, 2008. Disponível em: http://hdl.handle.net/20.500.11959/brapci/6615. Acesso em: 17 maio 2021.

DAHLBERG, I. Knowledge organization: its scope and possibilities. In: Knowledge organization (org.). RUSSIAN REGIONAL CONFERENCE, 1. Proceedings... Moscow: Knowledge Organization, v. 20, n. 4, p. 211-222, 1993.

______. Teoria do conceito. Ciência da Informação, Brasília, v. 7, n. 2, p. 101-107, 1978.

DURANTI, L. The archival bond. Archives and Museum Informatics, v. 11, p. 213-218, 1997.

FOSCARINI, F. Records classification and functions: an archival perspective. Knowledge Organization, v. 33, n. 4, p. 188-198, 2006.

GIBBONS, P.; SHENTON, C. Implementing a records management strategy for the UK Parliament: the experience of using keyword AAA. Journal of the Society of Archivists, v. 24, n.2, p.141-157, 2003.

GIMÉNEZ-CHORNET, V.; ESCRIG-GIMÉNEZ, M. Designing a thesaurus to give visibility to the historical archives in the Archivo del reino En Valencia. Knowledge Organization, v. 38, n. 2, p. 155-166, 2011.

GOMES. D. L.; BARROS, T. H. B.; SOUSA, R. T. B.; SANTOS JUNIOR, R. L. Proposta de uma ferramenta para classificação arquivística com base em ontologias. Em Questão, Porto Alegre, v. 26, n. 1, p. 351-374, 2020.

GRUBER, T. R. Toward principles for the design of ontologies used for knowledge sharing?. International Journal of Human-Computer Studies, v. 43, n. 5-6, p. 907-928, 1995.

GUARINO, N. Formal ontology and information systems. Proceedings of FOIS’98, Trento, Italy, p. 81-97, 1998.

GUIMARÃES, J. A. C. A dimensão teórica do tratamento temático da informação e suas interlocuções com o universo científico da International Society for Knowledge Organization (Isko). Revista Ibero-americana de Ciência da Informação, v. 1, n. 1, p. 77-99, 2008.

______; TOGNOLI, N. B. Provenance as a domain analysis approach in archival knowledge organization. Knowledge Organization, v. 42, n. 8, p. 562-69, 2015.

HENTTONEN, P. Dimensions of contextual records management classifications. Knowledge Organization, v. 42, n. 4, p. 477-485, 2015.

______. Diversity of knowledge organization in records and archives management. In: NEELAMEGHAN, A.; RAGHAVAN, K. S. (ed.). Advances in Knowledge Organization: categories, contexts and relations in knowledge organization, n. 13. Würzburg: Ergon, 2012.

______; KETTUNEN, K. Functional classification of records and organisational structure. Records Management Journal, v. 21, n. 2, p. 86-103, 2011.

HJØRLAND, B. Knowledge organization (KO). In: HJORLAND, B.; GNOLI, C. (org.) Encyclopedia of knowledge organization, v. 43, n. 6, p. 475-84, 2016. Disponível em: http://www.isko.org/cyclo/knowledge_organization.

______. What is knowledge organization (KO)? Knowledge Organization, v. 35, n. 2, p. 86-101, 2008.

HOEKSTRA, R. et al. The LKIF core ontology of basic legal concepts. In: CEUR Workshop Proceedings, 2007. Disponível em: https://www.researchgate.net/publication/221539250_The_LKIF_Core_ontology_of_basic_legal_concepts.

MAZZOCCHI, F. Knowledge organization system (KOS). In: ISKO. Encyclopedia of knowledge organization, v. 45, n. 1, p. 54-78, 2018. Disponível em: http://www.isko.org/cyclo/kos.

NATIONAL ARCHIVES OF AUSTRALIA. Developing a functions thesaurus: guidelines for commonwealth agencies. Canberra: National Archives of Australia, 2003.

PACKALÉN, S.; HENTTONEN, P. Ambiguous labels: facet analysis of class names in finish public-sector functional classification systems. Knowledge Organization, v. 43, n. 7, p. 490-501, 2016.

SCHELLENBERG, T. The appraisal of modern public records. Bulletin of the National Archives, n. 8, p. 6-7, october 1956.

SMIT, J.; KOBASHI, N. Como elaborar vocabulário controlado para aplicação em arquivos. São Paulo: Arquivo do Estado, Imprensa Oficial, 2003.

SMIT, J. W. A informação na ciência da informação. InCID: revista de ciência da informação e documentação, v. 3, n. 2, p. 84-101, 2012. 

SOUSA, R. T. B. Os princípios arquivísticos e o conceito de classificação. In: RODRIGUES, G. M.; LOPES, I. L. (org.). Organização e representação do conhecimento. Brasília: Thesaurus, v. 2, p. 240-269, 2003.

______; ARAÚJO JÚNIOR, R. H. de. A classificação e a taxonomia como instrumentos efetivos para a recuperação da informação arquivística. Ciência da Informação, Brasília, v. 42, n. 1, p. 131-144, jan./abr. 2013.

______; ______. A indexação e criação de taxonomias para documentos de arquivo: proposta para a expansão do acesso e integração das fontes de informação. Brazilian Journal of Information Science: research trends, v. 11, n. 4, p. 47-56, 2017.

PINTO, F. B.; SCHMIDT, C. M. D. S. Construindo equivalências: a aplicabilidade da classificação funcional por tipo documental no Instituto Nacional de Infectologia Evandro Chagas. In: BARROS, Thiago Henrique Bragato; TOGNOLI, Natália Bolfarini. Organização do conhecimento responsável: promovendo sociedades democráticas e inclusivas. Belém: ISKO Brasil, 2019.

TERRA, J. C. C. et al. Taxonomia: elemento fundamental para a gestão do conhecimento. Biblioteca TerraForum Consultores, 2005. Disponível em: http://pessoal.utfpr.edu.br/mansano/arquivos/taxonomia.pdf.

TOGNOLI, N. T.; RODRIGUES, A. C.; GUIMARÃES, J. A. C. Archival knowledge conceptual frameworks for recent terminology in the KO domain. Knowledge Organization, v. 46, n. 7, p. 523-529, 2019.

VAN HEIJST, G.; SCHREIBER, A. T.; WIELINGA, B. J. Using explicit ontologies in KBS development. International Journal of Human: computer studies, v. 45, n. 2-3, p. 183-292, 1997.

VOGEL, M. J. M.; KOBASHI, N. Y. Tesauro funcional para organização de arquivos administrativos. Páginas a&b: arquivos e bibliotecas, n. 12, p. 48-62, 2019. 

YAKEL, E. Archival representation. Archival Science, v. 3, n. 1, p. 1-25, 2003.

ZENG, M. L. Knowledge organization systems (KOS). Knowledge Organization, Frankfurt, v. 35, n. 2-3, p. 160-182, 2008.

Recebido em 19/11/2021

Aprovado em 11/1/2022


Nota

1    Mereologia = (Lógica) teoria ou estudo lógico-matemático das relações entre as partes e o todo e das relações entre as partes no interior de um todo.



Esta obra está licenciada com uma licença Creative Commons Atribuição 4.0 Internacional.