Arquivo do Parlamento
O Arquivo do Parlamento é um repositório aberto que procura compilar e dar visibilidade às pequenas e grandes narrativas sobre a vida política portuguesa.
Agrega notícias e artigos de opinião sobre a atividade do Parlamento, as suas legislaturas, grupos parlamentares e deputados. De modo a permitir análises mais completas e heterogéneas, considera notícias e artigos de opinião produzidos pelos media tradicionais mas também aqueles que são criados pelos cidadãos, nomeadamente os conteúdos disponibilizados em blogues pessoais.
O principal objetivo Arquivo do Parlamento passa por colocar ao dispor de todos uma ferramenta de investigação poderosa e facilmente utilizável. Este website compila e disponibiliza dados que, normalmente, são inacessíveis ao utilizador comum, devido à sua elevada dispersão e à complexidade técnica dos processos de tratamento e análise de big data. Possibilita, por exemplo, visualizar os partidos e deputados mais visados pelos media em cada legislatura, os media mais presentes ou os tópicos mais salientes.
Este projeto foi também pensado de forma a poder facilmente servir de material de estudo e pesquisa em diferentes áreas de investigação, como as Ciências Sociais, a Ciência Política ou as Tecnologias da Informação. Através do botão “descarregar ficheiro CSV” (Comma Separated Values) é possível aos investigadores ter acesso à informação num formato comum de ficheiro.
A informação está organizada de forma hierárquica em Legislaturas, Grupos Parlamentares, Deputados, Media, Tópicos e Artigos. Desta forma, é possível ter diversos tipos e níveis de análise em simultâneo. Por exemplo, ao navegarmos por Legislatura estamos a filtrar os artigos temporalmente, o que permite não só visualizar os grupos parlamentares, deputados, media, tópicos mais relevantes, mas também navegar dentro destas categorias e descarregar os artigos a elas pertencentes.
Por outro lado, ao acedermos aos itens de menu Grupos Parlamentares, Deputados, Media, Tópicos e Artigos, temos acesso a toda informação relativa a estas categorias independentemente do seu contexto temporal, o que permite análises mais alargadas. Dentro de cada uma das páginas de listagem de artigos é ainda possível filtrar de diversas formas, consoante o contexto, de modo a tornar a informação mais acessível.
A componente técnica compreende quatro fases distintas:
- Recolha dos dados sobre todas as legislaturas desde 1996 (VII – XIV) a partir dos dados abertos disponíveis em Parlamento.pt;
- Extração das páginas web do Arquivo.pt através da pesquisa do nome dos grupos parlamentares e deputados;
- Extração do título, texto e palavras-chave dos artigos, identificação dos grupos parlamentares e deputados e inserção desta informação na base de dados;
- Desenvolvimento do website, com a ajuda da framework open-source Django, de modo a tornar a informação acessível a toda a comunidade.

Todos os artigos apresentam um botão “Marcar artigo” que faz um pedido de verificação humana ao artigo. Esta é a caixa de diálogo que surge quando se clica no botão
Este projeto foi desenvolvido por Tiago Santos e venceu o prémio Arquivo.pt 2022. O texto nesta página foi extraído do documento de candidatura ao prémio.
Deixe o seu comentário