Dados abertos e o pedágio do governo digital

A aprovação no Congresso do PL de Governo Digital (PL 317/21) é uma excelente notícia para a digitalização do governo no Brasil. A proposta complementa a recém-criada Lei de Liberdade Econômica, e traz inovações importantes como a interoperabilidade de dados, a infraestrutura de identidade digital e a primazia dos serviços digitais. Um pequeno trecho da lei, porém, mancha a memória do debate legislativo: o art. 29 parágrafo 3º, que da maneira como foi escrito cria uma espécie de “pedágio de dados abertos” no país.

É fácil compreender como o pedágio funciona: no art 29, o PL permite que diversos atores do governo cobrem pelo acesso a dados abertos. A única ressalva imposta é que essa cobrança seja feita com dados já abertos e catalogados. Essa é uma salvaguarda importante, porém insuficiente. Isso torna o texto potencialmente inconstitucional, e passível de ação direta de inconstitucionalidade (ADIn).

O grande mérito do PL de governo digital é traduzir a lógica do governo como plataforma. Isso significa alocar o Estado na posição de gerador de valor entre atores externos ao próprio governo. Em vez de ofertar o serviço, o governo cria condições para que outros promovam o interesse público. É um conceito excelente.

E onde o PL se torna infeliz? Ao instituir no art. 29 a lógica do governo como serviço que representa o velho modelo de governo digital, no qual o governo resolve tudo sozinho e, ao invés de envolver os atores diretamente, os taxa pelo serviço prestado. É isso que faz o PL ao reservar ao governo a criação de APIs para acesso a dados, cobrando ainda a sociedade por isso.

Explicamos abaixo a intenção nobre do legislador, as falhas da redação, e o que é insolúvel no texto aprovado. Com sorte, teremos tempo e abertura para veto. Com azar, veremos aí uma disputa constitucional de uma Lei tão importante, que sem querer abriu uma caixa de pandora que pode manchar nossa reputação junto à ONU e à OCDE.

Três problemas insanáveis da redação aprovada

O objetivo do legislador ao criar o pedágio de dados abertos foi nobre: cobrar de quem tem mais, para dar acesso a quem tem menos. Como melhorar dados abertos para todos? Ofertando gratuitamente o básico para todos, e remunerando o acesso gratuito com serviço premium pago por poucos. No setor privado, chamam isso de estratégia freemium.

O problema é que o texto final não condiz com a intenção do legislador, e traz pelo menos três desafios insolúveis.

1. O primeiro problema é a definição de como cobrar da sociedade pelo serviço prestado. O legislador justificou a quebra da equidade de acesso a dados com base na lógica Robin Hood: tirar de quem tem mais, para dar a quem tem menos. A intenção é boa, mas essa é a lógica do direito tributário. Quando criamos taxas, impostos, podemos cobrar do governo como nosso dinheiro retorna investido. Ao optar por fazer a cobrança do serviço através do direito administrativo, empresas de tecnologia podem nos cobrar pelo acesso premium, e investir o lucro com isso onde quiserem. Desaparece a obrigação típica do espírito solidário da lei tributária, para vigorar o espírito da livre iniciativa.

2. O segundo problema é a definição de quem pagará pelo serviço premium. O legislador optou por limitar a cobrança através da especificação do tipo de serviço cobrado, e não por quem pode ter que pagar pelo serviço. Ao fazer isso, o legislador mirava nas corporações e grandes empresas, que, afinal, têm o potencial de transformar dados em lucro. No entanto, o texto, ao não colocar limites a quem pode ser cobrado, atingiu a todos sem distinção. Entre futuros pagadores estão pesquisadores, organizações da sociedade civil, o próprio governo, jornalistas, organismos internacionais, startups (aos montes) e tantos outros. É tirar de quem tem pouco, para retornar (se tudo der certo) para quem tem menos ainda. E isso é grave.

3. O terceiro problema é o que de fato pode ser cobrado. O legislador teve a intenção de cobrar pelo acesso premium, distanciando a cobrança de ser aplicada ao comportamento típico do cidadão comum. Tentou definir um serviço complexo, mas que no linguajar do mercado pouco tipifica. Não tratou de forma clara temas como volume, velocidade, quantidade ou disponibilidade, e nem fez referência a outros marcos regulatórios. A definição do serviço em si é uma inovação do PL. E ao fazer isso, criou um “acesso a dados de larga escala” que implica em uma espécie vaga de objeto de contratação, e que pode abranger de tudo, inclusive o acesso eventual de indivíduos feito com frequência. Outro problema é a fragmentação da regulação infralegal. A definição pode ser amenizada por decreto, mas considerando que não temos redação ideal hoje, o que ela não é simples de ser feita, o lugar correto para esse debate acontecer é no Legislativo, e não na esfera Administrativa.

Seria possível ajustar os vícios por decreto?

  • A resolução infralegal não pode mudar a natureza da cobrança, nem inserir isenções ou imunidades a quem paga pelo serviço. Esses problemas não são insanáveis por via infralegal, e requerem mudanças na legislação originária.
  • A resolução infralegal poderia, restrita ao poder Executivo, direcionado ao que caracteriza os serviços das empresas de tecnologia do âmbito federal, aprimorar a redação do que pode ser cobrado. O problema, porém, é a fragmentação do ecossistema, pois cada ente, cada poder, cada ator envolvido teria que fazer o mesmo. A lei abre algo que a resolução infralegal não pode sozinha fechar. É o pior cenário para um governo digital que podemos imaginar.

Eis o texto aprovado – parágrafo 3º do artigo 29 -, e que traz vícios insanáveis que foram destacados por mim em negrito:

§ 3° É facultada aos prestadores de serviços e aos órgãos e entidades públicas que tenham por objeto a execução de serviços de tratamento de informações e o processamento de dados, em (4) relação a dados abertos já disponibilizados ao público e devidamente catalogados de acordo com o inciso XI do § 2° deste artigo, (1) a cobrança de valor de utilização, no caso de (2/3) acesso tipicamente corporativo ou institucional, contínuo e com excessiva quantidade de usuários e de requisições simultâneas, com grande volume de dados e com processamento em larga escala.

Ilustrando a caixa de pandora

Acerta o legislador ao impedir que serviços premium só possam ser cobrados para o dado que já está aberto e catalogado (ver redação acima, ponto 4). O problema é que essa garantia define o problema de forma limitada: dado aberto não é o dado que está publicado e catalogado, mas sim o dado que é eficiente para desempenhar sua função social.

Seguem abaixo casos existentes que seriam permitidos com a redação atual, mas que não deveriam ser:

  • Em novembro de 2018, o Diário Oficial da União (DOU) passou a cobrar pelo acesso matutino ao conteúdo da publicação, de forma que o acesso às edições completas é gratuito das 12h em diante, e pago antes disso A cobrança foi revogada, mas se esse serviço premium voltar a ser ofertado, o princípio de isonomia da Lei das Licitações fica comprometido.
  • O Ministério das Cidades, em seu Plano Institucional de Dados Abertos, estima em US$ 720 bilhões a US$ 920 bilhões os benefícios econômicos anuais no uso de dados abertos em transportes. Central a esse benefício é a publicação gratuita desses dados em tempo real, o que é exceção hoje.
  • acesso a dados da crise do covid-19 passaram a ser divulgados pelo governo após horário nobre do jornalismo na TV, e de forma agregada, o que impacta na cobertura do jornalismo local. Esse tipo de acesso se configura no tipo de serviço cobrável que a redação atual permite, mas a crise do covid-19 ilustra os impactos que isso teria no uso da mídia e da sociedade civil para desempenhar a função de controle externo do governo.

O necessário debate legislativo

Dados abertos têm custo, e é fundamental encontrar formas de remunerar o governo para prestação do serviço. O problema é que definir como remunerar o governo por dados abertos é um tema bastante delicado.

  • Primeiro, temos o problema do papel do governo no mercado de dados. Com o debate acalorado em torno das big techs, possíveis monopólios e tantos temas concorrenciais, como justificar que o governo seja um player protegido, gigante, com posição privilegiada para oferecer serviços premiums de acesso a dados abertos? Quais são os limites aplicáveis, e quais são os riscos?
  • Segundo, temos uma delicada relação entre a LGPD (Lei Geral de Dados Pessoais) e os serviços inovadores criados por empresas de tecnologia do governo. Pode o governo gerir a infraestrutura de identidade digital e revender esse dado como serviço para o setor privado? Quais limites são aplicáveis, e quais as vedações? Hoje esse debate está movimentando o Judiciário, mas merece um sério debate legislativo sobre o tema.
  • Temos ainda o rito legislativo do PL de Governo Digital, que tornou público o artigo votado só em 22 de dezembro de 2020, a três dias do Natal, depois de mais de ano de debate público da lei. Debates privados aconteceram em circuitos privados, mas um tema tão relevante, sem amplo debate, querendo ou não fica prejudicado.

Se vetar o texto, ficaremos sem API?

Há um pressuposto de quem defende a redação atual da lei que precisa ser combatido: o argumento de que sem financiamento não há como o governo ofertar APIs (Application Programming Interface, ou interface de programação de aplicação). APIs são uma tecnologia barata, e sua implementação é simples e reduz custos de governo. Dizer que precisamos cobrar da sociedade para ter boas APIs é tecnicamente incorreto.

Uma API nada mais é do que um acesso a dados no qual um computador pode “falar” direto com o outro, e solicitar dados. Todo acesso à dados abertos é automatizado (ninguém manda dados pelos Correios), mas a API é um tipo especial de automatização, na qual um terminal solicita e recebe dados sem interface humana.

O governo tem diversas APIs. A própria OCDE tem um portal só de APIs. APIs são simples, possuem vasta produção de código aberto e padrões amplamente divulgados e disponíveis. Você consegue criar uma API agora se quiser assistindo a um vídeo tutorial de Youtube.

Abrir dados é um processo mais complexo, e mais caro. Mas como APIs no texto da lei só podem ser criadas com dados já abertos e catalogados, esse custo não se aplica ao serviço a ser cobrado. Tanto isso é verdade que se admitirmos que quem cobra pelo serviço está cobrando também para abrir dados, violamos justamente a única garantia imposta pelo legislador.

A API e o Lattes

Um dos grandes motivos do governo ter menos APIs do que poderia é a resistência a abrir dados públicos, e os tornar amplamente acessíveis. Os dados públicos do Lattes são um bom caso para compreendermos esse contexto.

A Plataforma Lattes é uma das poucas no mundo a conseguir que todos os pesquisadores de um país tenham seu currículo publicado e atualizado lá (a União Europeia tentou, e fracassou, em fazer movimento similar). Os dados do Lattes, contudo, têm publicidade limitada, sendo aceito o uso para o cidadão comum (aquele que o legislador quis na redação proteger), e rejeitado o usuário de larga escala (aquele que o legislador quer cobrar).

O Lattes tem a lógica oposta a uma API, impondo o captcha a todos que queiram ver os dados ali publicados. Em teoria, o captcha impediria o acesso automatizado, mantendo apenas o usuário individual ativo. Mas a realidade é outra: não só o captcha usado pode ser burlado com facilidade (ver, por exemplo, o reality da A Fazenda), como os dados teoricamente protegidos pelo captcha são acessados milhares de vezes ao longo do dia, e copiados (basta ver a quantidade de copycats do Lattes, como as diversas plataformas de currículos por aí).

Se o captcha não funciona para o fim pretendido, qual seria o caminho a ser tomado? A criação de uma simples API, que faria exatamente o que é praticado hoje, mas com menor custo e maior segurança jurídica.

Ao evitar o uso de API, o governo paga caro pelo Lattes. Cada uso automatizado no Ministério da Educação é um acesso diferente à página, realizado tantas vezes quanto alguém quiser pegar dados, atualizado quantas vezes for necessário. Se tivermos cadastrados 5 milhões de currículos, e 100 interessados nos dados publicados, temos meio bilhão de acessos em poucas semanas. Não há dados publicados sobre isso, mas a chance é os acessos do Lattes serem basicamente “ataques” automatizados para burlar o captcha.

Se adotasse uma API, o governo iria tomar o caminho inverso, e reduzir cursos. Se todos os 100 interessados baixassem os dados em lote, todo dia, teríamos 3 mil acessos (ao invés de meio bilhão). Ao oferecer dados em lote, reduzimos ainda mais os custos de acesso exploratório aos servidores do MEC, como as múltiplas telas, e combatemos a duplicidade de dados. Ao aceitar buscas externas, movimenta ainda mais a economia e reduzimos o próprio custo com sua ferramenta de busca (que é limitada).

A complexidade dessa API do Lattes é simples, fácil de ser implementada, e não é preciso cobrança adicional para implementá-la. Inclusive, a própria INDA (Infraestrutura Nacional de Dados Abertos), e a equipe de dados abertos do próprio MEC, têm como aconselhar.

A morte do governo como plataforma

Pelo menos dois pareceres que vieram a público explicitam a fragilidade e a inconstitucionalidade do texto aprovado no art. 29 parágrafo 3º.

No parecer impulsionado pela Open Knowledge Foundation, fica claro como a cobrança coloca em risco o preceito da transparência, e de quebra, o controle social do pela sociedade civil organizada e pela imprensa.

No parecer impulsionado por nós (Carta Aberta por um Governo Digital que fomente o uso de Dados Públicos Abertos), fica claro os danos à economia, ao ecossistema de startups, e a violação ao preceito de liberdade econômica e livre concorrência.

Defensores do texto argumentam que a redação do parágrafo poderia ser melhor, e que o texto poderia, contudo, ser aprimorado com regulamentação. Mas parece evidente que com os problemas atuais, a regulação infralegal é insuficiente para conter os riscos e os problemas apontados.

Para quem estuda direito tributário, o pedágio é uma jabuticaba difícil de explicar. Não se enquadra nas categorias do Código Tributário Nacional e, em suma, é um terror para fiscalização. O pedágio existe hoje porque o legislador inseriu esse instrumento no ordenamento jurídico. Hoje temos que ajustar toda a doutrina para remendar o buraco legislativo criado. O resultado é uma dificuldade de promover a economia e de permitir o controle social ao mesmo tempo, o que poderia ser minimizado se ao invés de criar uma jabuticaba, tivéssemos feito melhor uso da técnica legislativa.

Cobrar por acesso a dados abertos no modelo freemium, autorizando que atores em qualquer ente, em qualquer poder, cobre por serviços premium da noite para o dia, é abrir uma caixa de pandora.

Se todos os dados estivessem abertos, o governo criaria APIs competindo de igual para igual com o setor privado. Mas não é essa a realidade, nem é isso que a redação atual exige. Hoje só o governo pode oferecer o serviço premium, e a prática mostra que o governo tem interesse em ampliar essa reserva de mercado.

O texto atual vai criando, sem debate legislativo amplo, uma reserva artificial de mercado para quem vende tecnologia no governo criar produtos que só o governo pode vender. Esse monopólio artificial é contrário ao princípio do PL de governo digital, da Lei de Liberdade Econômica, e da própria constituição.

A resposta ao “porquê desse pedágio” é simples: ele não cabe ali. O que precisamos é de um debate legislativo amplo sobre como financiar a produção de mais e melhores dados abertos. O espírito do legislador foi nobre, mas o texto aprovado, imperfeito. Com isso, o remédio que nos sobra hoje é o veto, e torcer para o debate legislativo revisar o tema quanto antes.

Este artigo foi escrito em parceria com Daniel Marques, diretor executivo da Associação Brasileira de Lawtechs e Legaltechs (AB2L), mestre e doutorando em Filosofia da Ciência e Ética.

Fonte: MIT Sloan

Comentários

Comentários