{"id":8788,"date":"2025-01-31T22:34:21","date_gmt":"2025-02-01T01:34:21","guid":{"rendered":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/2025\/01\/31\/desafios-e-oportunidades-da-4a-onda-de-dados-abertos\/"},"modified":"2025-01-31T22:34:21","modified_gmt":"2025-02-01T01:34:21","slug":"desafios-e-oportunidades-da-4a-onda-de-dados-abertos","status":"publish","type":"post","link":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/2025\/01\/31\/desafios-e-oportunidades-da-4a-onda-de-dados-abertos\/","title":{"rendered":"Desafios e oportunidades da 4\u00aa onda de dados abertos"},"content":{"rendered":"<p>Nos \u00faltimos anos, as discuss\u00f5es sobre uso de dados abertos e prote\u00e7\u00e3o de dados t\u00eam ganhado novos contornos. Ao redor do mundo e no Brasil, para al\u00e9m da abertura dos dados e solidifica\u00e7\u00e3o de pol\u00edticas de transpar\u00eancia por alguns setores de governos (quest\u00e3o ainda n\u00e3o totalmente superada), continua-se a discutir a compatibilidade de pol\u00edticas de abertura com normas e modelos de governan\u00e7a de prote\u00e7\u00e3o de dados. Com a populariza\u00e7\u00e3o dos modelos de <a href=\"http:\/\/jota.info\/tudo-sobre\/inteligencia-artificial\">intelig\u00eancia artificial<\/a>, h\u00e1 incremento desses desafios e tamb\u00e9m de potenciais oportunidades.<\/p>\n<p>Em 2020 (Verhulst et al., 2020), houve publica\u00e7\u00e3o de artigo que prop\u00f4s uma organiza\u00e7\u00e3o te\u00f3rica de tend\u00eancias relacionadas \u00e0 abertura de dados ao longo do tempo a partir de ondas. Afirmou-se que o mundo teria vivido tr\u00eas ondas de abertura de dados e, naquele momento, encontravam-se em meio \u00e0 terceira.<\/p>\n<h3><a href=\"https:\/\/conteudo.jota.info\/marketing-lp-newsletter-ultimas-noticias?utm_source=jota&amp;utm_medium=lp&amp;utm_campaign=23-09-2024-jota-lp-eleicoes-2024-eleicoes-2024-none-audiencias-none&amp;utm_content=eleicoes-2024&amp;utm_term=none\"><span>Assine gratuitamente a newsletter \u00daltimas Not\u00edcias do <span class=\"jota\">JOTA<\/span> e receba as principais not\u00edcias jur\u00eddicas e pol\u00edticas do dia no seu email<\/span><\/a><\/h3>\n<p>Importante destacar que por mais que novas ondas cheguem, pode ser que determinados setores ainda vivam problemas relacionados \u00e0s ondas anteriores, ou seja, o fato de haver uma nova onda n\u00e3o significa que houve esgotamento dos desafios passados.<\/p>\n<p>Resumidamente, a primeira onda foi marcada pela conscientiza\u00e7\u00e3o da import\u00e2ncia da liberdade informacional e da exist\u00eancia de dados abertos (independente do n\u00edvel de abertura); na segunda, houve foco em governos abertos e sua import\u00e2ncia para regimes democr\u00e1ticos; na terceira, falou-se bastante sobre formas e possibilidades de re\u00faso de dados, al\u00e9m da import\u00e2ncia de dados de certas organiza\u00e7\u00f5es tamb\u00e9m estarem dispon\u00edveis para alguns p\u00fablicos e da forma\u00e7\u00e3o de parcerias entre sociedade civil, entes p\u00fablicos e privados.<\/p>\n<p>Em outras palavras, parte da discuss\u00e3o da terceira onda estaria relacionada \u00e0 constru\u00e7\u00e3o e ado\u00e7\u00e3o de modelos de governan\u00e7a que permitam certos tipos de re\u00faso de dados.<\/p>\n<p>Em 2024, outro artigo (Hannah et al, 2024) indicou que modelos de intelig\u00eancia artificial, especialmente grandes modelos de linguagem (large language models \u2013 LLMs) poderiam inaugurar uma \u201cquarta onda\u201d de dados abertos.<\/p>\n<p>De pronto, j\u00e1 podemos imaginar que isso traz mais camadas de complexidade \u00e0 discuss\u00e3o, visto que h\u00e1 ainda v\u00e1rios pontos em aberto referentes a outras ondas. Dentre algumas possibilidades, discute-se se o uso de certos dados abertos para treino seriam ben\u00e9ficos para modelos, visto que s\u00e3o dados mais confi\u00e1veis e n\u00e3o haveria tantos dados imprecisos \u00e0s vezes referidos como \u201clixo\u201d por alguns profissionais.<\/p>\n<p>Isso economizaria recursos (inclusive o gasto energ\u00e9tico, que \u00e9 um dos principais pontos de aten\u00e7\u00e3o relativos ao desenvolvimento de modelos de linguagem de IA, mesmo com o surgimento de novos modelos que, em tese, exigem um poder computacional menor) e poderia diminuir a possibilidade de alucina\u00e7\u00f5es em certos casos. Ainda, modelos de IAs poderiam contribuir para an\u00e1lises e insights a partir de dados abertos de maneira mais r\u00e1pida.<\/p>\n<p>Nesse contexto, faz-se necess\u00e1rio relembrar que a express\u00e3o \u201cdados abertos\u201d \u00e9 utilizada para se referir a dados (pessoais ou n\u00e3o) acess\u00edveis ao p\u00fablico geral. As discuss\u00f5es sobre dados abertos foram fundamentais para construir o conceito de \u201cgoverno aberto\u201d, no qual h\u00e1 incentivos para a abertura e transpar\u00eancia de dados estrat\u00e9gicos e de interesse p\u00fablico, principalmente dos governos (Sabo et al. 2020).<\/p>\n<p>A utiliza\u00e7\u00e3o desses dados permite que haja uma presta\u00e7\u00e3o de contas mais eficiente, al\u00e9m do aumento da accountability das institui\u00e7\u00f5es. Como pontua Daniel Solove, desde meados do s\u00e9culo 20, v\u00ea-se desenvolvimento consider\u00e1vel de dados p\u00fablicos, tanto na diversidade de tais dados como tamb\u00e9m na forma de sua disponibiliza\u00e7\u00e3o \u00e0 popula\u00e7\u00e3o (Solove et al.2002)<\/p>\n<p>Quando falamos de \u201cdados p\u00fablicos\u201d, o termo pode vir acompanhado de uma premissa equivocada de que n\u00e3o haveria implica\u00e7\u00f5es de privacidade sobre tais dados, j\u00e1 que s\u00e3o \u201cp\u00fablicos\u201d. O que n\u00e3o \u00e9 o caso. A grande quest\u00e3o \u00e9 que a privacidade n\u00e3o necessariamente \u00e9 violada quando se divulga determinado dado. Ela \u00e9 violada quando h\u00e1 a divulga\u00e7\u00e3o de determinado dado de forma inapropriada, com descumprimento do que chamado \u201cfluxo informacional\u201d.<\/p>\n<p>Neste ponto \u00e9 importante trazermos o conceito de \u201cintegridade contextual\u201d, que consiste em assegurar com que a informa\u00e7\u00e3o flua de maneira apropriada, respeitando-se o \u201ccontexto\u201d em que sua divulga\u00e7\u00e3o \u00e9 feita, as expectativas leg\u00edtimas de divulga\u00e7\u00e3o de determinada informa\u00e7\u00e3o pelo titular da mesma e at\u00e9 mesmo normas locais. Ao juntarmos os desafios ainda vividos das ondas anteriores com LLMs e a populariza\u00e7\u00e3o da intelig\u00eancia artificial, o conceito de integridade contextual ganha contornos ainda maiores.<\/p>\n<p>Em um mundo ideal da acessibilidade e de dados abertos, n\u00e3o basta que os dados estejam acess\u00edveis, \u00e9 preciso que eles possam ser lidos e interpretados mais facilmente por m\u00e1quinas. Por exemplo, um PDF, apesar de ser um documento eletr\u00f4nico, \u00e9 um formato que necessita grande esfor\u00e7o para ser convertido e lido por m\u00e1quina, de forma que h\u00e1 mais dificuldade de acesso em informa\u00e7\u00f5es contidas em PDFs em compara\u00e7\u00e3o com outros formatos.<\/p>\n<p>Embora seja leg\u00edtima uma preocupa\u00e7\u00e3o com a compatibilidade entre transpar\u00eancia e prote\u00e7\u00e3o de dados, \u00e9 importante ressaltar que a melhoria no formato de disponibiliza\u00e7\u00e3o das informa\u00e7\u00f5es n\u00e3o significa que os dados podem ser utilizados por terceiros de qualquer maneira, tampouco pode ser motivo para impedir o exerc\u00edcio de direitos.<\/p>\n<p>Bioni et al (2022) descreve esse conflito aparente no Brasil e traz casos em que foram negados pedidos leg\u00edtimos de acesso a dados de interesse p\u00fablico, com um suposto fundamento na <a href=\"https:\/\/www.jota.info\/tudo-sobre\/lgpd\">Lei Geral de Prote\u00e7\u00e3o de Dados<\/a> (Lei 13.709\/2018), prejudicando, ao fim, o exerc\u00edcio do direito de acesso \u00e0 informa\u00e7\u00e3o.<\/p>\n<p>Em suma, a chegada da quarta onda traz suas pr\u00f3prias quest\u00f5es relacionadas \u00e0 governan\u00e7a e tamb\u00e9m prote\u00e7\u00e3o de dados, visto que, como j\u00e1 mencionado, ainda h\u00e1 discuss\u00f5es muito vivas e pertinentes da terceira onda, inclusive aquela relativa \u00e0 \u201clicen\u00e7a social\u201d, ou seja, em quais situa\u00e7\u00f5es seria leg\u00edtimo o re\u00faso dos dados. E o \u201cre\u00faso dos dados\u201d quando falamos de LLMs ganha uma nova dimens\u00e3o.<\/p>\n<p>Ainda, \u00e9 preciso considerar que os modelos de IA sozinhos n\u00e3o v\u00e3o resolver todos os problemas ou avan\u00e7ar a discuss\u00e3o de maneira autom\u00e1tica. Nesse novo cen\u00e1rio, o controle de qualidade dos dados, assim como o zelo pelo atendimento aos direitos de privacidade dos titulares de dados, se faz ainda mais necess\u00e1rio para a constru\u00e7\u00e3o de solu\u00e7\u00f5es mais assertivas e respons\u00e1veis.<\/p>\n<p>A pr\u00f3pria LGPD traz algumas pistas e elementos importantes para a governan\u00e7a de dados pessoais, e oferece alguns elementos para entendermos quais tipos de dados teriam uma licen\u00e7a social mais forte para re\u00faso e de quais tipos de re\u00faso estar\u00edamos falando.<\/p>\n<p>Em primeiro lugar, a LGPD se aplica aos dados abertos que tamb\u00e9m s\u00e3o dados pessoais (o que nem sempre \u00e9 a mesma coisa). Consideramos que as principais orienta\u00e7\u00f5es em rela\u00e7\u00e3o a esses dados abertos, em sentido bem amplo, est\u00e3o contidas no art. 7\u00ba, \u00a7\u00a7s 3\u00ba e 4\u00ba.<\/p>\n<p>No \u00a73\u00ba, temos dados pessoais cujo acesso \u00e9 p\u00fablico, e o \u00a74\u00ba refere-se a dados que s\u00e3o tornados manifestamente p\u00fablicos pelos seus titulares. No caso dos dados descritos no \u00a73\u00ba, consideramos que s\u00e3o dados p\u00fablicos propriamente ditos, ou seja, aqueles geralmente disponibilizados por institui\u00e7\u00f5es p\u00fablicas. Tanto \u00e9 que o pr\u00f3prio \u00a73\u00ba j\u00e1 indica que, antes de qualquer an\u00e1lise, deve-se considerar para tratamento a finalidade, a boa-f\u00e9 e o interesse p\u00fablico que justificaram sua disponibiliza\u00e7\u00e3o original.<\/p>\n<p>J\u00e1 os dados pessoais do \u00a74\u00ba s\u00e3o geralmente dados que o pr\u00f3prio titular disponibiliza, podendo ser considerado dado pessoal de rede social aberta, por exemplo. Ao nosso ver, s\u00e3o exemplos de como a LGPD tenta endere\u00e7ar o conceito de integridade contextual quando do tratamento de dados p\u00fablicos.<\/p>\n<p>No \u00a7 7\u00ba, a lei determina que esses dois tipos de dados poder\u00e3o ter tratamento posterior para novas finalidades (em outras palavras, re\u00faso) desde que sejam observados prop\u00f3sitos leg\u00edtimos e espec\u00edficos para o novo tratamento, preserva\u00e7\u00e3o dos direitos dos titulares e os demais princ\u00edpios e fundamentos colocados pela lei. Isso garante que os dados pessoais a que se referem os \u00a7\u00a7 3\u00ba e 4\u00ba poder\u00e3o ser tratados para novas finalidades, desde que observados os requisitos previstos pela LGPD.<\/p>\n<p>No Brasil, portanto, a Lei Geral de Prote\u00e7\u00e3o de Dados tenta oferecer um <em>framework<\/em> e condi\u00e7\u00f5es para re\u00faso dos dados, tal qual ocorreu em outros lugares que viveram momentos de terceira onda de dados abertos. Dessa forma, muito da \u201clicen\u00e7a social\u201d do uso desses dados, quando tratam-se de dados pessoais, est\u00e1 atrelada tamb\u00e9m a uma an\u00e1lise de compatibilidade das condi\u00e7\u00f5es trazidas pela LGPD e por outras legisla\u00e7\u00f5es pertinentes. Vemos aqui tamb\u00e9m uma relevante preocupa\u00e7\u00e3o da LGPD com a privacidade dos dados p\u00fablicos.<\/p>\n<p>Apesar de ambos terem condi\u00e7\u00f5es parecidas de tratamento similares, a nossa hip\u00f3tese \u00e9 de que \u00e9 mais claro o interesse p\u00fablico dos dados disponibilizados por institui\u00e7\u00f5es p\u00fablicas, do caso dos dados pessoa<span>is descritos no \u00a73\u00ba. Isso porque, al\u00e9m da LGPD, h\u00e1 diversas leis que determinam a transpar\u00eancia e interesse p\u00fablico de dados referentes \u00e0 administra\u00e7\u00e3o p\u00fablica. Havendo controles e boa governan\u00e7a, \u00e9 mais dif\u00edcil perder o contexto no qual os dados foram disponibilizados.<\/span><\/p>\n<p>No caso dos dados disponibilizados pelo titular, nem sempre \u00e9 claro ou menos amb\u00edguo qual foi o interesse p\u00fablico relativo \u00e0queles dados, al\u00e9m dos prop\u00f3sitos leg\u00edtimos. Em rela\u00e7\u00e3o aos dados abertos, por sua vez, o conceito de leg\u00edtimo est\u00e1 mais atrelado \u00e0 cumprir com a lei, e n\u00e3o uma legitimidade mais abstrata e subjetiva.<\/p>\n<p>Quando consideramos a aproxima\u00e7\u00e3o da quarta onda e da intelig\u00eancia artificial, conforme j\u00e1 tratamos anteriormente, os dados p\u00fablicos do \u00a73\u00ba t\u00eam mais chances de estarem \u201ccorretos\u201d e precisos, o que j\u00e1 \u00e9 uma vantagem e uma seguran\u00e7a para a realiza\u00e7\u00e3o de algumas opera\u00e7\u00f5es. Al\u00e9m disso, ao observarmos o <em>framework<\/em> regulat\u00f3rio, nota-se mais seguran\u00e7a jur\u00eddica em rela\u00e7\u00e3o ao uso de tais dados \u2013 no Brasil, tanto na LGPD quanto nas demais normas que organizam a abertura de dados no pa\u00eds, como a Lei de Acesso \u00e0 Informa\u00e7\u00e3o (Lei 12.527\/2011) \u2013, embora o tema ainda gere diverg\u00eancias.<\/p>\n<p>Por isso, \u00e9 fundamental acompanhar de perto essa discuss\u00e3o e seu desenvolvimento. As reflex\u00f5es ligadas \u00e0 legitimidade da \u201clicen\u00e7a social\u201d para o uso de certos dados tamb\u00e9m se aplicam aos re\u00fasos relacionados \u00e0 IA e, n\u00e3o devendo se limitar aos aspectos jur\u00eddicos, vai continuar a exigir a ado\u00e7\u00e3o de certas salvaguardas, inclusive em rela\u00e7\u00e3o a quest\u00f5es \u00e9ticas. A IA tem o potencial de encurtar certos processos que dependiam muito do esfor\u00e7o humano repetitivo e mon\u00f3tono, mas n\u00e3o significa que vai conseguir fazer tudo sozinha.<\/p>\n<p>Entendemos que a comunidade de privacidade de dados desempenhar\u00e1 um papel crucial no impulso ao uso e ao desenvolvimento sustent\u00e1vel da IA, baseando-se no <em>framework<\/em> da LGPD e em outras normas relevantes para garantir que a privacidade dos titulares seja respeitada, inclusive no caso de dados p\u00fablicos.<\/p>\n<p>Por fim, vemos tamb\u00e9m a necessidade de um per\u00edodo de adapta\u00e7\u00e3o e aprendizado por parte dos titulares dos dados. O que, em 2010, poderia ser considerado uma expectativa leg\u00edtima sobre a divulga\u00e7\u00e3o de determinadas informa\u00e7\u00f5es, ou o que se entendia como n\u00e3o leg\u00edtimo, n\u00e3o \u00e9 necessariamente o mesmo hoje. Um exemplo claro disso \u00e9 o universo dos dados processuais, onde observamos um acesso cada vez mais democr\u00e1tico \u00e0s informa\u00e7\u00f5es, impulsionado tanto por iniciativas do pr\u00f3prio Conselho Nacional de Justi\u00e7a (CNJ), como a cria\u00e7\u00e3o do Datajud, quanto pelo crescimento do ecossistema de legal techs no Brasil.<\/p>\n<p class=\"jota-article__reference\">BIONI, B. R; da SILVA, P. G. F.; MARTINS, P. B. L. Intersec\u00e7\u00f5es e rela\u00e7\u00f5es entre a Lei Geral de Prote\u00e7\u00e3o de Dados (LGPD) e a Lei de Acesso \u00e0 Informa\u00e7\u00e3o (LAI): an\u00e1lise contextual pela lente do direito de acesso. Cadernos T\u00e9cnicos\u00a0 da CGU, Bras\u00edlia, Volume I. 2022. Dispon\u00edvel em: <a href=\"https:\/\/revista.cgu.gov.br\/Cadernos_CGU\/article\/view\/504\">https:\/\/revista.cgu.gov.br\/Cadernos_CGU\/article\/view\/504<\/a><\/p>\n<p class=\"jota-article__reference\">HANNAH, C.; SAMPRITI, S.; STEFAAN, G. V. A Fourth Wave of Open Data? Exploring the Spectrum of scenarios for Open Data and generative AI. 2024. Dispon\u00edvel em: <a href=\"http:\/\/arxiv.org\/abs\/2405.04333\">http:\/\/arxiv.org\/abs\/2405.04333<\/a><\/p>\n<p class=\"jota-article__reference\">MAIER-RABLER, Ursula; HUBER, Stefan. \u201cOpen\u201d: The Changing Relation Between Citizens, Public Administration, and Political Authority. JeDEM \u2013 eJournal of eDemocracy and Open Government, v. 3, n. 2, p. 182-191, 2012<\/p>\n<p class=\"jota-article__reference\">MARTIN, K. E.; NISSENBAUM, H. Privacy Interests In Public Records: An Empirical Investigation. Harvard Journal of Law &amp; Technology, Julho 2017. Dispon\u00edvel em: <a href=\"https:\/\/dx.doi.org\/10.2139\/ssrn.2875720\">http:\/\/dx.doi.org\/10.2139\/ssrn.2875720<\/a><\/p>\n<p class=\"jota-article__reference\">VERHULST, S et al. The emergence of a third wave of open data: How to accelerate the re-use of data for public interest purposes while ensuring data rights and community flourishing. SSRN Electronic Journal, 2020. Dispon\u00edvel em: <a href=\"https:\/\/dx.doi.org\/10.2139\/ssrn.3937638\">http:\/\/dx.doi.org\/10.2139\/ssrn.3937638<\/a><\/p>\n<p class=\"jota-article__reference\">SABO, I. C. et al. Entraves ao governo aberto na Justi\u00e7a Federal brasileira. Revista Direito GV, v. 16, n. 1, p. E1950, 2020<\/p>\n<p class=\"jota-article__reference\">SOLOVE, D. J. Access and Aggregation: Privacy, Public Records, and the Constitution. MINNESOTA LAW REVIEW, 2002. Dispon\u00edvel em: <a href=\"https:\/\/scholarship.law.gwu.edu\/cgi\/viewcontent.cgi?article=2079&amp;context=faculty_publications\">https:\/\/scholarship.law.gwu.edu\/cgi\/viewcontent.cgi?article=2079&amp;context=faculty_publications<\/a><\/p>","protected":false},"excerpt":{"rendered":"<p>Nos \u00faltimos anos, as discuss\u00f5es sobre uso de dados abertos e prote\u00e7\u00e3o de dados t\u00eam ganhado novos contornos. Ao redor do mundo e no Brasil, para al\u00e9m da abertura dos dados e solidifica\u00e7\u00e3o de pol\u00edticas de transpar\u00eancia por alguns setores de governos (quest\u00e3o ainda n\u00e3o totalmente superada), continua-se a discutir a compatibilidade de pol\u00edticas de [&hellip;]<\/p>\n","protected":false},"author":0,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts\/8788"}],"collection":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/types\/post"}],"replies":[{"embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/comments?post=8788"}],"version-history":[{"count":0,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts\/8788\/revisions"}],"wp:attachment":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/media?parent=8788"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/categories?post=8788"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/tags?post=8788"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}