{"id":14379,"date":"2025-09-13T05:14:21","date_gmt":"2025-09-13T08:14:21","guid":{"rendered":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/2025\/09\/13\/ia-em-exame-europa-impoe-raio-x-dos-dados-de-treinamento\/"},"modified":"2025-09-13T05:14:21","modified_gmt":"2025-09-13T08:14:21","slug":"ia-em-exame-europa-impoe-raio-x-dos-dados-de-treinamento","status":"publish","type":"post","link":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/2025\/09\/13\/ia-em-exame-europa-impoe-raio-x-dos-dados-de-treinamento\/","title":{"rendered":"IA em exame: Europa imp\u00f5e raio-X dos dados de treinamento"},"content":{"rendered":"<p>A partir de 2 de agosto deste ano, provedores de <a href=\"https:\/\/www.jota.info\/tudo-sobre\/intelig%C3%AAncia%20artificial\">intelig\u00eancia artificial<\/a> que operam na <a href=\"https:\/\/www.jota.info\/tudo-sobre\/Uni%C3%A3o%20Europeia\">Uni\u00e3o Europeia<\/a> t\u00eam um novo dever regulat\u00f3rio: tornar vis\u00edvel o que, at\u00e9 ent\u00e3o, permanecia opaco. <a href=\"https:\/\/digital-strategy.ec.europa.eu\/en\/library\/explanatory-notice-and-template-public-summary-training-content-general-purpose-ai-models\" target=\"_blank\" rel=\"noopener\">Em nota t\u00e9cnica publicada em 24 de julho<\/a>, a Comiss\u00e3o Europeia apresentou um modelo obrigat\u00f3rio de divulga\u00e7\u00e3o p\u00fablica dos dados usados no treinamento de modelos de IA de prop\u00f3sito geral, conforme determina o artigo 53(1)(d) do EU AI Act.<\/p>\n<p>Est\u00e3o no centro dessa nova obriga\u00e7\u00e3o os grandes modelos de linguagem (LLMs) e os modelos multimodais, capazes de realizar m\u00faltiplas tarefas sem uma finalidade espec\u00edfica predefinida. A regra se aplica a todos os modelos de IA de prop\u00f3sito geral, inclusive os de c\u00f3digo aberto, desde que acessados, implantados ou distribu\u00eddos no mercado europeu.<\/p>\n<h3><a href=\"https:\/\/www.jota.info\/produtos\/poder?utm_source=cta-site&amp;utm_medium=site&amp;utm_campaign=campanha_poder_q2&amp;utm_id=cta_texto_poder_q2_2023&amp;utm_term=cta_texto_poder&amp;utm_term=cta_texto_poder_meio_materias\"><span>Conhe\u00e7a o <span class=\"jota\">JOTA<\/span> PRO Poder, plataforma de monitoramento que oferece transpar\u00eancia e previsibilidade para empresas<\/span><\/a><\/h3>\n<p>Vale mencionar que, embora a exig\u00eancia entre em vigor em 2025, a fiscaliza\u00e7\u00e3o pela autoridade europeia ter\u00e1 in\u00edcio apenas em 2026. J\u00e1 os modelos lan\u00e7ados antes de agosto de 2025 poder\u00e3o cumprir a exig\u00eancia at\u00e9 2027, desde que justifiquem eventuais lacunas, caso n\u00e3o consigam apresentar todas as informa\u00e7\u00f5es.<\/p>\n<p>O <em>template<\/em> publicado pelo <em>AI Office<\/em> define uma estrutura de relat\u00f3rio padronizada. Os desenvolvedores dever\u00e3o descrever as modalidades de dados utilizadas (texto, imagem, v\u00eddeo ou \u00e1udio), as propor\u00e7\u00f5es de cada tipo de conte\u00fado, os principais conjuntos de dados empregados no treinamento (inclusive bases p\u00fablicas, privadas, sint\u00e9ticas e raspadas da internet), al\u00e9m da indica\u00e7\u00e3o de nomes de dom\u00ednios utilizados como fontes. Tamb\u00e9m h\u00e1 campos espec\u00edficos que exigem informa\u00e7\u00f5es sobre o uso de dados de usu\u00e1rios, a incorpora\u00e7\u00e3o de outros modelos (e suas respectivas licen\u00e7as), al\u00e9m de aspectos relacionados \u00e0 remo\u00e7\u00e3o de conte\u00fados il\u00edcitos e respeito a direitos autorais.<\/p>\n<p>Apesar de n\u00e3o exigir a divulga\u00e7\u00e3o completa e t\u00e9cnica dos <em>datasets<\/em>, alegando a necessidade de proteger segredos comerciais, a regra demanda um resumo \u201csuficientemente detalhado\u201d apresentado em linguagem narrativa, preenchido pelas pr\u00f3prias empresas desenvolvedoras. A aus\u00eancia de par\u00e2metros t\u00e9cnicos claros, no entanto, abre margem para distor\u00e7\u00f5es: relat\u00f3rios excessivamente gen\u00e9ricos, redigidos sob cautela jur\u00eddica, ou descri\u00e7\u00f5es t\u00e9cnicas pouco acess\u00edveis, de utilidade limitada para o p\u00fablico. Em vez de ampliar a transpar\u00eancia, o modelo pode acabar diluindo seu pr\u00f3prio prop\u00f3sito.<\/p>\n<p>A obriga\u00e7\u00e3o tamb\u00e9m imp\u00f5e desafios significativos para quem atua globalmente. A fragmenta\u00e7\u00e3o regulat\u00f3ria, somada \u00e0 aus\u00eancia de crit\u00e9rios uniformes, tende a aumentar o custo jur\u00eddico e operacional para provedores que mant\u00eam bases de dados historicamente constru\u00eddas, com fontes mistas, incompletas ou parcialmente p\u00fablicas. Em vez de favorecer a previsibilidade, o modelo regulat\u00f3rio da UE pode gerar inseguran\u00e7a e incentivando estrat\u00e9gias defensivas por modelos emergentes.<\/p>\n<p>A cr\u00edtica \u00e0 ret\u00f3rica de que os dados \u201cestavam dispon\u00edveis publicamente na internet\u201d \u00e9 leg\u00edtima. Mas a resposta regulat\u00f3ria proposta parece mais simb\u00f3lica do que funcional. <a href=\"https:\/\/www.stanventures.com\/news\/major-websites-block-openais-gptbot-amid-privacy-concerns-521\/?utm_source=chatgpt.com\">Desde 2023, plataformas como <em>The New York Times<\/em>, Amazon, CNN, Reddit e outras passaram a bloquear bots de coleta, como o GPTBot, demonstrando o inc\u00f4modo crescente com pr\u00e1ticas opacas de coleta.<\/a> A exig\u00eancia europeia, ao transferir integralmente a responsabilidade de explica\u00e7\u00e3o para os desenvolvedores, sem contrapartidas t\u00e9cnicas nem estrutura de valida\u00e7\u00e3o, corre o risco de penalizar quem age de boa-f\u00e9 e deixar intocadas as pr\u00e1ticas mais sens\u00edveis.<\/p>\n<p>No plano jur\u00eddico, a nova obriga\u00e7\u00e3o de transpar\u00eancia se articula com diferentes campos do direito: propriedade intelectual, prote\u00e7\u00e3o de dados pessoais, responsabilidade civil e regula\u00e7\u00e3o algor\u00edtmica. Em tese, contribui para o <em>enforcement<\/em> de direitos, permitindo que titulares identifiquem usos n\u00e3o autorizados de suas obras ou que usu\u00e1rios questionem o tratamento indevido de dados pessoais. Na pr\u00e1tica, no entanto, transfere a carga da transpar\u00eancia para os desenvolvedores, criando uma obriga\u00e7\u00e3o mal calibrada, de dif\u00edcil aplica\u00e7\u00e3o e pouco adaptada \u00e0 complexidade dos modelos modernos.<\/p>\n<p>Nesse contexto, \u00e9 interessante pontuar o surgimento de discuss\u00f5es acerca da anonimiza\u00e7\u00e3o dos dados antes do treinamento de modelos de IA. Para alguns, essa seria uma forma eficaz de reduzir tens\u00f5es entre inova\u00e7\u00e3o e prote\u00e7\u00e3o de direitos. Isto porque, se for poss\u00edvel a desidentifica\u00e7\u00e3o definitiva durante a fase de prepara\u00e7\u00e3o \u2014 eliminando qualquer possibilidade razo\u00e1vel de determina\u00e7\u00e3o individual \u2014, toda a discuss\u00e3o sobre exerc\u00edcio de direitos de privacidade se torna, na pr\u00e1tica, irrelevante, tornando desnecess\u00e1rias obriga\u00e7\u00f5es como atender pedidos individuais de titulares e manter mecanismos complexos de rastreabilidade, ao mesmo tempo em que preservaria a conformidade com a legisla\u00e7\u00e3o de prote\u00e7\u00e3o de dados.<\/p>\n<p>Ainda assim, a aus\u00eancia de diretrizes t\u00e9cnicas claras n\u00e3o apenas compromete a efetividade da obriga\u00e7\u00e3o como tamb\u00e9m pode gerar efeitos colaterais indesejados. Um dos riscos mais evidentes \u00e9 que o resumo p\u00fablico acabe se convertendo em barreira \u00e0 inova\u00e7\u00e3o.<\/p>\n<p>O pr\u00f3prio EU AI Act \u00e9 claro ao estabelecer que o resumo n\u00e3o deve ser tecnicamente exaustivo, tampouco exigir a exposi\u00e7\u00e3o completa dos dados brutos, justamente para preservar a competitividade e evitar abusos. Essa cautela \u00e9 particularmente relevante para modelos desenvolvidos por institui\u00e7\u00f5es acad\u00eamicas, pesquisadores independentes e <em>startups<\/em>, que poderiam ser desproporcionalmente afetados por exig\u00eancias excessivamente burocr\u00e1ticas.<\/p>\n<h3><a href=\"https:\/\/conteudo.jota.info\/marketing-lp-newsletter-ultimas-noticias?utm_source=jota&amp;utm_medium=lp&amp;utm_campaign=23-09-2024-jota-lp-eleicoes-2024-eleicoes-2024-none-audiencias-none&amp;utm_content=eleicoes-2024&amp;utm_term=none\"><span>Assine gratuitamente a newsletter \u00daltimas Not\u00edcias do <span class=\"jota\">JOTA<\/span> e receba as principais not\u00edcias jur\u00eddicas e pol\u00edticas do dia no seu email<\/span><\/a><\/h3>\n<p>Sem apoio t\u00e9cnico, prazo realista de adapta\u00e7\u00e3o ou diretrizes pr\u00e1ticas suficientemente claras, a regra pode gerar mais ru\u00eddo do que seguran\u00e7a. N\u00e3o se trata de negar a import\u00e2ncia da transpar\u00eancia, mas de reconhecer que o modelo escolhido imp\u00f5e obriga\u00e7\u00f5es complexas com base em par\u00e2metros subjetivos, com risco de interpreta\u00e7\u00f5es desiguais e impactos desproporcionais.<\/p>\n<p>Trata-se de um raio-X regulat\u00f3rio exigente \u2014 e, para muitos, desconfort\u00e1vel. A nova obriga\u00e7\u00e3o imp\u00f5e aos desenvolvedores uma responsabilidade ampla, sem crit\u00e9rios objetivos e sem coordena\u00e7\u00e3o internacional. Em vez de promover transpar\u00eancia, o modelo pode gerar incertezas, desigualdades na aplica\u00e7\u00e3o e barreiras \u00e0 entrada de novos agentes. Resta saber se esse esfor\u00e7o trar\u00e1 mais <em>accountability<\/em> ou se ampliar\u00e1 a dist\u00e2ncia entre reguladores e quem desenvolve a tecnologia \u2014 com o risco real de sufocar a inova\u00e7<\/p>","protected":false},"excerpt":{"rendered":"<p>A partir de 2 de agosto deste ano, provedores de intelig\u00eancia artificial que operam na Uni\u00e3o Europeia t\u00eam um novo dever regulat\u00f3rio: tornar vis\u00edvel o que, at\u00e9 ent\u00e3o, permanecia opaco. Em nota t\u00e9cnica publicada em 24 de julho, a Comiss\u00e3o Europeia apresentou um modelo obrigat\u00f3rio de divulga\u00e7\u00e3o p\u00fablica dos dados usados no treinamento de modelos [&hellip;]<\/p>\n","protected":false},"author":0,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts\/14379"}],"collection":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/types\/post"}],"replies":[{"embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/comments?post=14379"}],"version-history":[{"count":0,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts\/14379\/revisions"}],"wp:attachment":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/media?parent=14379"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/categories?post=14379"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/tags?post=14379"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}