{"id":18807,"date":"2025-12-01T07:07:14","date_gmt":"2025-12-01T10:07:14","guid":{"rendered":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/2025\/12\/01\/o-moinho-de-obras-autorais-no-treinamento-de-ia-generativa\/"},"modified":"2025-12-01T07:07:14","modified_gmt":"2025-12-01T10:07:14","slug":"o-moinho-de-obras-autorais-no-treinamento-de-ia-generativa","status":"publish","type":"post","link":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/2025\/12\/01\/o-moinho-de-obras-autorais-no-treinamento-de-ia-generativa\/","title":{"rendered":"O moinho de obras autorais no treinamento de IA generativa"},"content":{"rendered":"<p>H\u00e1 viola\u00e7\u00e3o autoral pelo uso de obras para treinamento de modelos de intelig\u00eancia artificial generativa em autoriza\u00e7\u00e3o pr\u00e9via? Trata-se de uma das quest\u00f5es jur\u00eddicas mais pol\u00eamicas no campo de direitos de autor e de regula\u00e7\u00e3o da IA.<\/p>\n<p>Diversas a\u00e7\u00f5es judiciais foram propostas nos \u00faltimos anos, no Brasil e no exterior, para exigir indeniza\u00e7\u00e3o autoral contra desenvolvedores de IAG, em diferentes modalidades de conte\u00fado, como texto, \u00e1udio e imagens. Poucas a\u00e7\u00f5es chegaram a uma decis\u00e3o e algumas resultaram em acordos, sem an\u00e1lise do m\u00e9rito.<a href=\"https:\/\/www.jota.info\/#_ftn1\">[1]<\/a><\/p>\n<p class=\"jota-cta\"><a href=\"https:\/\/www.jota.info\/produtos\/poder?utm_source=cta-site&amp;utm_medium=site&amp;utm_campaign=campanha_poder_q2&amp;utm_id=cta_texto_poder_q2_2023&amp;utm_term=cta_texto_poder&amp;utm_term=cta_texto_poder_meio_materias\"><span>Conhe\u00e7a o <span class=\"jota\">JOTA<\/span> PRO Poder, plataforma de monitoramento que oferece transpar\u00eancia e previsibilidade para empresas<\/span><\/a><\/p>\n<p>O <a href=\"https:\/\/www25.senado.leg.br\/web\/atividade\/materias\/-\/materia\/157233\">PL 2338\/2023<\/a>, que prop\u00f5e a regula\u00e7\u00e3o da IA no Brasil, imp\u00f5e aos desenvolvedores obriga\u00e7\u00f5es de identifica\u00e7\u00e3o de obras protegidas na base de treinamento, de gest\u00e3o de consentimento e remunera\u00e7\u00e3o a autores. Se n\u00e3o diz explicitamente, praticamente pressup\u00f5e direitos autorais a serem exercidos nesse uso computacional de obras protegidas.<\/p>\n<p>Mas est\u00e1 correto esse pressuposto?<\/p>\n<p>A Lei de Direitos Autorais brasileira (<a href=\"https:\/\/www.planalto.gov.br\/ccivil_03\/leis\/l9610.htm\">Lei 9.610\/1998<\/a>) estabelece que \u201c<em>depende de autoriza\u00e7\u00e3o pr\u00e9via e expressa do autor a utiliza\u00e7\u00e3o da obra\u201d (art. 29, caput) <\/em>para<em>, reprodu\u00e7\u00e3o parcial ou integral (I), sua \u201cinclus\u00e3o em base de dados\u201d (IX) ou \u201carmazenamento em computador\u201d e \u201cquaisquer outras modalidades de utiliza\u00e7\u00e3o existentes ou que venham a ser inventadas\u201d (X).<\/em><\/p>\n<p>Tal previs\u00e3o parece ampla o suficiente para implicar prote\u00e7\u00e3o, mas o que passa desapercebido em leituras apressadas \u00e9 que o art. 29 se refere \u00e0 utiliza\u00e7\u00e3o <em>da obra autoral<\/em>. E aqui h\u00e1 uma sutileza t\u00e9cnica fundamental.<\/p>\n<p>O objeto de prote\u00e7\u00e3o do direito autoral, a obra art\u00edstica ou liter\u00e1ria, \u00e9 a express\u00e3o individual de uma ideia pelo autor, materializada em determinado suporte. Essa <em>express\u00e3o individualizada<\/em> forma o conte\u00fado de uma comunica\u00e7\u00e3o entre autor e p\u00fablico,<a href=\"https:\/\/www.jota.info\/#_ftn2\">[2]<\/a> por meio da obra, comunica\u00e7\u00e3o esta que pressup\u00f5e a <em>possibilidade de apreens\u00e3o de seu sentido<\/em>. <a href=\"https:\/\/www.jota.info\/#_ftn3\">[3]<\/a><\/p>\n<p>Assim, a utiliza\u00e7\u00e3o a que se refere a legisla\u00e7\u00e3o autoral \u00e9 o <em>uso expressivo<\/em> <em>da obra individual<\/em>, com conte\u00fado sem\u00e2ntico, comunicado ou disponibilizado ao p\u00fablico.\u00a0 Se, no campo anal\u00f3gico, o uso dos dados materializados em determinado suporte necessariamente implica uso expressivo da obra, o mesmo n\u00e3o vale para o uso dos dados digitais correspondentes \u00e0 obra.<\/p>\n<p>Na percep\u00e7\u00e3o humana, a detec\u00e7\u00e3o dos dados anal\u00f3gicos e a extra\u00e7\u00e3o de significado \u00e9 <em>imediata<\/em>. Quando um humano competente na linguagem identifica uma sequ\u00eancia de caracteres, apreende seu sentido em uma gram\u00e1tica. Quando percebe amplitudes de ondas sonoras ou vibra\u00e7\u00f5es, capta sons, vozes etc. o que lhe traz entendimento ou emo\u00e7\u00f5es. Quando est\u00e1 diante de obra visual, percebe imediatamente cores, formas, profundidade que permitem a compreens\u00e3o e despertam sensa\u00e7\u00f5es.<\/p>\n<p>Por sua vez, a percep\u00e7\u00e3o e compreens\u00e3o de textos, \u00e1udios, imagens e v\u00eddeos <em>digitalizados<\/em> \u00e9 intermediada pela m\u00e1quina. Os conte\u00fados anal\u00f3gicos s\u00e3o codificados (<em>embedding<\/em>) e podem passar por diferentes formas de <em>processamento l\u00f3gico<\/em>, para ent\u00e3o serem decodificados e projetados para a percep\u00e7\u00e3o humana. O computador n\u00e3o entende, n\u00e3o enxerga, n\u00e3o ouve e n\u00e3o compreende a continuidade do movimento.<\/p>\n<p>Basicamente, o computador representa o mundo em n\u00fameros e os processa sintaticamente, ao passo que o hardware, aliado a equipamentos, decodifica os bits, convertendo n\u00fameros em sinais f\u00edsicos para que o c\u00e9rebro humano os perceba e compreenda seu significado.<\/p>\n<p>Entre a codifica\u00e7\u00e3o em <em>bits<\/em> e a sua decodifica\u00e7\u00e3o, o processamento l\u00f3gico consiste em uma s\u00e9rie de manipula\u00e7\u00f5es sint\u00e1ticas de n\u00fameros bin\u00e1rios, inintelig\u00edvel para humanos. E quando uma obra \u00e9 digitalizada ou \u00e9 produzida digitalmente, os dados digitais correspondentes podem ser processados para promover a proje\u00e7\u00e3o a obra em sua individualidade para percep\u00e7\u00e3o humana, mas podem ser processadas para outras finalidades.<\/p>\n<p>Por exemplo, dados digitais correspondentes a obras art\u00edsticas e liter\u00e1rias podem passar por processos de \u201ccompress\u00e3o\u201d para maior efici\u00eancia em seu armazenamento, c\u00f3pias de seguran\u00e7a, transfer\u00eancia para bases de terceiros para verifica\u00e7\u00e3o de <em>malwares<\/em>, ou restrutura\u00e7\u00e3o de base para aprimorar controle de acessos.<\/p>\n<p>Nessas hip\u00f3teses, os dados digitais correspondentes \u00e0 obra s\u00e3o manipulados sem o prop\u00f3sito de instaurar alguma comunica\u00e7\u00e3o autor-p\u00fablico do sentido individual, n\u00e3o se cogitando a aplica\u00e7\u00e3o de direitos autorais. Note-se, por exemplo, que a Lei de Software (<a href=\"https:\/\/www.planalto.gov.br\/ccivil_03\/leis\/l9609.htm\">Lei 9.609\/1998<\/a>) excepciona explicitamente, em seu art. 6\u00ba, inc. I, a c\u00f3pia de seguran\u00e7a.<\/p>\n<p>Como analisado em profundidade no Relat\u00f3rio <em>Intelig\u00eancia Artificial Generativa: treinamento de direito autoral<\/em>, do Legal Wings Institute,<a href=\"https:\/\/www.jota.info\/#_ftn4\">[4]<\/a> o uso de dados digitais correspondentes a obras protegidas para treinamento de modelos de IAG \u00e9 mais uma forma de processamento l\u00f3gico-computacional que n\u00e3o envolve o seu uso expressivo individual.<\/p>\n<p>Primeiro, porque, na digitaliza\u00e7\u00e3o, temos apenas a manipula\u00e7\u00e3o de n\u00fameros bin\u00e1rios, sem express\u00e3o de sentido ou comunica\u00e7\u00e3o da obra entre autor e p\u00fablico.<\/p>\n<p>Segundo, porque o resultado do processamento l\u00f3gico no treinamento de IAG de prop\u00f3sito geral \u00e9 uma representa\u00e7\u00e3o matem\u00e1tica (estat\u00edstica) do agregado de dados digitalizados, correspondentes a um conjunto de diversas obras, que capta padr\u00f5es gerais, conceitos, estilos, traduzidos em par\u00e2metros com pesos, que n\u00e3o reproduzem, nem armazenam aspectos individuais de cada obra digitalizada usada no treinamento, <a href=\"https:\/\/www.jota.info\/#_ftn5\">[5]<\/a> mas podem ser usados \u2013 na fase de infer\u00eancia por sistemas de IAG baseados naquele modelo \u2013 para gerar conte\u00fados in\u00e9ditos, a partir daqueles par\u00e2metros e pesos.<\/p>\n<p>Assim, na constru\u00e7\u00e3o, em si, do modelo de IAG, n\u00e3o h\u00e1 possibilidade de comunica\u00e7\u00e3o de sentido, nem \u00e9 armazenada ou memorizada a representa\u00e7\u00e3o digital de qualquer obra individual, raz\u00e3o pela qual n\u00e3o h\u00e1 objeto de prote\u00e7\u00e3o autoral.<\/p>\n<p>Cortes norte-americanas t\u00eam usado a doutrina do \u201cfair use\u201d para apontar a aus\u00eancia de uso expressivo da obra.\u00a0 No caso <em>Bartz v. Anthropic <\/em>reconheceu-se que o treinamento do Claude \u00e9 \u201cuso transformativo\u201d pois resulta em produto que cria conte\u00fados e n\u00e3o em c\u00f3pias.<a href=\"https:\/\/www.jota.info\/#_ftn6\">[6]<\/a><\/p>\n<p>J\u00e1 no caso de autores contra a Meta, apesar de se reconhecer uso transformativo, admitiu-se que sistemas de IAG podem \u00a0exercer competi\u00e7\u00e3o com a produ\u00e7\u00e3o humana, exigindo-se, por\u00e9m, demonstra\u00e7\u00e3o de que houve limita\u00e7\u00e3o \u00e0 explora\u00e7\u00e3o econ\u00f4mica pelo autor da <em>obra espec\u00edfica<\/em>.<\/p>\n<p>Outro precedente interessante \u00e9 o caso <em>Vanderhye v. iParadigm<\/em> (2009),<a href=\"https:\/\/www.jota.info\/#_ftn7\">[7]<\/a> em que a corte n\u00e3o reconheceu viola\u00e7\u00e3o autoral no desenvolvimento do software Turnitin para detec\u00e7\u00e3o de pl\u00e1gio, pois o processo computacional de verifica\u00e7\u00e3o <em>\u201cn\u00e3o guardava qualquer rela\u00e7\u00e3o com seu conte\u00fado expressivo\u201d<\/em>.<\/p>\n<p>Uma s\u00e9rie de casos semelhantes de indexa\u00e7\u00e3o de documentos na web ou indexa\u00e7\u00e3o de conte\u00fado de livros encontraram o mesmo desfecho. Na verdade, mais do que limita\u00e7\u00e3o ao exerc\u00edcio de direitos autorais, tais precedentes acabam, em sua fundamenta\u00e7\u00e3o, por apontar verdadeiras exce\u00e7\u00f5es a sua aplica\u00e7\u00e3o.<\/p>\n<p>Essa mesma constata\u00e7\u00e3o de aus\u00eancia de uso expressivo ou reprodu\u00e7\u00e3o da obra propriamente dita foi o fundamento de recente decis\u00e3o adotada pela Corte de Propriedade Intelectual brit\u00e2nica, no caso Getty Images versus Stable Difusion.<a href=\"https:\/\/www.jota.info\/#_ftn8\">[8]<\/a>\u00a0 Segundo a corte, embora o modelo tenha seus par\u00e2metros e pesos alterados pela exposi\u00e7\u00e3o a obras individuais, o mesmo n\u00e3o as armazena, n\u00e3o resultando, por si mesmos, em c\u00f3pias infratoras.<\/p>\n<p class=\"jota-cta\"><a href=\"https:\/\/conteudo.jota.info\/marketing-lp-newsletter-ultimas-noticias?utm_source=jota&amp;utm_medium=lp&amp;utm_campaign=23-09-2024-jota-lp-eleicoes-2024-eleicoes-2024-none-audiencias-none&amp;utm_content=eleicoes-2024&amp;utm_term=none\"><span>Assine gratuitamente a newsletter \u00daltimas Not\u00edcias do <span class=\"jota\">JOTA<\/span> e receba as principais not\u00edcias jur\u00eddicas e pol\u00edticas do dia no seu email<\/span><\/a><\/p>\n<p>Assim, h\u00e1 uma distin\u00e7\u00e3o fundamental entre usos computacionais de obras apenas \u00a0para <em>\u201cos olhos do rob\u00f4\u201d<\/em> e os usos para <em>\u201cos olhos do humano\u201d<\/em>.<a href=\"https:\/\/www.jota.info\/#_ftn9\">[9]<\/a> O tra\u00e7o crucial para a prote\u00e7\u00e3o autoral est\u00e1 em saber se o processamento dos dados resultar\u00e1 ou n\u00e3o na expressividade do sentido da obra individualmente considerada. Caso contr\u00e1rio, para usar met\u00e1fora feliz de SAG, h\u00e1 apenas um <em>\u201cmoinho de dados\u201d<\/em> de puro processamento computacional.<a href=\"https:\/\/www.jota.info\/#_ftn10\">[10]<\/a><\/p>\n<p>E no treinamento de modelos de IAG estamos diante de um moinho de dados digitalizados correspondentes a obras autorais, voltado apenas para os olhos do rob\u00f4, ou seja, para que o rob\u00f4 extraia padr\u00f5es que o capacite a produzir e assistir o humano a produzir obras in\u00e9ditas, e n\u00e3o copiar obras usadas no treinamento. N\u00e3o h\u00e1, especificamente nesse uso, direito autoral a ser protegido.<\/p>\n<p><a href=\"https:\/\/www.jota.info\/#_ftnref1\">[1]<\/a> BRUELL, Alexandra. <em>Amazon to Pay New York Times at Least $20 Million a Year in AI Deal<\/em>. Wall Street Journal. Julho 2025.\u00a0 Dispon\u00edvel em: <a href=\"https:\/\/www.wsj.com\/business\/media\/amazon-to-pay-new-york-times-at-least-20-million-a-year-in-ai-deal-66db8503\">https:\/\/www.wsj.com\/business\/media\/amazon-to-pay-new-york-times-at-least-20-million-a-year-in-ai-deal-66db8503<\/a>. BLOOMBERG.<\/p>\n<p><a href=\"https:\/\/www.jota.info\/#_ftnref2\">[2]<\/a> C\u00c2NDIDO, Ant\u00f4nio. <em>Literatura e Sociedade. <\/em>Editora Nacional, S\u00e3o Paulo, 1965, pp. 44-45.<\/p>\n<p><a href=\"https:\/\/www.jota.info\/#_ftnref3\">[3]<\/a> ASCENS\u00c3O, Jos\u00e9 de Oliveira. <em>Direito Autoral<\/em>. 3. ed. Rio de Janeiro: Renovar, 2007, p. 32-33.<\/p>\n<p><a href=\"https:\/\/www.jota.info\/#_ftnref4\">[4]<\/a> MARANH\u00c3O, Juliano. Intelig\u00eancia artificial generativa: treinamento e direito autoral. <em>Legal Wings Institute<\/em>, 2025. Dispon\u00edvel em: <a href=\"https:\/\/www.legalwings.com.br\/_files\/ugd\/df689d_a82dced9b9934feeaf836bd95212cbf4.pdf\">https:\/\/www.legalwings.com.br\/_files\/ugd\/df689d_a82dced9b9934feeaf836bd95212cbf4.pdf<\/a>. Acesso em: 27.11.2025.<\/p>\n<p><a href=\"https:\/\/www.jota.info\/#_ftnref5\">[5]<\/a>GUADAMUZ, Andr\u00e9s. A scanner darkly: copyright liability and exceptions in artificial intelligence inputs and outputs. <em>Internet Policy Review<\/em>, v. 12, n. 1, 2023. Dispon\u00edvel em: https:\/\/policyreview.info\/articles\/secure\/1771. Acesso em: 27.10.2025<\/p>\n<p><a href=\"https:\/\/www.jota.info\/#_ftnref6\">[6]<\/a> UNITED STATES DISTRICT COURT NORTHERN DISTRICT OF CALIFORNIA. Case 3:24-cv-05417-WHA, Document 231, Filed 06\/23\/25 (<em>Order on Fair Use<\/em>). Dispon\u00edvel em: <a href=\"https:\/\/admin.bakerlaw.com\/wp-content\/uploads\/2025\/07\/ECF-231-Order-on-Fair-Use.pdf\">https:\/\/admin.bakerlaw.com\/wp-content\/uploads\/2025\/07\/ECF-231-Order-on-Fair-Use.pdf<\/a>. Acesso em 26 out. 2025.<\/p>\n<p><a href=\"https:\/\/www.jota.info\/#_ftnref7\">[7]<\/a> A.V. ex rel. Vanderhye v. iParadigms, LLC, 562 F.3d 630 (4th Cir. 2009)<\/p>\n<p><a href=\"https:\/\/www.jota.info\/#_ftnref8\">[8]<\/a> <em>Getty Images (US) Inc &amp; Ors v Stability AI Ltd<\/em> [2025] EWHC 2863 (Ch), Case No IL-2023-000007 (High Court of Justice, Business and Property Courts of England and Wales, Intellectual Property List (ChD), Mrs Justice Joanna Smith DBE, 4 November 2025).<\/p>\n<p><a href=\"https:\/\/www.jota.info\/#_ftnref9\">[9]<\/a> GRIMMELMAN, James. Copyright for Literate Robots (May 15, 2015). 101 Iowa Law Review 657 U of Maryland Legal Studies Research Paper No. 2015-16, 2016, available at SSRN:\u00a0<a href=\"https:\/\/ssrn.com\/abstract=2606731\">https:\/\/ssrn.com\/abstract=2606731<\/a><\/p>\n<p><a href=\"https:\/\/www.jota.info\/#_ftnref10\">[10]<\/a> SAG, M. Orphan works as grist for the data mill. <em>Berkeley Technology Law Journal <\/em>27, 1503\u201350, 2012.<\/p>","protected":false},"excerpt":{"rendered":"<p>H\u00e1 viola\u00e7\u00e3o autoral pelo uso de obras para treinamento de modelos de intelig\u00eancia artificial generativa em autoriza\u00e7\u00e3o pr\u00e9via? Trata-se de uma das quest\u00f5es jur\u00eddicas mais pol\u00eamicas no campo de direitos de autor e de regula\u00e7\u00e3o da IA. Diversas a\u00e7\u00f5es judiciais foram propostas nos \u00faltimos anos, no Brasil e no exterior, para exigir indeniza\u00e7\u00e3o autoral contra [&hellip;]<\/p>\n","protected":false},"author":0,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts\/18807"}],"collection":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/types\/post"}],"replies":[{"embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/comments?post=18807"}],"version-history":[{"count":0,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts\/18807\/revisions"}],"wp:attachment":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/media?parent=18807"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/categories?post=18807"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/tags?post=18807"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}