{"id":5592,"date":"2024-01-15T03:21:01","date_gmt":"2024-01-15T06:21:01","guid":{"rendered":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/2024\/01\/15\/the-new-york-times-versus-openai\/"},"modified":"2024-01-15T03:21:01","modified_gmt":"2024-01-15T06:21:01","slug":"the-new-york-times-versus-openai","status":"publish","type":"post","link":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/2024\/01\/15\/the-new-york-times-versus-openai\/","title":{"rendered":"The New York Times versus OpenAI"},"content":{"rendered":"<p><em>\u201cO jornalismo independente \u00e9 vital para nossa democracia\u201d<\/em>. A primeira frase da inicial da a\u00e7\u00e3o judicial proposta pelo The New York Times contra a Microsoft e a OpenAI, que disponibilizam o <a href=\"https:\/\/www.jota.info\/tudo-sobre\/ChatGPT\">ChatGPT<\/a>, \u00e9 significativa. Pode marcar o in\u00edcio do fim da prote\u00e7\u00e3o autoral moderna e simboliza perfeitamente a crise da concep\u00e7\u00e3o moderna de direito como prote\u00e7\u00e3o de direitos subjetivos pelo Estado.<\/p>\n<h3><a href=\"https:\/\/conteudo.jota.info\/marketing-lp-newsletter-ultimas-noticias\">Assine a newsletter \u00daltimas Not\u00edcias do\u00a0<span class=\"jota\"><span class=\"jota\">JOTA<\/span><\/span>\u00a0e receba as principais not\u00edcias jur\u00eddicas e pol\u00edticas diariamente no seu email<\/a><\/h3>\n<p>A frase faz apelo \u00e0 sobreviv\u00eancia de uma <em>atividade<\/em> (jornalismo) em nome de <em>valor objetivo<\/em> (democracia) e n\u00e3o propriamente \u00e0 viola\u00e7\u00e3o de direito individual. Aponta para quest\u00e3o que j\u00e1 assola o jornalismo tradicional diante de novas m\u00eddias. \u00c9 bastante custosa a produ\u00e7\u00e3o de conte\u00fado jornal\u00edstico de qualidade, com informa\u00e7\u00e3o fidedigna e opini\u00e3o balizada, fundamental para uma esfera publica saud\u00e1vel e com meios para controlar o fen\u00f4meno da desinforma\u00e7\u00e3o. Mas as fontes de receita com assinatura e publicidade ficam comprometidas, quando o conte\u00fado \u00e9 agregado e, por vezes, disponibilizado diretamente pelos pr\u00f3prios leitores\/usu\u00e1rios em aplica\u00e7\u00f5es de <em>internet <\/em>variadas.<\/p>\n<p>Tal preocupa\u00e7\u00e3o se agrava com as intelig\u00eancias artificiais generativas, que, ali\u00e1s, prometem colocar o conte\u00fado dispon\u00edvel em qualquer <em>site<\/em> aberto na internet na mesma situa\u00e7\u00e3o cr\u00edtica das empresas de jornalismo. Chat Bots como o GPT, Bard e afins, embora n\u00e3o sejam propriamente ferramentas de pesquisa, apostam em aliar sua extraordin\u00e1ria capacidade de conversa\u00e7\u00e3o em linguagem natural com buscas, agrega\u00e7\u00e3o e s\u00ednteses de conte\u00fado <em>online<\/em>. Seus usu\u00e1rios \u2013 muitos j\u00e1 o fazem de modo acr\u00edtico \u2013 n\u00e3o mais visitar\u00e3o sites produtores de conte\u00fado, consumindo-o de modo indireto e j\u00e1 digerido pelos chats, o que coloca em risco o modelo de neg\u00f3cios dos aplicativos de conte\u00fado na <em>internet<\/em>.<\/p>\n<p>Mas o direito n\u00e3o foi desenhado para lidar, ao menos no sistema de adjudica\u00e7\u00e3o, com quest\u00e3o t\u00e3o abrangente e a a\u00e7\u00e3o do NYT luta bravamente para reduzir uma quest\u00e3o j\u00e1 bastante pol\u00eamica sobre remunera\u00e7\u00e3o ao jornalismo no campo digital a uma viola\u00e7\u00e3o autoral. Ocorre que a prote\u00e7\u00e3o autoral \u00e9 atomizada, centrada na reprodu\u00e7\u00e3o n\u00e3o autorizada de determinado conte\u00fado (bem definido e identific\u00e1vel) criado pelo autor. Como traduzir nesse instituto a disponibiliza\u00e7\u00e3o de ferramenta capaz de criar (n\u00e3o propriamente reproduzir) <em>novos <\/em>conte\u00fados por iniciativas dos usu\u00e1rios (<em>prompts<\/em>), a partir de treinamento em base de dados imensa, da qual o conte\u00fado do NYT representa \u00ednfima parcela?<\/p>\n<p>Para se ter uma ideia, conte\u00fados criados pelo NYT representam 1,2% das fontes listadas pelo WebText2, que com 19 bilh\u00f5es de tokens, representa 22% do mix para treinamento da ferramenta. O Common Crawl, que re\u00fane conte\u00fado de v\u00e1rios links na internet, principalmente Wikipedia, com 410 bilh\u00f5es de tokens, representa 60% do mix de treinamento e, no m\u00e1ximo o NYT consegue indicar que seu dom\u00ednio est\u00e1 entre as 15 maiores fontes, com aproximadamente 100 milh\u00f5es de tokens, ao lado de diversos outros sites jornal\u00edsticos e editoras, como Whashington Post, Chicago Tribune, Aljazeera, Springer, FindLaw etc. Com exce\u00e7\u00e3o de mecanismos artificiosos de <em>prompts<\/em> direcionados, n\u00e3o h\u00e1 como singularizar determinado conte\u00fado (seja do NYT, seja das demais fontes) na base de treinamento para lhe atribuir papel determinante na produ\u00e7\u00e3o de algum <em>output <\/em>criativo, gerado pelo ChatGPT.<\/p>\n<p>A inicial ensaia uma s\u00e9rie de conceitos tentativos para se aproximar de uma viola\u00e7\u00e3o autoral. Fala, por exemplo, em <em>\u201cmimetizar estilo\u201d<\/em>, em vez de reproduzir texto. Ocorre que o direito autoral protege a exterioriza\u00e7\u00e3o da obra em determinado suporte e \u201cestilo\u201d est\u00e1 mais pr\u00f3ximo a ideia ou concep\u00e7\u00e3o, que n\u00e3o \u00e9 protegida. A met\u00e1fora da \u201ccopia de estilo\u201d j\u00e1 vem sendo questionado em outras a\u00e7\u00f5es por artistas, principalmente em rela\u00e7\u00e3o a IAs generativas de imagens.<a href=\"https:\/\/www.jota.info\/#_ftn1\">[1]<\/a> Fala tamb\u00e9m em <em>\u201ccopiar para treinamento\u201d<\/em> (e n\u00e3o c\u00f3pia da obra), como uma forma de uso n\u00e3o autorizado, mas, ao faz\u00ea-lo, praticamente admite um uso transformativo. Fala ainda em cita\u00e7\u00f5es <em>\u201cquase-verbatim\u201d<\/em> ou em <em>\u201cs\u00ednteses-pr\u00f3ximas\u201d<\/em> dos originais, que, obviamente, n\u00e3o s\u00e3o nem <em>verbatim<\/em> nem id\u00eanticas. Ao mesmo tempo, incorpora a acusa\u00e7\u00e3o de gera\u00e7\u00e3o, pelo ChatGPT, de conte\u00fados falsamente atribu\u00eddos ao NYT, o que, na verdade, contradiz a almejada comprova\u00e7\u00e3o de reprodu\u00e7\u00e3o.<\/p>\n<p>N\u00e3o \u00e9 f\u00e1cil descartar, no caso do ChatGPT, o \u201cfair use\u201d e a inicial apenas ataca o crit\u00e9rio de \u201cuso transformativo\u201d, ou seja, argumenta n\u00e3o haver transforma\u00e7\u00e3o e mudan\u00e7a de prop\u00f3sito quando os produtos criados substituem o <em>\u201cThe Times e roubam sua audi\u00eancia\u201d<\/em>. Note que n\u00e3o se trata de substitui\u00e7\u00e3o de obra espec\u00edfica e seu uso para o mesmo fim, mas de nova forma de se consumir e processar conte\u00fado por meio de conversa\u00e7\u00e3o e perguntas espec\u00edficas. E na maior parte do conte\u00fado gerado pelo ChatGPT novas informa\u00e7\u00f5es (por vezes equivocadas) s\u00e3o agregadas por meio de infer\u00eancias de palavras que provavelmente sucedem o texto anterior com base em bilh\u00f5es de exemplos das mais diversas fontes, que comp\u00f5em a base de treinamento. Dif\u00edcil negar novo prop\u00f3sito e novo tipo de servi\u00e7o, ainda que possa haver uso comercial e rela\u00e7\u00e3o de concorr\u00eancia no mercado.<a href=\"https:\/\/www.jota.info\/#_ftn2\">[2]<\/a><\/p>\n<p>Os outros tr\u00eas par\u00e2metros de \u201cfair use\u201d, que, no direito estadunidense, eximem a condena\u00e7\u00e3o, tamb\u00e9m parecem dif\u00edceis de contornar. A obra pode n\u00e3o ser protegida pela <em>natureza do trabalho<\/em>, por exemplo, se estivermos diante de texto j\u00e1 publicado e predominantemente factual (em oposi\u00e7\u00e3o a obras de fic\u00e7\u00e3o), quando o uso propiciar benef\u00edcio ao p\u00fablico e acesso a informa\u00e7\u00e3o. Quando a <em>quantidade ou subst\u00e2ncia da por\u00e7\u00e3o tomada<\/em> da obra tamb\u00e9m n\u00e3o for significativa, pode ser reconhecido o fair use, mesmo para uso comercial. Nos usos comuns do ChatGPT, sequer ter\u00edamos a reprodu\u00e7\u00e3o de trecho de texto identificado do NYT. J\u00e1 o <em>efeito sobre o mercado<\/em> teria que mostrar a usurpa\u00e7\u00e3o de uma oportunidade de ganho para o trabalho espec\u00edfico protegido, o que \u00e9 diverso de apontar, no uso generalizado da ferramenta, o risco para toda a atividade econ\u00f4mica do jornalismo.<\/p>\n<p>A inicial do NYT concentra-se, ent\u00e3o, nos exemplos de \u201cmemoriza\u00e7\u00e3o\u201d. Os grandes modelos de linguagem (<em>large language models<\/em>) podem ser afinados\u00a0 (<em>fine-tunning<\/em>) com novo treinamento sobre base mais espec\u00edfica de textos, o que pode fazer com que, a partir de determinados prompts, o <em>chat bot<\/em> reproduza por\u00e7\u00f5es significativas de textos originais que compuseram a base de treinamento. Assim, por exemplo, <em>prompts <\/em>artificiosos que fa\u00e7am referencia ao texto espec\u00edfico e indiquem par\u00e1grafo determinado, pedindo o subsequente, podem gerar como resultado bastante fidedigno, o que \u00e9 praticamente uma busca (<em>retrieval<\/em>) do texto original.<\/p>\n<p>Mas tal possibilidade, que realmente estaria mais pr\u00f3xima de uma reprodu\u00e7\u00e3o, n\u00e3o ataca o problema central, capaz de comprometer o custeio do jornalismo e mesmo da produ\u00e7\u00e3o de qualquer conte\u00fado em <em>sites<\/em> abertos na <em>internet<\/em>. Se pensarmos bem, prompts de <em>retrieval<\/em>, como aqueles exemplificados na inicial do NYT s\u00f3 poderiam ser realizados por usu\u00e1rios que, de certo modo, j\u00e1 estariam familiarizados com o texto original (no m\u00ednimo, seria trabalhoso para o usu\u00e1rio acessar todo o conte\u00fado original, por tal mecanismo).<\/p>\n<p>Al\u00e9m disso, a inicial aponta para buscas no <em>Bing<\/em>, cujo resultado j\u00e1 traz s\u00ednteses do texto disponibilizado na p\u00e1gina, uma utilidade bastante popular do ChatGPT e que pode ser empregada de modo subsequente pelo usu\u00e1rio (copiar o texto, inserir link, plug-ins ou o PDF no <em>prompt<\/em>, pedindo o resumo). Por\u00e9m, o problema aqui parece estar mais na falta de <em>hiperlink<\/em> para a p\u00e1gina do NYT, sendo, de resto, uma preocupa\u00e7\u00e3o j\u00e1 discutida na problem\u00e1tica de remunera\u00e7\u00e3o ao jornalismo nas m\u00eddias digitais.<\/p>\n<p>Desse modo, a inicial come\u00e7a com o alvo correto e traz alerta para reflex\u00e3o geral sobre o futuro em que desejamos viver. Mas sua tradu\u00e7\u00e3o para suposta viola\u00e7\u00e3o a direito autoral deixa o real problema de fora, usando um molde que n\u00e3o mais o comporta. O que est\u00e1 em jogo \u00e9 a supera\u00e7\u00e3o de uma pr\u00e1tica cultural com a emerg\u00eancia de nova m\u00eddia e forma de comunica\u00e7\u00e3o social intermediada por m\u00e1quinas. A quest\u00e3o chave \u00e9 como direcionar essa nova e inarred\u00e1vel tecnologia, de modo a preservar valores essenciais para a vida em sociedade.<\/p>\n<p>___________________________________________________________________________________<\/p>\n<p class=\"jota-article__reference\"><a href=\"https:\/\/www.jota.info\/#_ftnref1\">[1]<\/a> <a href=\"https:\/\/www.cnbc.com\/2023\/04\/03\/in-generative-ai-legal-wild-west-lawsuits-are-just-getting-started.html\">https:\/\/www.cnbc.com\/2023\/04\/03\/in-generative-ai-legal-wild-west-lawsuits-are-just-getting-started.html<\/a><\/p>\n<p class=\"jota-article__reference\"><a href=\"https:\/\/www.jota.info\/#_ftnref2\">[2]<\/a> Em julgado recente, a Suprema Corte ampliou a no\u00e7\u00e3o de uso transformativo ao<em> reconhecer fair use na reimplementa\u00e7\u00e3o pela Google de partes da API do Java<\/em> para a plataforma Android. <em>Google LLC v. Oracle America, Inc. <\/em>\u00a0https:\/\/harvardlawreview.org\/print\/vol-135\/google-llc-v-oracle-america-inc\/<\/p>","protected":false},"excerpt":{"rendered":"<p>\u201cO jornalismo independente \u00e9 vital para nossa democracia\u201d. A primeira frase da inicial da a\u00e7\u00e3o judicial proposta pelo The New York Times contra a Microsoft e a OpenAI, que disponibilizam o ChatGPT, \u00e9 significativa. Pode marcar o in\u00edcio do fim da prote\u00e7\u00e3o autoral moderna e simboliza perfeitamente a crise da concep\u00e7\u00e3o moderna de direito como [&hellip;]<\/p>\n","protected":false},"author":0,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts\/5592"}],"collection":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/types\/post"}],"replies":[{"embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/comments?post=5592"}],"version-history":[{"count":0,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts\/5592\/revisions"}],"wp:attachment":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/media?parent=5592"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/categories?post=5592"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/tags?post=5592"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}