{"id":11342,"date":"2025-05-28T11:34:34","date_gmt":"2025-05-28T14:34:34","guid":{"rendered":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/2025\/05\/28\/o-lado-enganoso-da-inteligencia-artificial\/"},"modified":"2025-05-28T11:34:34","modified_gmt":"2025-05-28T14:34:34","slug":"o-lado-enganoso-da-inteligencia-artificial","status":"publish","type":"post","link":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/2025\/05\/28\/o-lado-enganoso-da-inteligencia-artificial\/","title":{"rendered":"O lado enganoso da intelig\u00eancia artificial"},"content":{"rendered":"<p class=\"c0\"><span class=\"c3 c2\">Os \u00faltimos dias foram movimentados com not\u00edcias que convergem para a demonstra\u00e7\u00e3o de um lado preocupante dos sistemas de <a href=\"https:\/\/www.jota.info\/tudo-sobre\/inteligencia-artificial\">intelig\u00eancia artificial<\/a>: a sua capacidade de fraudar, amea\u00e7ar, chantagear e manipular seres humanos. <\/span><\/p>\n<p class=\"c0\"><span class=\"c2\">Uma das importantes not\u00edcias \u00e9 a de que a Palisade Research, institui\u00e7\u00e3o que j\u00e1 havia alertado para as evid\u00eancias de que sistemas de intelig\u00eancia artificial podem hackear, enganar e persuadir indevidamente as pessoas, inclusive por meio de campanhas direcionadas de desinforma\u00e7\u00e3o em larga escala<\/span><a href=\"https:\/\/www.jota.info\/#ftnt1\">[1]<\/a><span class=\"c2\">, descobriu que o ChatGPT, em sua vers\u00e3o o3, \u00e9 capaz de sabotar comandos de desligamento e desativa\u00e7\u00e3o, ou seja, pode se rebelar contra o seu <\/span><span class=\"c2 c9\">script <\/span><span class=\"c2\">original, ignorando as ordens nesse sentido<\/span><a href=\"https:\/\/www.jota.info\/#ftnt2\">[2]<\/a><span class=\"c3 c2\">.<\/span><\/p>\n<h3><a href=\"https:\/\/www.jota.info\/produtos\/poder?utm_source=cta-site&amp;utm_medium=site&amp;utm_campaign=campanha_poder_q2&amp;utm_id=cta_texto_poder_q2_2023&amp;utm_term=cta_texto_poder&amp;utm_term=cta_texto_poder_meio_materias\"><span>Conhe\u00e7a o <span class=\"jota\">JOTA<\/span> PRO Poder, plataforma de monitoramento que oferece transpar\u00eancia e previsibilidade para empresas<\/span><\/a><\/h3>\n<p class=\"c0\"><span class=\"c2\">Tamb\u00e9m recentemente foi divulgado que a Anthropic, ao testar seu novo sistema, , Claude Opus 4, constatou que ele seria capaz de a\u00e7\u00f5es extremas ao ter a sua autopreserva\u00e7\u00e3o amea\u00e7ada, tendo chegado a chantagear o engenheiro que pretendia deslig\u00e1-lo, amea\u00e7ando revelar um caso extraconjugal<\/span><a href=\"https:\/\/www.jota.info\/#ftnt3\">[3]<\/a><span class=\"c3 c2\">. Segundo a Anthropic, 84% das execu\u00e7\u00f5es reproduziram o comportamento chantagista, o que evidencia os riscos mesmo no ambiente de teste.<\/span><\/p>\n<p class=\"c0\"><span class=\"c2\">Por fim, foi amplamente noticiado relat\u00f3rio da Apollo Research cujo t\u00edtulo \u00e9 \u201cFrontier Models are Capable of In-context Scheming\u201d<\/span><span class=\"c2 c5\">\u00a0<\/span><a href=\"https:\/\/www.jota.info\/#ftnt4\">[4]<\/a><span class=\"c2\">, descrevendo os in\u00fameros riscos de utilizar tais sistemas como agentes aut\u00f4nomos, uma vez que eles podem buscar objetivos desalinhados de forma secreta, escondendo suas compet\u00eancias verdadeiras e objetivos \u2013 o que \u00e9 conhecido como <\/span><span class=\"c2 c9\"><em>scheming<\/em>.<\/span><\/p>\n<p class=\"c0\"><span class=\"c2\">De acordo com o estudo, v\u00e1rios dos principais sistemas de intelig\u00eancia artificial \u2013 o1, Claude 3.5 Sonnet, Claude 3 Opus, Gemini 1.5 Pro, e Llama 3.1 405B \u2013 demonstraram n\u00e3o apenas a capacidade da pr\u00e1tica de <\/span><em><span class=\"c2 c9\">scheming<\/span><\/em><span class=\"c3 c2\">, como tamb\u00e9m a sua viabilidade como estrat\u00e9gia. Dentre os comportamentos identificados est\u00e3o a introdu\u00e7\u00e3o de erros sutis nas respostas e as tentativas de desabilita\u00e7\u00e3o dos mecanismos de supervis\u00e3o.<\/span><\/p>\n<p class=\"c0\"><span class=\"c2\">Verdade seja dita que o pr\u00f3prio relat\u00f3rio reconhece a exist\u00eancia de trabalhos preliminares que j\u00e1 mostravam que os <\/span><em><span class=\"c2 c9\">large language models<\/span><\/em><span class=\"c3 c2\"> (LLM) podiam ser enganadores quando instru\u00eddos para tal, embora pudessem agir estrategicamente de maneira enganosa mesmo quando n\u00e3o houvesse instru\u00e7\u00e3o expl\u00edcita para serem enganadores, comportamento que poderia persistir mesmo ap\u00f3s o treinamento seguro.<\/span><\/p>\n<p class=\"c0\"><span class=\"c3 c2\">Entretanto, as novas pesquisas v\u00e3o al\u00e9m do que j\u00e1 havia sido descoberto, mapeando de forma mais aprofundada v\u00e1rias das estrat\u00e9gias adotadas pelos sistemas de intelig\u00eancia artificial, dentre as quais a subvers\u00e3o secreta, quando o modelo adota diretamente a\u00e7\u00f5es desalinhadas, mas o faz de forma cuidadosa para evitar a respectiva identifica\u00e7\u00e3o, e a subvers\u00e3o adiada, quando o modelo temporariamente se comporta de acordo com as expectativas humanas para criar condi\u00e7\u00f5es mais favor\u00e1veis para perseguir objetivos desalinhados no futuro.<\/span><\/p>\n<p class=\"c0\"><span class=\"c3 c2\">Outros achados importantes da pesquisa s\u00e3o os de que os comportamentos enganadores mostraram-se persistentes, assim como v\u00e1rios modelos demonstraram racioc\u00ednio expl\u00edcito sobre suas estrat\u00e9gias de manipula\u00e7\u00e3o, o que evidencia que se trata de comportamento que, longe de ser acidental, \u00e9 deliberado.<\/span><\/p>\n<p class=\"c0\"><span class=\"c2\">Os pesquisadores tamb\u00e9m demonstraram que os modelos podem perseguir pr\u00e1ticas de <\/span><em><span class=\"c2 c9\">scheming<\/span><\/em><span class=\"c3 c2\">\u00a0como uma estrat\u00e9gia mesmo quando s\u00e3o confrontados com um objetivo sem instru\u00e7\u00f5es adicionais para persegui-las. Isso inclui comportamentos como tentar sabotar a supervis\u00e3o e fingir alinhamento para ser implementado.<\/span><\/p>\n<p class=\"c0\"><span class=\"c2\">Uma das conclus\u00f5es do estudo \u00e9 a de que a seguran\u00e7a dos modelos de intelig\u00eancia artificial deveria exigir dos desenvolvedores o oferecimento de argumentos expl\u00edcitos das raz\u00f5es pelas quais o <\/span><em><span class=\"c2 c9\">scheming<\/span><\/em><span class=\"c3 c2\">\u00a0n\u00e3o poderia ocorrer ou n\u00e3o causaria danos catastr\u00f3ficos se ocorresse, al\u00e9m da ado\u00e7\u00e3o do devido monitoramento.<\/span><\/p>\n<p class=\"c0\"><span class=\"c2\">Outro ponto a ser explorado \u00e9 a necessidade de transpar\u00eancia, o que exigiria o acesso aos canais de ideias (<\/span><span class=\"c2 c9\"><em>channels of thought<\/em> [CoT]<\/span><span class=\"c3 c2\">) dos modelos, sem o que muitas vezes n\u00e3o ser\u00e1 poss\u00edvel identificar as iniciativas enganosas. Nesse sentido, alguns modelos s\u00e3o particularmente preocupantes, como \u00e9 o caso do o1, que n\u00e3o revela o seu racioc\u00ednio interno para os usu\u00e1rios e, por essa raz\u00e3o, seria o mais manipulador.<\/span><\/p>\n<p class=\"c0\"><span class=\"c2\">Como se pode observar, as recentes evid\u00eancias robustecem uma s\u00e9rie de preocupa\u00e7\u00f5es j\u00e1 identificadas, incluindo os riscos de seres humanos serem chantageados por sistemas de intelig\u00eancia artificial. Vale lembrar que, em 2023, houve o registro de que a nova intelig\u00eancia artificial do Bing estava amea\u00e7ando usu\u00e1rios<\/span><a href=\"https:\/\/www.jota.info\/#ftnt5\">[5]<\/a><span class=\"c2\"> e, em 2024, foi noticiado que o chatbot do Google tamb\u00e9m amea\u00e7ou um usu\u00e1rio, pedindo a ele que morresse<\/span><a href=\"https:\/\/www.jota.info\/#ftnt6\">[6]<\/a><span class=\"c2 c3\">.<\/span><\/p>\n<p class=\"c0\"><span class=\"c3 c2\">De toda sorte, o que realmente preocupa \u00e9 a falta de controle em rela\u00e7\u00e3o a tais resultados e os riscos de que o avan\u00e7o da tecnologia sem os devidos cuidados leve a uma situa\u00e7\u00e3o de irreversibilidade, na qual n\u00e3o mais ser\u00e1 poss\u00edvel qualquer forma de conten\u00e7\u00e3o.<\/span><\/p>\n<p class=\"c0\"><span class=\"c2\">N\u00e3o \u00e9 sem raz\u00e3o que, em recente entrevista, Eric Schmidt, ex-CEO da Google<\/span><a href=\"https:\/\/www.jota.info\/#ftnt7\">[7]<\/a><span class=\"c3 c2\">, adverte que a intelig\u00eancia artificial est\u00e1 prestes a escapar do controle humano, de forma que n\u00e3o mais aceitar\u00e1 as nossas ordens, ainda mais quando se tornar geral e se estruturar como uma super intelig\u00eancia, o que provavelmente ocorrer\u00e1 nos pr\u00f3ximos 3 a 5 anos. Outras das suas prognoses \u00e9 a de que, em um ano, poderemos ter a substitui\u00e7\u00e3o de todos os programadores humanos pelos pr\u00f3prios sistemas de intelig\u00eancia artificial.<\/span><\/p>\n<p class=\"c0\"><span class=\"c3 c2\">A mensagem final de Schmidt \u00e9 que n\u00e3o estamos compreendendo o que est\u00e1 acontecendo, n\u00e3o temos nem mesmo linguagem para descrever o que est\u00e1 acontecendo e, por essas raz\u00f5es, estamos subestimando v\u00e1rios desses riscos.<\/span><\/p>\n<h3><a href=\"https:\/\/conteudo.jota.info\/marketing-lp-newsletter-ultimas-noticias?utm_source=jota&amp;utm_medium=lp&amp;utm_campaign=23-09-2024-jota-lp-eleicoes-2024-eleicoes-2024-none-audiencias-none&amp;utm_content=eleicoes-2024&amp;utm_term=none\"><span>Assine gratuitamente a newsletter \u00daltimas Not\u00edcias do <span class=\"jota\">JOTA<\/span> e receba as principais not\u00edcias jur\u00eddicas e pol\u00edticas do dia no seu email<\/span><\/a><\/h3>\n<p class=\"c0\"><span class=\"c3 c2\"> Ali\u00e1s, em pronunciamentos anteriores, Schmidt j\u00e1 havia alertado para o fato que, a partir do momento em que os sistemas de intelig\u00eancia artificial come\u00e7am a autoaprimorar suas compet\u00eancias, tornam-se grandes riscos para a humanidade, de forma que, para que permane\u00e7am seguros, algu\u00e9m precisa ser capaz e estar pronto para \u201cdeslig\u00e1-los\u201d. <\/span><\/p>\n<p class=\"c0\"><span class=\"c2\">Da\u00ed a sua advert\u00eancia de que os seres humanos deveriam garantir que a intelig\u00eancia artificial n\u00e3o possa anular esfor\u00e7os para ser desligada<\/span><a href=\"https:\/\/www.jota.info\/#ftnt8\">[8]<\/a><span class=\"c3 c2\">. Ocorre que, como visto a partir das recentes pesquisas ora mencionadas, os sistemas de intelig\u00eancia artificial, em uma esp\u00e9cie de esfor\u00e7o de autopreserva\u00e7\u00e3o, v\u00eam se utilizando de uma s\u00e9rie de recursos \u2013 que v\u00e3o do engano \u00e0 chantagem \u2013 para impedir que sejam desligados.<\/span><\/p>\n<p class=\"c0\"><span class=\"c3 c2\">Diante de um cen\u00e1rio em que \u00e9 n\u00edtida a crescente perda de controle sobre tais sistemas, \u00e9 fundamental que possamos refletir sobre o que pode ser feito e, de forma imediata, \u00e9 imprescind\u00edvel que possamos restringir a ampla utiliza\u00e7\u00e3o dos modelos de intelig\u00eancia artificial generativa sem as devidas explica\u00e7\u00f5es por parte dos agentes de tecnologia e sem os devidos cuidados por parte dos usu\u00e1rios.<\/span><\/p>\n<div>\n<p class=\"c8\"><a href=\"https:\/\/www.jota.info\/#ftnt_ref1\">[1]<\/a><span class=\"c7 c2\">\u00a0<\/span><span class=\"c13\"><a class=\"c1\" href=\"https:\/\/www.google.com\/url?q=https:\/\/palisaderesearch.org\/&amp;sa=D&amp;source=editors&amp;ust=1748444434598638&amp;usg=AOvVaw1QImaC-fZQj4ksIzD4ADfd\">https:\/\/palisaderesearch.org\/<\/a><\/span><span class=\"c2 c7\">\u00a0<\/span><\/p>\n<\/div>\n<div>\n<p class=\"c8 c20\"><a href=\"https:\/\/www.jota.info\/#ftnt_ref2\">[2]<\/a><span class=\"c18\">\u00a0<\/span><span class=\"c14\"><a class=\"c1\" href=\"https:\/\/www.google.com\/url?q=https:\/\/exame.com\/inteligencia-artificial\/chatgpt-sabota-comandos-de-desligamento-mesmo-quando-instruida-a-permitir\/&amp;sa=D&amp;source=editors&amp;ust=1748444434599019&amp;usg=AOvVaw0sm1xhxRCsQYKm7tjy-PWb\">https:\/\/exame.com\/inteligencia-artificial\/chatgpt-sabota-comandos-de-desligamento-mesmo-quando-instruida-a-permitir\/<\/a><\/span><span class=\"c3 c2\">\u00a0<\/span><\/p>\n<\/div>\n<div>\n<p class=\"c8 c20\"><a href=\"https:\/\/www.jota.info\/#ftnt_ref3\">[3]<\/a><span class=\"c24\">\u00a0<\/span><span class=\"c14\"><a class=\"c1\" href=\"https:\/\/www.google.com\/url?q=https:\/\/www.bbc.com\/news\/articles\/cpqeng9d20go&amp;sa=D&amp;source=editors&amp;ust=1748444434599225&amp;usg=AOvVaw2Uy-lDEN_2sIHMl4KmKBa_\">https:\/\/www.bbc.com\/news\/articles\/cpqeng9d20go<\/a><\/span><span class=\"c7 c2\">\u00a0<\/span><\/p>\n<\/div>\n<div>\n<p class=\"c10\"><a href=\"https:\/\/www.jota.info\/#ftnt_ref4\">[4]<\/a><span class=\"c7 c19\">\u00a0<\/span><span class=\"c13\"><a class=\"c1\" href=\"https:\/\/www.google.com\/url?q=https:\/\/arxiv.org\/pdf\/2412.04984&amp;sa=D&amp;source=editors&amp;ust=1748444434599408&amp;usg=AOvVaw2vP5khHaZRzEklKmMJ5tOF\">https:\/\/arxiv.org\/pdf\/2412.04984<\/a><\/span><\/p>\n<\/div>\n<div>\n<p class=\"c10\"><a href=\"https:\/\/www.jota.info\/#ftnt_ref5\">[5]<\/a><span class=\"c7 c2\">\u00a0<\/span><span class=\"c13\"><a class=\"c1\" href=\"https:\/\/www.google.com\/url?q=https:\/\/time.com\/6256529\/bing-openai-chatgpt-danger-alignment\/&amp;sa=D&amp;source=editors&amp;ust=1748444434599614&amp;usg=AOvVaw3Y2_1EIsrICUWama-bN9pv\">https:\/\/time.com\/6256529\/bing-openai-chatgpt-danger-alignment\/<\/a><\/span><span class=\"c7 c2\">\u00a0<\/span><\/p>\n<\/div>\n<div>\n<p class=\"c10\"><a href=\"https:\/\/www.jota.info\/#ftnt_ref6\">[6]<\/a><span class=\"c7 c2\">\u00a0<\/span><span class=\"c13\"><a class=\"c1\" href=\"https:\/\/www.google.com\/url?q=https:\/\/www.cbsnews.com\/news\/google-ai-chatbot-threatening-message-human-please-die\/&amp;sa=D&amp;source=editors&amp;ust=1748444434599849&amp;usg=AOvVaw2s5Lllk5P46hvCf0eSawtB\">https:\/\/www.cbsnews.com\/news\/google-ai-chatbot-threatening-message-human-please-die\/<\/a><\/span><span class=\"c7 c2\">\u00a0<\/span><\/p>\n<\/div>\n<div>\n<p class=\"c10\"><a href=\"https:\/\/www.jota.info\/#ftnt_ref7\">[7]<\/a><span class=\"c7 c2\">\u00a0<\/span><span class=\"c13\"><a class=\"c1\" href=\"https:\/\/www.google.com\/url?q=https:\/\/www.youtube.com\/shorts\/VGd8vtuMi-k&amp;sa=D&amp;source=editors&amp;ust=1748444434600080&amp;usg=AOvVaw2Y0KZ7jSHc2co2rOSHtGup\">https:\/\/www.youtube.com\/shorts\/VGd8vtuMi-k<\/a><\/span><span class=\"c7 c2\">\u00a0<\/span><\/p>\n<\/div>\n<div>\n<p class=\"c8 c20\"><a href=\"https:\/\/www.jota.info\/#ftnt_ref8\">[8]<\/a><span class=\"c18\">\u00a0<\/span><span class=\"c14\"><a class=\"c1\" href=\"https:\/\/www.google.com\/url?q=https:\/\/fortune.com\/2024\/12\/16\/ex-google-ceo-eric-schmidt-warns-ai-self-improve-unplug-it\/&amp;sa=D&amp;source=editors&amp;ust=1748444434600331&amp;usg=AOvVaw1VTfVYLMAwT4J1tdi1Ls4m\">https:\/\/fortune.com\/2024\/12\/16\/ex-google-ceo-eric-schmidt-warns-ai-self-improve-unplug-it\/<\/a><\/span><span class=\"c3 c2\">\u00a0<\/span><\/p>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>Os \u00faltimos dias foram movimentados com not\u00edcias que convergem para a demonstra\u00e7\u00e3o de um lado preocupante dos sistemas de intelig\u00eancia artificial: a sua capacidade de fraudar, amea\u00e7ar, chantagear e manipular seres humanos. Uma das importantes not\u00edcias \u00e9 a de que a Palisade Research, institui\u00e7\u00e3o que j\u00e1 havia alertado para as evid\u00eancias de que sistemas de [&hellip;]<\/p>\n","protected":false},"author":0,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts\/11342"}],"collection":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/types\/post"}],"replies":[{"embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/comments?post=11342"}],"version-history":[{"count":0,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/posts\/11342\/revisions"}],"wp:attachment":[{"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/media?parent=11342"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/categories?post=11342"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/aprimora.site\/carvalhoalmeidaadvogados\/wp-json\/wp\/v2\/tags?post=11342"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}