No BlackRock US Infrastructure Summit, em Washington DC, em 11 de março de 2026, o CEO da OpenAI, Sam Altman, o mesmo que está usando a Inteligência Artificial para abrir portais artificiais e invocar alienígenas e demônios em nosso mundo, destaca uma mudança fundamental na indústria de IA: ele comparou a IA à eletricidade e à água, um serviço público que deveria ser precificado pelo consumo, não por taxas mensais fixas.
A declaração sinaliza uma mudança fundamental na forma como os serviços de IA serão monetizados e tem implicações para todos os construtores, empresas e consumidores que dependem da IA. “Fundamentalmente, o nosso negócio, e acredito que o negócio de todos os outros fornecedores de modelos, vai se resumir à venda de tokens”, disse Altman, referindo-se às unidades que os sistemas de IA usam para processar e precificar dados de entrada e saída.
“Nós vislumbramos um futuro onde a inteligência seja um serviço público como eletricidade ou água, e as pessoas a comprem de nós através de um medidor e a utilizem para o que quiserem“, acrescentou. O argumento central de Altman é enganosamente simples: a IA deve ser vendida como um utilitário.

As empresas de eletricidade não cobram uma taxa mensal fixa, independentemente do uso. As concessionárias de água medem o consumo e cobram de acordo. Altman acredita que a IA seguirá o mesmo padrão. Usuários que consomem mais poder computacional pagam mais. Usuários que precisam de uma consulta simples pagam menos. A unidade de medida: tokens digitais — a medida padronizada de dados processados por sistemas de IA para entrada e saída.
Isso não é totalmente novo. A API da OpenAI sempre foi baseada no uso, cobrando dos desenvolvedores por token processado. Mas o lado do consumidor — ChatGPT — operou em níveis de assinatura: grátis, Plus a US$ 20/mês, Team a US$ 25–30/usuário/mês e preços corporativos. Altman está sinalizando que esse modelo de assinatura é transitório, não permanente.
A razão é a realidade econômica. À medida que os modelos de IA se tornam mais poderosos, o custo computacional de executá-los aumenta dramaticamente. Um modelo de assinatura que cobra o mesmo preço por uma simples verificação ortográfica e uma complexa tarefa de pesquisa de várias horas é estruturalmente insustentável.
O usuário do X, @alex_prompter, resumiu tudo perfeitamente:
Deixe-me traçar a linha do tempo aqui, porque ninguém está conectando os pontos.
Passo 1: Colete dados de toda a internet. Cada livro, cada artigo, cada conversa, cada obra de arte, cada postagem em fórum. Faça isso sem pedir permissão. Faça isso sem pagar.
Passo 2: Treine um modelo com tudo isso e depois chame de “inteligência artificial”.
Passo 3: Vá ao Infrastructure Summit da BlackRock e anuncie: “Nós vemos um futuro onde a IA é um serviço público, como eletricidade ou água, e as pessoas a compram de nós por meio de um medidor.”
O Passo 3 é onde você vende o conhecimento das pessoas de volta para elas. Por meio de um medidor. Eles pegaram a produção coletiva do pensamento humano, comprimiram-na em um modelo e agora querem cobrar por token para você acessar uma versão do que você e milhões de pessoas já criaram.
Um usuário do Reddit resumiu perfeitamente: “Eles roubaram todos esses dados de nós, o povo, o trabalho de nossas vidas, nossa criatividade, nossa arte, devorando a internet e ignorando todas as leis de direitos autorais. Agora querem nos vender tudo de volta na forma de um serviço público.”
Imagine se alguém fotocopiasse todos os livros da biblioteca pública, incendiasse a biblioteca e depois abrisse um serviço de assinatura para as cópias. Esse é o modelo de negócios da IA medida. E eles estão apresentando isso a investidores em infraestrutura como se tivessem inventado a água. O problema mais profundo não é apenas o fato de eles terem coletado tudo sem permissão. É o que eles coletaram. A maior parte da palavra escrita que realmente existe na história da humanidade nunca foi digitalizada.
Do que foi coletado, a grande maioria é conteúdo da Internet pós-década de 1990…escrito quando o custo de publicação e o risco de reputação da publicação caíram para zero e os padrões editoriais entraram em colapso. Trabalhos cuidadosamente editados e de alto sinal anteriores a essa época mal são representados. Não estamos treinando no melhor do pensamento humano. Estamos treinando com o mais barato.”
Fiz uma pergunta ao Grok sobre o que @alex_prompter disse e foi isso que a IA respondeu:
A controvérsia ética e legal sobre o treinamento de IAs com dados da internet
Muitas empresas de Inteligência Artificial (como OpenAI, Stability AI, Meta, Google e outras) treinaram seus modelos de linguagem (LLMs) e geradores de imagens em vastos conjuntos de dados obtidos por scraping (rastreamento automático) da internet. Isso incluiu textos, livros, artigos jornalísticos, imagens e obras de arte de milhões de criadores. Essa prática gerou intensos debates sobre ética, direitos autorais e princípios empresariais.
Como funcionou o treinamento?
As empresas usaram datasets como o Common Crawl, que arquiva bilhões de páginas da web desde 2008, além de coleções de livros (incluindo fontes piratas em alguns casos), Reddit, YouTube e sites de arte como DeviantArt. Esses dados foram copiados para treinar os modelos a reconhecer padrões, gerar texto, imagens e código.
O argumento das empresas é que o volume de dados necessário é tão grande que seria “impossível” treinar modelos de ponta sem usar material protegido por copyright. OpenAI chegou a afirmar publicamente que o acesso a obras protegidas era essencial.
As críticas de falta de ética e “roubo”
Críticos, incluindo autores, artistas, jornalistas e a Authors Guild, veem isso como exploração:
- Falta de consentimento e compensação: A maioria dos criadores nunca autorizou o uso de seu trabalho. Muitos descobriram que suas obras foram usadas para treinar ferramentas que agora competem diretamente com eles (ex.: geradores de imagens que imitam estilos de artistas, ou ChatGPT resumindo livros).
- Ignorar direitos autorais: Copiar obras inteiras para treinamento constitui reprodução não autorizada na visão de muitos. Processos alegam que empresas usaram fontes piratas e removeram metadados de copyright.
- Dano econômico: Artistas e escritores relatam perda de renda. Imagens geradas por IA substituem comissões, e resumos de IA reduzem tráfego em sites jornalísticos. Casos notáveis incluem processos do The New York Times contra OpenAI/Microsoft, artistas (Sarah Andersen, Kelly McKernan, Karla Ortiz) contra Stability AI e Midjourney, e Getty Images.
- Hipocrisia empresarial: Empresas que lucram bilhões vendendo acesso a esses modelos (via assinaturas como ChatGPT Plus) supostamente “roubaram” o valor criado por humanos para depois monetizá-lo. Alguns ex-funcionários da OpenAI criticaram internamente a abordagem de “qualquer coisa na internet serve”.
Há mais de 40 processos nos EUA tratando disso, com o US Copyright Office indicando que o treinamento pode configurar infração prima facie, embora o “fair use” (uso justo) seja debatido.
O outro lado: argumento do fair use e benefícios
Defensores (incluindo algumas decisões judiciais recentes) argumentam:
- Transformação: Treinar um modelo não é copiar para redistribuir a obra original, mas analisar padrões estatísticos para criar algo novo. Similar ao Google Books, considerado fair use.
- Precedentes tecnológicos: Indexação e mineração de dados já foram protegidas em casos anteriores.
- Progresso da humanidade: Restringir o treinamento poderia atrasar avanços em medicina, educação e produtividade. Algumas decisões de 2025 (ex.: casos contra Anthropic e Meta) aceitaram treinamento como fair use em certos contextos, especialmente com cópias legais.
No entanto, usar material pirata costuma cruzar a linha ética e legal, conforme algumas sentenças.
Nem todas as empresas são iguais
- Muitas agora buscam licenças pagas com editores e criadores.
- xAI (empresa por trás do Grok) enfatiza transparência e abordagem diferente em alguns aspectos, embora todo grande modelo dependa de dados massivos da web. O treinamento com dados públicos continua controverso em toda a indústria.
Conclusão
A prática inicial de “raspar tudo” levantou questões válidas de ética e justiça. Criadores investiram tempo, talento e criatividade, enquanto grandes empresas capturaram esse valor para gerar lucros. Por outro lado, o debate jurídico mostra nuances: copyright protege expressão, mas não fatos ou ideias, e inovação tecnológica historicamente tensiona leis antigas.
O caminho ideal parece envolver transparência nos dados de treinamento, mecanismos de compensação (licenças coletivas ou royalties) e leis atualizadas que equilibrem direitos dos criadores com o avanço tecnológico. Processos em andamento e relatórios do Copyright Office moldarão o futuro. Criadores devem usar ferramentas como robots.txt, opt-outs e advocacy para proteger seu trabalho, enquanto a sociedade ganha com IAs mais capazes — desde que o ecossistema seja justo.
Essa não é uma questão binária de “todo mundo é ladrão”, mas um choque clássico entre inovação disruptiva e direitos de propriedade intelectual. O equilíbrio ainda está sendo definido.
Processos judiciais contra empresas de IA por violação de direitos autorais
Desde 2023, explodiu o número de ações judiciais contra empresas de IA (OpenAI, Anthropic, Meta, Stability AI, Midjourney, Google, Microsoft etc.) por uso não autorizado de obras protegidas para treinamento de modelos. Estima-se que, até o início de 2026, existam mais de 70-80 processos só nos EUA, com dezenas em outros países.
Principais casos e desdobramentos (atualizado até 2026)
1. Casos de texto e livros (LLMs)
- Bartz et al. v. Anthropic (2024-2025): Autores acusaram a Anthropic de usar milhões de livros (incluindo piratas) para treinar o Claude. Em junho de 2025, o juiz considerou o treinamento com livros adquiridos legalmente como fair use (uso justo), comparando ao aprendizado humano. Porém, o uso de cópias piratas foi problemático. Em setembro de 2025, a Anthropic fechou acordo bilionário (cerca de US$ 1,5 bilhão) para compensar cerca de 500 mil obras.
- Kadrey et al. v. Meta (incluindo Sarah Silverman): Decisão similar em 2025 favoreceu a Meta em parte, considerando o treinamento como altamente transformativo, mas com limitações na apresentação de provas pelos autores.
- The New York Times v. OpenAI/Microsoft (desde 2023): Um dos mais acompanhados. O NYT acusa uso de milhões de artigos (inclusive burlando paywall). O processo continua em andamento, com decisões parciais em 2025 rejeitando alguns pedidos de dismiss. Não há decisão final sobre o mérito do fair use.
- Folha de S.Paulo v. OpenAI (Brasil, 2025): Acusação de violação de direitos autorais e concorrência desleal por uso de conteúdo jornalístico.
- Apple: Processada em 2025 por autores (incluindo neurocientistas) por uso de livros no treinamento do Apple Intelligence.
2. Casos de imagens e arte
- Andersen, McKernan e Ortiz v. Stability AI, Midjourney e DeviantArt (desde 2023): Primeira grande ação de artistas. Acusam coleta de bilhões de imagens da internet. Em 2024, o juiz permitiu que reclamações de infração prosseguissem. O caso está em andamento, com julgamento previsto para 2026/2027.
- Getty Images v. Stability AI: Processos nos EUA e Reino Unido. No UK (2025), a corte rejeitou a maioria das reivindicações de copyright, entendendo que os pesos de um modelo (ou model weights) não são cópias infratoras diretas, mas houve vitória parcial em trademark (marca d’água). Nos EUA, algumas reivindicações de trademark prosseguiram.
Outros destaques:
- Processos de gravadoras de música contra Suno e Udio (acordos de licenciamento em alguns casos).
- Ações contra NVIDIA, Google e outros por coleta de vídeos do YouTube.
- Mais de 50 casos só nos EUA até meados de 2025, com crescimento contínuo.
Argumentos centrais
- Dos autores/empresas de conteúdo: Falta de consentimento, reprodução não autorizada durante a coleta e treinamento, concorrência desleal e prejuízo econômico (perda de renda e substituição de trabalho humano).
- Das empresas de IA: Fair use (EUA) — o treinamento é transformativo, estatístico e não redistribui as obras originais. Comparação com busca do Google ou aprendizado humano. Diferenciação entre dados legais e piratas.
Tendências jurídicas (2025-2026)
- Tribunais americanos têm aceitado fair use quando os dados são obtidos legalmente, mas punido ou exigido compensação por pirataria.
- Acordos de licenciamento estão aumentando (ex.: com editoras e gravadoras).
- No Brasil e Europa, a proteção tende a ser mais favorável aos titulares de direitos (sem equivalente amplo ao fair use).
- Questões pendentes: se o modelo treinado em si é uma “cópia” infratora e responsabilidade por outputs que imitam estilos.
Impacto
Esses processos estão forçando a indústria a buscar parcerias pagas, opt-ins e maior transparência. Criadores ganham mecanismos de defesa (robots.txt, licenças coletivas), mas o avanço tecnológico também é considerado. O equilíbrio final dependerá de decisões de tribunais superiores e possíveis novas leis. O cenário continua evoluindo rapidamente. Muitos casos ainda estão em fase inicial ou em negociação.
Executivo da OpenAI alertou que Sam Altman está “abrindo portais para invocar alienígenas”.






































