Orbital

Mais de 50% da Web já é escrita por IA

Mais da metade do que é produzido da web é escrito por IA

O ranqueamento do Google ainda se baseia em conteúdo criado por humanos, por mais que a IA tenha dominado a Web

Em novembro de 2024, a quantidade de artigos gerados por inteligência artificial ultrapassou pela primeira vez a quantidade de artigos escritos por humanos publicados na web. Segundo um estudo da Graphite, mais de 52% do conteúdo novo online já é produzido por máquinas.

Para Francesco Agnellini, professor de Estudos Digitais e de Dados na Universidade de Binghamton, essa transformação levanta questões fundamentais: “Como uma pessoa pode competir com um sistema treinado com milhões de vozes que consegue produzir um texto a uma velocidade incrível? E se isso se tornar a norma, o que acontecerá com o trabalho criativo, tanto como ocupação quanto como fonte de significado?”

 

O estudo

A Graphite analisou 65 mil URLs selecionadas aleatoriamente do CommonCrawl, confirmando que cada uma estava em inglês, tinha marcação de esquema de artigo, pelo menos 100 palavras e data de publicação entre janeiro de 2020 e maio de 2025. Os resultados revelaram que:

Novembro de 2022: Lançamento do ChatGPT marca o ponto de virada
Novembro de 2023: Artigos gerados por IA atingem 39% do total publicado (apenas 12 meses após o ChatGPT)
Novembro de 2024: IA ultrapassa humanos, gerando mais de 50% dos novos artigos
Maio de 2025: Proporção estabiliza em torno de 52%, sem crescimento adicional significativo

Apesar do crescimento acelerado do uso de IA, o gráfico tende à estabilização recente. Fonte: Graphite

Por que a curva estabilizou?

A Graphite levantou a hipótese de que artigos gerados exclusivamente por IA não performam bem em buscas. Segundo a análise da consultoria, textos gerados puramente por IA representam apenas 3% dos resultados de pesquisa orgânica e geralmente têm classificação inferior ao conteúdo humano.

Em outras palavras, a humanidade foi salva pelo Google. Dessa forma, os motores de busca desenvolveram filtros sofisticados que priorizam conteúdo humano, com 86% dos resultados principais sendo de autores reais. Quando ferramentas tecnológicas respondem perguntas, baseiam-se em textos humanos em 82% dos casos.

 

O que está sendo gerado por IA

Uma leitura mais detalhada do estudo mostra que artigos gerados por IA consistem majoritariamente em conteúdo de interesse geral: atualizações de notícias, guias “como fazer” e reviews. Dessa maneira, o propósito econômico primário desse conteúdo é informar, e não expressar originalidade ou criatividade. Em outras palavras, a IA parece ser mais útil quando a escrita é de baixo risco.

Para calcular a porcentagem de conteúdo gerado por IA, a Graphite usou o Detector de IA do Surfer, classificando cada artigo como gerado por IA se o algoritmo previsse que mais de 50% do conteúdo fosse artificial.

Taxa de falso positivo: 4,2% (artigos humanos classificados como IA)
Avaliado em 15.894 artigos publicados antes do ChatGPT (janeiro 2020 – novembro 2022)

Taxa de falso negativo: 0,6% (artigos de IA classificados como humanos)
Avaliado em 6.009 artigos gerados pelo GPT-4o da OpenAI

Essas métricas sugerem que o algoritmo tem alta precisão, mas a Graphite reconhece limitações importantes, como por exemplo a questão dos artigos híbridos. Contudo, o estudo não avaliou a prevalência de conteúdo criado através da colaboração entre inteligência humana e artificial, onde a IA gera o rascunho inicial e o humano edita. Assim, a Graphite acredita que “artigos adaptados por humanos gerados por IA possam ser ainda mais prevalentes” que os 52% identificados. Porém essa distinção entre humano e máquina provavelmente se tornará menos significativa ao longo do tempo, particularmente à medida que mais escrita emerge dessas interações.

Todavia, apesar da inteligência artificial gerar mais de 50% do conteúdo, o tráfego online ainda privilegia conteúdo humano.  Cerca de 30% do conteúdo online é considerado menos útil, refletindo a saturação de textos artificiais. Esse cenário acalma temores de “inundação” de conteúdo de baixa qualidade, mas destaca a necessidade de melhorar a autenticidade na web.

 

A IA não é totalmente artificial

É importante notar que inteligência artificial não é inteiramente artificial, já que é treinada em material criado por humanos. Mas mesmo antes da IA, a escrita nunca foi inteiramente humana. Cada tecnologia, desde o pergaminho até a máquina de escrever, moldou como as pessoas escrevem e como os leitores interpretam.

Se você assumir que a IA avançará, talvez em ritmo mais lento que no passado recente, é possível que a escrita humana original se torne ainda mais valiosa.

Mais da metade do que é produzido da web é escrito por IA, porém a busca por conteúdo humano permanece constante.

O estudo da Graphite serve de alerta para agências empolgadas com possibilidade de automatizar totalmente a produção de conteúdo, já que textos gerados exclusivamente por IA têm classificação inferior ao conteúdo humano. Muita cautela é recomendada ao aplicar suas estratégias de conteúdo gerado exclusivamente por IA. Para empresas, isso significa investir em conteúdo humano de qualidade enquanto usa o ChatGPT estrategicamente para tarefas padrão. Já para criadores, isso significa desenvolver uma voz única e expertise que a IA não pode replicar. E para todos, significa manter visão crítica sobre o que lemos e valorizamos na web.

Como disse Stefano Soatto, professor de ciência da computação na UCLA: “Neste momento, é mais uma simbiose do que uma dicotomia.”

Sair da versão mobile