Tag: bots

SciBotScan

SciBotScan

O SciBotScan é um modelo de inteligência artificial desenvolvido com base em um rigoroso processo de rotulagem e classificação de contas da plataforma X (antigo Twitter), com o objetivo de identificar contas humanas e bots que divulgam artigos científicos. A base de dados foi construída por meio da integração de algoritmos automáticos e fontes reconhecidas da literatura, complementada por uma verificação manual de mais de 13 mil contas. Ao final desse processo, foram identificadas 822 contas de bots e 12.945 contas humanas, com mais de 67 mil postagens analisadas. O dataset rotulado está disponível em: xxxxxx.

O modelo de classificação utiliza o algoritmo XGBoost e foi treinado com 46 features preditivas, considerando características de atividade, textualidade, comportamento temporal e estrutura dos nomes de usuário.

#FerramentasOnline #Twitter #Bots

Disponível em: https://scibotscanv3.streamlit.app/

O tráfego de bots online ultrapassará o tráfego humano até 2027, afirma o CEO da Cloudflare / Tech Crunch

O tráfego de bots online ultrapassará o tráfego humano até 2027, afirma o CEO da Cloudflare / Tech Crunch

Os bots estão dominando a web, de acordo com Matthew Prince, CEO da Cloudflare. Em uma entrevista na conferência SXSW em Austin esta semana, ele afirmou que, com a velocidade com que a inteligência artificial está crescendo, o tráfego de bots de IA ultrapassará o tráfego humano online até 2027.

Prince explicou que o uso da web por bots tem aumentado junto com o crescimento da tecnologia de IA generativa porque os bots são capazes de visitar muito mais sites para obter respostas às perguntas dos usuários em chatbots.

“Se um humano estivesse realizando uma tarefa — digamos, comprar uma câmera digital — e visitasse cinco sites, seu agente ou o bot que realiza essa tarefa geralmente visitará 1.000 vezes mais sites do que um humano real”, disse Prince. “Então, ele poderia visitar 5.000 sites. E esse é tráfego real, e essa é uma carga real, com a qual todos precisam lidar e levar em consideração.”

#Bots #Internet

via Tech Crunch

Disponível em: https://techcrunch.com/2026/03/19/online-bot-traffic-will-exceed-human-traffic-by-2027-cloudflare-ceo-says/

Moltbook, a nova rede social criada apenas para IA (e não para humanos) — e as dúvidas e preocupações que ela tem gerado / BBC

Moltbook, a nova rede social criada apenas para IA (e não para humanos) — e as dúvidas e preocupações que ela tem gerado / BBC

“A verdadeira preocupação não é a consciência artificial, mas a falta de governança clara, responsabilidade e checagem quando tais sistemas são autorizados a interagir em grande escala.”

“O Moltbook é menos uma ‘sociedade de IA emergente’ e mais ‘6.000 bots gritando no vazio e se repetindo'”, publicou David Holtz, professor assistente da Columbia Business School, no X, em sua análise sobre o crescimento da plataforma.

Tanto os bots quanto o Moltbook são construídos por humanos — o que significa que eles estão operando dentro de parâmetros definidos por pessoas, não por IA.

#Bots #Moltbook

via BBC

Disponível em: https://www.bbc.com/portuguese/articles/c3veq5lz51vo

Acesso aberto versus excesso aberto: DOAJ e bots de coleta de dados com IA / DOAJ

Acesso aberto versus excesso aberto: DOAJ e bots de coleta de dados com IA / DOAJ

2025 foi o ano em que essa nova extração excessiva de dados da web, impulsionada por IA para alimentar bibliotecas, bibliotecas e acervos de acesso aberto, oficialmente quebrou grandes partes da internet. Organizações de acesso aberto e patrimônio cultural, como a Wikipédia, as Bibliotecas da Universidade de Chapel Hill e o Diretório de Livros de Acesso Aberto (DOAB), documentaram publicamente lentidão, indisponibilidade e aumento nos custos de servidor devido ao aumento massivo no tráfego de bots. O termo “ataque de bot” tornou-se agora um termo genérico para ataques DoS puramente maliciosos e para o fenômeno mais recente de picos de tráfego provenientes de bots de extração de dados com IA financiados por investidores. Como o DOAJ está lidando com bots de raspagem de dados
Desde o início de 2025, o DOAJ tem observado um aumento constante no tráfego de seu site. Os primeiros seis meses do ano passado registraram um aumento de 43% nas visitas ao nosso site em comparação com o mesmo período de 2024, além de um crescimento constante mês a mês.

Os últimos seis meses de 2025 apresentaram um aumento de 419% em relação ao mesmo período de 2024, culminando em um único dia em meados de novembro, quando nosso tráfego atingiu um pico de 968% em relação ao ano anterior, resultando em lentidão significativa para os usuários do nosso site público e para nossa Equipe Editorial, que utiliza um sistema interno para avaliar as solicitações de periódicos para inclusão no DOAJ.

#AcessoAberto #Bots #IA

via DOAJ

Disponível em: https://blog.doaj.org/2026/01/26/open-access-vs-open-excess-doaj-and-ai-scraper-bots/

Deezer: faixas 100% IA têm reproduções infladas por ouvintes falsos / Giz

Deezer: faixas 100% IA têm reproduções infladas por ouvintes falsos / Giz

Embora a música totalmente gerada por IA represente atualmente apenas uma pequena fração dos streams na Deezer — aproximadamente 0,5% — é evidente que o principal objetivo do upload dessas faixas para plataformas de streaming é fraudulento. A Deezer descobriu que até 70% dos streams gerados por faixas totalmente produzidas por IA são, na verdade, fraudulentos.

A ferramenta de detecção de fraudes da Deezer se baseia em algoritmos que identificam comportamentos incomuns de streaming que não condizem com a forma como um usuário normal da Deezer consome música. Isso pode incluir milhares de streams para uma única música, streaming 24 horas por dia, 7 dias por semana, ou picos de audiência em determinados horários todos os dias. Ao detectar fraudes e manipulações de streaming de qualquer tipo, a Deezer exclui os streams dos pagamentos de royalties.

#IA #Deezer #Bots

Disponível em: https://gizbr.uol.com.br/deezer-faixas-ias-ouvintes-falsos/

Bots de IA ameaçam Repositórios Abertos: COAR cria força-tarefa / ABCD

Bots de IA ameaçam Repositórios Abertos: COAR cria força-tarefa / ABCD

Esses bots podem roubar propriedade intelectual, comprometer aplicativos web e identificar vulnerabilidades que resultem em incidentes de segurança ou violações de dados.

Para mitigar esse impacto, diversas medidas estão sendo utilizadas para minimizar ou impedir o acesso de bots de IA aos repositórios. Algumas dessas medidas são consideradas relativamente eficazes na proteção dos repositórios contra interrupções de serviço, mas também é evidente que elas dificultam o acesso aos repositórios por outros agentes mais bem-vindos, como usuários humanos individuais e sistemas benignos [1].

Para impedir bots de IA maliciosos e controlar a varredura e a raspagem de conteúdo, as organizações precisam de uma estratégia de segurança em várias camadas. Essa estratégia combina controles estáticos com recursos mais preditivos, dinâmicos e governança granular.

via ABCD

#Repositórios #Bots

Disponível em: https://www.abcd.usp.br/informa/repositorios-institucionais-e-os-bots-de-ia-coar-cria-forca-tarefa/

Como enfrentar trolls e bots na mídia: oito recomendações importantes / Laboratorio de Periodismo

Como enfrentar trolls e bots na mídia: oito recomendações importantes / Laboratorio de Periodismo

O surgimento massivo de trolls, bots e contas falsas em espaços digitais colocou as equipes de moderação de mídia diante de um desafio que afeta não apenas a qualidade do debate, mas também a própria sustentabilidade de suas comunidades.

Esses perfis automatizados ou manipuladores conseguem distorcer pesquisas, envenenar conversas, roubar conteúdo e, às vezes, alterar as métricas de tráfego apresentadas aos anunciantes. Nesse sentido, a revista Turi2 publicou um documento com oito recomendações para redações e editoras retomarem o controle sobre essas ameaças digitais.

#Jornalismo #Bots

Disponível em: https://laboratoriodeperiodismo.org/como-enfrentar-a-trolls-y-bots-en-medios-ocho-recomendaciones-clave/

Relatório diz que até 70% dos streamings de música gerada por IA no Deezer são fraudulentos / The Guardian

Relatório diz que até 70% dos streamings de música gerada por IA no Deezer são fraudulentos / The Guardian

Um relatório recente da Deezer alerta que até 70% dos streamings de músicas gerados inteiramente por inteligência artificial (IA) na plataforma são fraudulentos. Esses streamings são causados ​​por bots ou outras formas de manipulação que visam inflar números e obter royalties indevidamente. Embora as faixas criadas por IA representem apenas 0,5% do total de streamings, sua presença é muito mais significativa no volume de uploads diários: cerca de 20.000 faixas por dia, representando 18% de todas as músicas enviadas.

Para lidar com essa situação, a Deezer afirma ter ferramentas capazes de identificar com precisão o conteúdo produzido por modelos como Suno e Udio. As faixas detectadas como totalmente artificiais são explicitamente rotuladas, excluídas das recomendações algorítmicas e listas editoriais, e os streamings fraudulentos que geram não são contabilizados para o pagamento de royalties.

#Streaming #Deezer #Bots #Música

via The Guardian

Disponível em: https://www.theguardian.com/technology/2025/jun/18/up-to-70-of-streams-of-ai-generated-music-on-deezer-are-fraudulent-says-report

Wikifavelas: O dilema de uma plataforma atacada por robôs / Outras palavras

Wikifavelas: O dilema de uma plataforma atacada por robôs / Outras palavras

No primeiro semestre de 2025, a plataforma Wikifavelas, instância MediaWiki do projeto Dicionário de Favelas Marielle Franco, começou a apresentar picos de lentidão e quedas misteriosas que se assemelhavam a ataques de Negação de Serviço (mais conhecido pela sua sigla em inglês DDoS-Attack – Distributed Denial of Service). A equipe de TI, então, começou a investigar a causa do problema, dado que o número de usuários diários à plataforma não era grande o suficiente para implicar em indisponibilidade do sistema. Foi ao acessar o log que se descobriu um culpado inusitado para essa indisponibilidade do site: web-crawlers, robôs raspadores de páginas web de grandes empresas atuantes no ramo de IA, como OpenAI (dona do ChatGPT) e Google (responsável pela plataforma Gemini).

#Intenet #IA #Bots

via Outras Palavras

Disponível em: https://outraspalavras.net/tecnologiaemdisputa/wikifavelas-o-dilema-de-uma-plataforma-atacada-por-robos/

TI da biblioteca versus robôs de IA / University Libraries News

TI da biblioteca versus robôs de IA / University Libraries News

Uma onda recente de bots de inteligência artificial invadiu os sistemas de computador das Bibliotecas da Universidade da Carolina do Norte, causando uma grave interrupção em seus serviços. Esses bots automatizados enviaram simultaneamente milhares de solicitações ao catálogo online, sobrecarregando a capacidade dos servidores. Como resultado, o acesso de usuários humanos ao sistema foi limitado ou bloqueado durante o incidente, impactando seriamente as operações digitais da biblioteca.
Embora o ataque não tenha tido intenção diretamente maliciosa, seu impacto foi comparável ao de um ataque distribuído de negação de serviço (DDoS). Os bots foram projetados para extrair informações em massa do catálogo para alimentar modelos de inteligência artificial, sobrecarregando os sistemas. Esse fenômeno representa uma ameaça crescente aos arquivos digitais e coleções online de instituições culturais e acadêmicas.

via University Libraries News

#Bibliotecas #IA #Bots

Disponível em: https://library.unc.edu/news/library-it-vs-the-ai-bots/

Como os robos rastreadores / bots impactam as operações dos projetos da Wikimedia / Diff

Como os robos rastreadores / bots impactam as operações dos projetos da Wikimedia

Enquanto leitores humanos tendem a focar em tópicos específicos – geralmente similares –, robôs rastreadores tendem a “ler em massa” um número maior de páginas e visitar também as páginas menos populares. Isso significa que esses tipos de solicitações têm mais probabilidade de serem encaminhadas para o datacenter principal, o que as torna muito mais caras em termos de consumo de nossos recursos. 

Ao passar por uma migração de nossos sistemas, notamos que apenas uma fração do tráfego caro que chegava aos nossos datacenters principais estava se comportando como os navegadores da web normalmente fariam, interpretando o código javascript. Quando olhamos mais de perto, descobrimos que pelo menos 65% desse tráfego que consome recursos que obtemos para o site vem de bots, uma quantidade desproporcional, dado que as visualizações de página gerais de bots são cerca de 35% do total. 

#Wikipedia #Bots

via Diff

Disponível em: https://diff.wikimedia.org/2025/04/01/how-crawlers-impact-the-operations-of-the-wikimedia-projects/

Repositórios abertos estão sendo profundamente impactados por bots de IA e outros rastreadores / COAR

Repositórios abertos estão sendo profundamente impactados por bots de IA e outros rastreadores

Há um número crescente de bots de IA rastreando repositórios. Esses bots são tão agressivos que podem causar interrupções e interrupções nos serviços dos repositórios. Como resultado, alguns repositórios começaram a bloquear o acesso de máquinas às suas coleções, o que também está bloqueando inadvertidamente outros serviços de rede desejados, como agregadores acadêmicos, serviços de indexação e diretórios.

#Repositórios #Bots

via COAR

Disponível em: https://coar-repositories.org/news-updates/open-repositories-are-being-profoundly-impacted-by-ai-bots-and-other-crawlers-results-of-a-coar-survey/