O Internet Archive está em perigo / The Week

O Internet Archive está em perigo / The Week

O Internet Archive está em perigo / The Week

O Internet Archive é uma organização sem fins lucrativos que está construindo uma “biblioteca digital de sites da internet e outros artefatos culturais”, de acordo com seu site. A organização usa rastreadores da web para capturar instantâneos de sites. Esses instantâneos são então disponibilizados por meio da ferramenta pública Wayback Machine, que funciona como uma biblioteca, fornecendo “acesso gratuito a pesquisadores, historiadores, acadêmicos, pessoas com deficiência visual e ao público em geral”. No entanto, em meio à ascensão da IA, o “compromisso do Internet Archive com o acesso gratuito à informação transformou sua biblioteca digital em um potencial problema para alguns veículos de notícias”, afirmou uma análise do Nieman Lab. (…)

A inteligência artificial é o principal motivo pelo qual sites estão bloqueando o Internet Archive. Há “evidências de que a Wayback Machine tem sido usada para treinar grandes modelos de linguagem”, afirmou a Forbes. O arquivo permite que empresas de tecnologia “contornem as leis de direitos autorais usando a Wayback Machine como uma solução alternativa para treinar modelos de linguagem em seu conteúdo”, disse o Morning Brew. Apesar disso, Mark Graham, diretor da Wayback Machine, “enfatiza que o arquivo digital possui controles para limitar o abuso da automação por IA e impedir a extração de dados em larga escala”.

#InternetArchive #Bots

via The Week

Disponível em: https://theweek.com/tech/internet-archive-ai-scraping-wayback-machine

Deixe uma resposta