A escassez de disco rígido de IA está tornando mais caro e mais difícil arquivar a Internet / 404

A escassez de disco rígido de IA está tornando mais caro e mais difícil arquivar a Internet / 404

“O aumento exorbitante dos custos de discos rígidos e armazenamento, causado pelo boom dos data centers de IA, está tornando mais caro e mais difícil para arquivistas digitais, acadêmicos, a Wikipédia e entusiastas da preservação de dados salvarem e arquivarem a internet. Discos rígidos específicos, preferidos por algumas organizações de renome, como o Internet Archive, tornaram-se muito mais caros ou difíceis de encontrar, disseram arquivistas.” É mais uma forma pela qual a IA ameaça o Internet Archive.

#Internet #InternetArchive

via 404

Disponível em: https://www.404media.co/the-ai-hard-drive-shortage-is-making-it-more-expensive-and-harder-to-archive-the-internet/

O Internet Archive está em perigo / The Week

O Internet Archive está em perigo / The Week

O Internet Archive é uma organização sem fins lucrativos que está construindo uma “biblioteca digital de sites da internet e outros artefatos culturais”, de acordo com seu site. A organização usa rastreadores da web para capturar instantâneos de sites. Esses instantâneos são então disponibilizados por meio da ferramenta pública Wayback Machine, que funciona como uma biblioteca, fornecendo “acesso gratuito a pesquisadores, historiadores, acadêmicos, pessoas com deficiência visual e ao público em geral”. No entanto, em meio à ascensão da IA, o “compromisso do Internet Archive com o acesso gratuito à informação transformou sua biblioteca digital em um potencial problema para alguns veículos de notícias”, afirmou uma análise do Nieman Lab. (…)

A inteligência artificial é o principal motivo pelo qual sites estão bloqueando o Internet Archive. Há “evidências de que a Wayback Machine tem sido usada para treinar grandes modelos de linguagem”, afirmou a Forbes. O arquivo permite que empresas de tecnologia “contornem as leis de direitos autorais usando a Wayback Machine como uma solução alternativa para treinar modelos de linguagem em seu conteúdo”, disse o Morning Brew. Apesar disso, Mark Graham, diretor da Wayback Machine, “enfatiza que o arquivo digital possui controles para limitar o abuso da automação por IA e impedir a extração de dados em larga escala”.

#InternetArchive #Bots

via The Week

Disponível em: https://theweek.com/tech/internet-archive-ai-scraping-wayback-machine

Wayback Machine salva milhares de páginas da Web federais em meio à limpeza de dados do governo sob Trump / Democracy Now

Wayback Machine salva milhares de páginas da Web federais em meio à limpeza de dados do governo sob Trump

Embora seja normal para um novo governo revisar alguns de seus recursos online, o ritmo de destruição do governo Trump chocou muitos arquivistas. “Houve milhares e milhares de páginas removidas”, diz Mark Graham, diretor da Wayback Machine, que observa que até mesmo uma página sobre a Constituição dos EUA foi apagada do site da Casa Branca.

#InternetArchives #GovernoTrump

via Democracy Now

Disponível em: https://www.democracynow.org/2025/2/28/internet_archive_trump_admin_data_purge

Internet Archive e Wayback Machine estão fora do ar novamente / Mashable

Internet Archive e Wayback Machine estão fora do ar novamente

É outro revés frustrante para usuários que dependem dos vastos recursos da biblioteca digital, embora os detalhes sobre quem está causando essa nova interrupção ainda não estejam claros. Neste ponto, parece que este é o quarto — sim, o quarto — ataque cibernético ao Internet Archive desde o início de outubro.

via Mashable

#InternetArchive #WayBackMachine #CiberAtaque

Disponível em: https://mashable.com/article/internet-archive-down-again

Por que uma decisão contra o Internet Archive ameaça o futuro das bibliotecas dos Estados Unidos / MIT Technology Review

Por que uma decisão contra o Internet Archive ameaça o futuro das bibliotecas dos Estados Unidos

Se os tribunais não reconhecerem o empréstimo de bibliotecas baseado em CDL como uso justo, então o próximo passo cabe ao Congresso. As bibliotecas estão em crise, presas entre orçamentos em declínio e demanda crescente por serviços. O Congresso deve agir agora para garantir que um pilar de igualdade em nossas comunidades não seja sacrificado no altar do lucro. 

#EmpréstimoDigitalControlado #InternetArchive

via MIT Technology Review

Disponível em: https://www.technologyreview.com/2024/09/11/1103838/why-a-ruling-against-the-internet-archive-threatens-the-future-of-americas-libraries/

Digital versus Digitalizado: Sobre o argumento do recurso Hachette vs. Internet Archive / DLTJ

Digital versus Digitalizado: Sobre o argumento do recurso Hachette vs. Internet Archive

O tribunal federal do Distrito Sul de Nova York decidiu a favor de Hachette em 11 de agosto de 2024, mas a sentença foi suspensa enquanto se aguarda um recurso para o tribunal intermediário. As alegações orais da semana passada fizeram parte desse processo e agora aguardamos essa decisão. Pelos relatos que li, parece que ambas as partes estão preparadas para levar a questão ao Supremo Tribunal dos EUA, independentemente de quem vença.

#InternetArchive #Ebooks

via Disruptive Library Technology Jester
Disponível em: https://dltj.org/article/digital-versus-digitized/

Declaração da Internet Archive em recurso pelo direito de propriedade de livros digitais

Declaração da Internet Archive em recurso pelo direito de propriedade de livros digitais

“Os grandes conglomerados editoriais e seus aliados da Big Tech parecem decididos a transformar os dados dos leitores em um produto. O que lemos, quem somos, onde estamos – tudo isso. A maior coisa que está no seu caminho neste momento é o Internet Archive, que está a lutar pelo direito de possuir e preservar livros digitais no seu recurso de uma decisão de um tribunal inferior no caso Hachette v. Se as bibliotecas e os indivíduos possuírem livros digitais – em vez de os licenciarem – então poderemos escolher a forma como lemos e escolher alternativas que preservem a privacidade para empresas tecnológicas ávidas de dados como a Amazon, Hoopla ou Elsevier.

#InternetArchive

Disponível em: https://www.fightforthefuture.org/news/2024-06-27-statement-on-internet-archives-oral-arguments-in-appeal-for-the-right-to-own-digital-books/

The Wayback Machine, uma máquina do tempo para a web

The Wayback Machine, uma máquina do tempo para a web

A Wayback Machine faz backups da rede mundial de computadores desde 1996. Mark Graham, seu diretor, a descreve como “uma máquina do tempo para a web. Ela faz isso acessando e olhando páginas da web, centenas de milhões delas todos os dias agora mesmo e os armazena em nossos servidores.”

Até o momento, há quase 900 bilhões de páginas da web com backup, embora o cientista da computação Brewster Kahle ache que é uma piada cruel chamá-las de “páginas”, considerando sua curta vida útil: “A vida média de uma página da web é de cem dias antes de ser alterada ou excluída. ” ele disse.

#InternetArchives #TheWaybackMachine #PreservaçãoDigital

via CBS

Disponível em: https://www.cbsnews.com/news/the-wayback-machine-a-time-machine-for-the-web/

Google aposenta página em cache na busca: “não é mais necessário”

Google aposenta página em cache na busca: “não é mais necessário”

A função de carregar páginas em cache permitia visualizar um site da mesma forma que o próprio Google. Ao abrir um domínio dessa forma, o tempo de carregamento era bem menor, pois o usuário via apenas uma captura de tela do site, coletada pelo Internet Archive, na última vez que o Google o indexou.

via Gizmodo

#Google #InternetArchive

Disponível em: https://gizmodo.uol.com.br/google-aposenta-pagina-em-cache-na-busca-nao-e-mais-necessario/

Bibliotecas precisam de mais liberdade para distribuir livros digitais l “Na a s…

[ad_1]

Bibliotecas precisam de mais liberdade para distribuir livros digitais l “Na a semana passada, um juiz distrital em Nova York decidiu sobre Hachette Book Group, Inc. v. Internet Archive […].” #InternetArchives #Ebooks 🇺🇸 via The Atlantic theatlantic.com/ideas/archive/…
[ad_2]

Acesse o item em: https://www.theatlantic.com/ideas/archive/2023/03/publishers-librarians-ebooks-hachette-v-internet-archive/673560/

Battle for Libraries l “As grandes editoras estão processando para cortar a prop…

[ad_1]

Battle for Libraries l “As grandes editoras estão processando para cortar a propriedade e o controle dos livros digitais das bibliotecas, abrindo novos caminhos para a censura.” #InternetArchives #EmpréstimoDigital #Ebooks battleforlibraries.com
[ad_2]

Acesse o item em: https://www.battleforlibraries.com/

Garantindo os direitos digitais para as bibliotecas: Rumo a uma agenda política …

[ad_1]

Garantindo os direitos digitais para as bibliotecas: Rumo a uma agenda política afirmativa para uma Internet melhor l O Internet Archive lançou um guia para garantia de direitos digitais de bibliotecas. #InternetArchives #Bibliotecas #DireitosDigitais archive.org/details/bailey… https://t.co/azMJWaZcsA
[ad_2]

Acesse o item em: https://archive.org/details/bailey-menna-securing-digital-rights-for-libraries/page/n1/mode/2up