Corpora contaminados: como a crise das retratações está sendo silenciosamente incorporada ao conhecimento científico da IA / Business Information Review
Este artigo argumenta que a crise de retratação na publicação acadêmica está cada vez mais presente em grandes conjuntos de dados de treinamento de modelos de linguagem (LLM, na sigla em inglês) por meio de acordos comerciais de licenciamento entre editoras e IA, que fornecem arquivos completos de periódicos sem filtragem de retratações. Utilizando uma abordagem conceitual-analítica, o artigo sintetiza três vertentes da literatura empírica: estudos sobre o crescimento de retratações e citações pós-retração, pesquisas que examinam as interações entre LLM e artigos retratados e acordos de licenciamento entre editoras e IA documentados (…) O estudo conclui que garantir a integridade do conhecimento científico gerado por IA requer uma governança da informação mais robusta e o envolvimento ativo de profissionais da biblioteconomia e da ciência da informação na supervisão dos conjuntos de dados de treinamento de IA.
#Ciência #ComunicaçãoCientífica #IA #Retratação
Disponível em: https://doi.org/10.1177/02663821261460796

Deixe uma resposta