Às vezes, o fruto cai longe da árvore: um estudo de caso sobre erros de precisão na indexação automática do PubMed / Journal of the Medical Library Association

Às vezes, o fruto cai longe da árvore: um estudo de caso sobre erros de precisão na indexação automática do PubMed / Journal of the Medical Library Association

O erro de indexação mais comum foi o uso da palavra “apple” em símiles, metáforas e expressões idiomáticas (80, ou 59,2%), seguido pela presença de “apple” em nomes ou termos (50, ou 37%). Outros erros de indexação foram atribuídos ao uso de “apple” em acrônimos e, em um caso, a uma referência a Sir Isaac Newton. Conclusão: Conforme indicado pelos resultados deste estudo, a indexação automática pode cometer erros ao indexar registros que contêm palavras com significados não literais ou alternativos em seus títulos ou resumos. Os bibliotecários devem estar atentos à existência de erros de indexação automática e orientar os autores sobre a melhor forma de minimizar seus efeitos em seus próprios registros.

#IndexaçãoAutomática #RecuperaçãoDaInformação #PubMed

Disponível em: https://jmla.pitt.edu/ojs/jmla/article/view/2110

Catalogação Automática de Assuntos na Biblioteca Nacional da Alemanha

Indexação Automática de Assuntos na Biblioteca Nacional da Alemanha

A Biblioteca Nacional da Alemanha (DNB) começou a desenvolver soluções para catalogação automática de assuntos há 15 anos. O principal motivo para isso foi o enorme e crescente número de obras de mídia digital que precisavam ser indexadas. Atualmente, a DNB utiliza algoritmos e estruturas de código aberto para atribuir vários tipos de metainformações temáticas dessa forma.

Com base nesses casos de uso, apresentamos alguns aspectos da implementação da nossa “máquina de catalogação de assuntos” EMa, o ambiente para catalogação automática de assuntos em uso produtivo. Destacamos o conjunto básico de recursos e fornecemos uma introdução de alto nível ao sistema EMa produtivo. Descrevemos o design modular da arquitetura do software EMa, com o software de código aberto Annif como kit de ferramentas central.

#IndexaçãoAutomática #BibliotecaNacional #Alemanha

Disponível em: https://liberquarterly.eu/article/view/19422

Aumento de Metadados Usando PNL, Aprendizado de Máquina e Chatbots de IA: Uma Comparação

Aumento de Metadados Usando PNL, Aprendizado de Máquina e Chatbots de IA: Uma Comparação

Descobrimos que os chatbots de IA têm desempenho semelhante entre eles, superando os métodos de aprendizado de máquina que testamos, mostrando sua vantagem quando o método depende de dados locais para treinamento. Também descobrimos que, embora trabalhar com chatbots de IA seja mais fácil do que com código, obter resultados úteis deles ainda representa um desafio para o usuário. Além disso, encontramos erros conceituais alarmantes na saída de alguns chatbots, como a impossibilidade de contar o número de linhas de nossas entradas, o que justifica o erro como “erro humano”. Embora isso não seja uma evidência completa de que chatbots de IA podem ser usados ​​efetivamente para classificação de metadados, acreditamos que as informações fornecidas neste trabalho podem ser úteis para bibliotecários e curadores de dados no desenvolvimento de caminhos para a integração e o uso de ferramentas de IA para tarefas de curadoria de dados ou ampliação de metadados.

#Metadados #IA #IndexaçãoAutomática

Disponível em: https://arxiv.org/abs/2504.17189

Chatbots de IA e catalogação de assuntos: um teste de desempenho /

Chatbots de IA e catalogação de assuntos: um teste de desempenho

Usando um texto instrucional de catalogação bem estabelecido como base, os pesquisadores desenvolveram e administraram um teste projetado para avaliar a eficácia de três chatbots (ChatGPT, Gemini, Copilot) na atribuição de termos e números da Classificação Decimal de Dewey, Classificação da Biblioteca do Congresso e Cabeçalhos de Assunto da Biblioteca do Congresso. A quantidade e a qualidade dos erros nas respostas do chatbot foram analisadas.

#ChatGPT #Gemini #Copilot #CDD #LCSH #IndexaçãoAutomática #IA #Classificação

Disponível em: https://journals.ala.org/index.php/lrts/article/view/8440

Um experimento com o uso do ChatGPT para atribuição de assunto do LCSH em teses e dissertações eletrônicas / Cataloging & Classification Quarterly

Um experimento com o uso do ChatGPT para atribuição de assunto do LCSH em teses e dissertações eletrônicas

Os resultados sugerem que LLMs como o ChatGPT têm o potencial de reduzir o tempo de indexação necessário para atribuir termos de assunto de Cabeçalhos de Assunto da Biblioteca do Congresso (LCSH) para teses e dissertações, bem como melhorar a descoberta desse tipo de recurso em bibliotecas acadêmicas. No entanto, indexadores e catalogadores humanos continuam sendo essenciais para verificar e aprimorar a validade, exaustividade e especificidade dos títulos de assunto da Biblioteca do Congresso gerados por LLMs.

#Indexação #ChatGPT #LCSH #IndexaçãoAutormática

Disponível em: https://www.tandfonline.com/doi/full/10.1080/01639374.2024.2394516?af=R

Voltar ao topo