IndexaçãoAutomática

17 de março de 2026

Um experimento simples sobre IA e indexação / Francisco Foz

Por Pedro Andretta em Informe-CI Tag IndexaçãoAutomática, InteligênciaArtificial, ODS

Um experimento simples sobre IA e indexação / Francisco Foz

A ideia do trabalho não surgiu de um grande plano de pesquisa. Veio mais de uma curiosidade prática. Ferramentas de IA generativa estão aparecendo em praticamente todos os lugares. A pergunta que me ocorreu foi simples.

O que acontece se colocarmos uma dessas ferramentas dentro de um processo clássico da biblioteconomia, como a indexação temática?

Foi daí que surgiu a experiência. Testar uma ferramenta baseada no Google Gemini para sugerir temas e possíveis associações com ODS a partir de textos acadêmicos.

Nada muito sofisticado. Mais um teste para observar o comportamento da ferramenta.

#IndexaçãoAutomática #ODS #IA

via Francisco Foz

Disponível em: https://franciscofoz.medium.com/um-experimento-simples-sobre-ia-e-indexa%C3%A7%C3%A3o-3dd0c4b8cdde

17 de novembro de 2025

Às vezes, o fruto cai longe da árvore: um estudo de caso sobre erros de precisão na indexação automática do PubMed / Journal of the Medical Library Association

Por Pedro Andretta em Informe-CI Tag IndexaçãoAutomática, Pubmed, RecuperaçãoDaInformação

Às vezes, o fruto cai longe da árvore: um estudo de caso sobre erros de precisão na indexação automática do PubMed / Journal of the Medical Library Association

O erro de indexação mais comum foi o uso da palavra “apple” em símiles, metáforas e expressões idiomáticas (80, ou 59,2%), seguido pela presença de “apple” em nomes ou termos (50, ou 37%). Outros erros de indexação foram atribuídos ao uso de “apple” em acrônimos e, em um caso, a uma referência a Sir Isaac Newton. Conclusão: Conforme indicado pelos resultados deste estudo, a indexação automática pode cometer erros ao indexar registros que contêm palavras com significados não literais ou alternativos em seus títulos ou resumos. Os bibliotecários devem estar atentos à existência de erros de indexação automática e orientar os autores sobre a melhor forma de minimizar seus efeitos em seus próprios registros.

#IndexaçãoAutomática #RecuperaçãoDaInformação #PubMed

Disponível em: https://jmla.pitt.edu/ojs/jmla/article/view/2110

18 de maio de 2025

Catalogação Automática de Assuntos na Biblioteca Nacional da Alemanha

Por Pedro Andretta em Informe-CI Tag Alemanha, BibliotecaNacional, IndexaçãoAutomática

Indexação Automática de Assuntos na Biblioteca Nacional da Alemanha

A Biblioteca Nacional da Alemanha (DNB) começou a desenvolver soluções para catalogação automática de assuntos há 15 anos. O principal motivo para isso foi o enorme e crescente número de obras de mídia digital que precisavam ser indexadas. Atualmente, a DNB utiliza algoritmos e estruturas de código aberto para atribuir vários tipos de metainformações temáticas dessa forma.

Com base nesses casos de uso, apresentamos alguns aspectos da implementação da nossa “máquina de catalogação de assuntos” EMa, o ambiente para catalogação automática de assuntos em uso produtivo. Destacamos o conjunto básico de recursos e fornecemos uma introdução de alto nível ao sistema EMa produtivo. Descrevemos o design modular da arquitetura do software EMa, com o software de código aberto Annif como kit de ferramentas central.

#IndexaçãoAutomática #BibliotecaNacional #Alemanha

Disponível em: https://liberquarterly.eu/article/view/19422

30 de abril de 2025

Aumento de Metadados Usando PNL, Aprendizado de Máquina e Chatbots de IA: Uma Comparação

Por Pedro Andretta em Informe-CI Tag IndexaçãoAutomática, InteligênciaArtificial, Metadados

Aumento de Metadados Usando PNL, Aprendizado de Máquina e Chatbots de IA: Uma Comparação

Descobrimos que os chatbots de IA têm desempenho semelhante entre eles, superando os métodos de aprendizado de máquina que testamos, mostrando sua vantagem quando o método depende de dados locais para treinamento. Também descobrimos que, embora trabalhar com chatbots de IA seja mais fácil do que com código, obter resultados úteis deles ainda representa um desafio para o usuário. Além disso, encontramos erros conceituais alarmantes na saída de alguns chatbots, como a impossibilidade de contar o número de linhas de nossas entradas, o que justifica o erro como “erro humano”. Embora isso não seja uma evidência completa de que chatbots de IA podem ser usados efetivamente para classificação de metadados, acreditamos que as informações fornecidas neste trabalho podem ser úteis para bibliotecários e curadores de dados no desenvolvimento de caminhos para a integração e o uso de ferramentas de IA para tarefas de curadoria de dados ou ampliação de metadados.

#Metadados #IA #IndexaçãoAutomática

Disponível em: https://arxiv.org/abs/2504.17189

11 de abril de 2025

Chatbots de IA e catalogação de assuntos: um teste de desempenho /

Por Pedro Andretta em Informe-CI Tag CDD, ChatGPT, Classificação, CoPilot, Gemini, IndexaçãoAutomática, LCSH

Chatbots de IA e catalogação de assuntos: um teste de desempenho

Usando um texto instrucional de catalogação bem estabelecido como base, os pesquisadores desenvolveram e administraram um teste projetado para avaliar a eficácia de três chatbots (ChatGPT, Gemini, Copilot) na atribuição de termos e números da Classificação Decimal de Dewey, Classificação da Biblioteca do Congresso e Cabeçalhos de Assunto da Biblioteca do Congresso. A quantidade e a qualidade dos erros nas respostas do chatbot foram analisadas.

#ChatGPT #Gemini #Copilot #CDD #LCSH #IndexaçãoAutomática #IA #Classificação

Disponível em: https://journals.ala.org/index.php/lrts/article/view/8440

21 de setembro de 2024

Um experimento com o uso do ChatGPT para atribuição de assunto do LCSH em teses e dissertações eletrônicas / Cataloging & Classification Quarterly

Por Pedro Andretta em Informe-CI Tag ChatGPT, Indexação, IndexaçãoAutomática, LCSH

Um experimento com o uso do ChatGPT para atribuição de assunto do LCSH em teses e dissertações eletrônicas

Os resultados sugerem que LLMs como o ChatGPT têm o potencial de reduzir o tempo de indexação necessário para atribuir termos de assunto de Cabeçalhos de Assunto da Biblioteca do Congresso (LCSH) para teses e dissertações, bem como melhorar a descoberta desse tipo de recurso em bibliotecas acadêmicas. No entanto, indexadores e catalogadores humanos continuam sendo essenciais para verificar e aprimorar a validade, exaustividade e especificidade dos títulos de assunto da Biblioteca do Congresso gerados por LLMs.

#Indexação #ChatGPT #LCSH #IndexaçãoAutormática

Disponível em: https://www.tandfonline.com/doi/full/10.1080/01639374.2024.2394516?af=R

11 de novembro de 2022

Lançada nova edição da Revista Española de Documentación Científica, do Consejo …

Por Pedro Andretta em Informe-CI Tag APC, Bibliotecas, Colômbia, COVID19, IndexaçãoAutomática, Psicólogas, Pubmed, RevistasCI, Teses

[ad_1]

Lançada nova edição da Revista Española de Documentación Científica, do Consejo Superior de Investigaciones Científicas – España l #Teses #IndexaçãoAutomática #Psicólogas #Bibliotecas #COVID19 #PubMed #APC #Colômbia #RevistasCI redc.revistas.csic.es/index.php/redc…
[ad_2]

Curadoria: Projeto Informe-CI

26 de julho de 2022

Extração de informações de documentos PDF para uso na indexação automática de e-…

Por Pedro Andretta em Informe-CI Tag IndexaçãoAutomática

[ad_1]

Extração de informações de documentos PDF para uso na indexação automática de e-books l No artigo, avaliação das ferramentas: PDFMiner Six, PDFAct, PDF-extract, PDFExtract e Grobib. “[…] PDFAct alcançou um desempenho superior […]” #IndexaçãoAutomática doi.org/10.1590/2318-0… https://t.co/7jsXZftDg8
[ad_2]

Curadoria: Projeto Informe-CI

23 de maio de 2022

DDC Short Numbers – Rumo à classificação baseada em aprendizado de máquina l “As…

Por Pedro Andretta em Informe-CI Tag CDD, Classificação, IndexaçãoAutomática, InteligênciaArtificial

[ad_1]

DDC Short Numbers – Rumo à classificação baseada em aprendizado de máquina l “As categorias de assunto geradas por máquina concordaram com as categorias de assunto atribuídas intelectualmente em 76% dos casos.” #Classificação #IndexaçãoAutomática #IA #CDD jlis.it/index.php/jlis… https://t.co/VvyzfaUrB6
[ad_2]

Curadoria: Projeto Informe-CI

Tag: IndexaçãoAutomática