{"id":31916,"date":"2025-07-16T18:16:53","date_gmt":"2025-07-16T22:16:53","guid":{"rendered":"https:\/\/www.pedroandretta.info\/index\/?p=31916"},"modified":"2025-07-16T18:16:57","modified_gmt":"2025-07-16T22:16:57","slug":"engenharia-de-prompt-para-raspagem-bibliografica-na-web-scientometrics","status":"publish","type":"post","link":"https:\/\/www.pedroandretta.info\/index\/2025\/07\/engenharia-de-prompt-para-raspagem-bibliografica-na-web-scientometrics\/","title":{"rendered":"Engenharia de prompt para raspagem bibliogr\u00e1fica na web \/ Scientometrics\u00a0"},"content":{"rendered":"\n<p><strong>Engenharia r\u00e1pida para raspagem bibliogr\u00e1fica na web \/ Scientometrics\u00a0<\/strong><\/p>\n\n\n\n<p>O recente surgimento do ChatGPT est\u00e1 facilitando o desenvolvimento de prompts adequados que permitem a configura\u00e7\u00e3o do scraping para identificar e extrair informa\u00e7\u00f5es de bancos de dados. O objetivo deste artigo \u00e9 definir como usar eficientemente a engenharia de prompts para elaborar um modelo de entrada de dados adequado, capaz de gerar, em uma \u00fanica intera\u00e7\u00e3o com o ChatGPT-4o, um web scraper totalmente funcional, programado em linguagem PHP, adaptado ao caso de cat\u00e1logos bibliogr\u00e1ficos. Como exemplo de demonstra\u00e7\u00e3o, utiliza-se o cat\u00e1logo bibliogr\u00e1fico da Biblioteca Nacional da Espanha, com um conjunto de dados de milhares de registros.<\/p>\n\n\n\n<p>#ChatGPT #WebScraper #PHP<\/p>\n\n\n\n<p>Dispon\u00edvel em: <a href=\"https:\/\/link.springer.com\/article\/10.1007\/s11192-025-05372-5\">https:\/\/link.springer.com\/article\/10.1007\/s11192-025-05372-5<\/a><\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img data-recalc-dims=\"1\" decoding=\"async\" width=\"356\" height=\"600\" src=\"https:\/\/i0.wp.com\/www.pedroandretta.info\/index\/wp-content\/uploads\/2025\/07\/image-50.png?resize=356%2C600&#038;ssl=1\" alt=\"\" class=\"wp-image-31918\" srcset=\"https:\/\/i0.wp.com\/www.pedroandretta.info\/index\/wp-content\/uploads\/2025\/07\/image-50.png?resize=356%2C600&amp;ssl=1 356w, https:\/\/i0.wp.com\/www.pedroandretta.info\/index\/wp-content\/uploads\/2025\/07\/image-50.png?resize=178%2C300&amp;ssl=1 178w, https:\/\/i0.wp.com\/www.pedroandretta.info\/index\/wp-content\/uploads\/2025\/07\/image-50.png?w=453&amp;ssl=1 453w\" sizes=\"(max-width: 356px) 100vw, 356px\" \/><\/figure>\n","protected":false},"excerpt":{"rendered":"<p>Engenharia r\u00e1pida para raspagem bibliogr\u00e1fica na web \/ Scientometrics\u00a0 O recente surgimento do ChatGPT est\u00e1 facilitando o desenvolvimento de prompts adequados que permitem a configura\u00e7\u00e3o do scraping para identificar e extrair informa\u00e7\u00f5es de bancos de dados. O objetivo deste artigo \u00e9 definir como usar eficientemente a engenharia de prompts para elaborar um modelo de entrada<\/p><\/div>\n<div class=\"blog-btn\"><a href=\"https:\/\/www.pedroandretta.info\/index\/2025\/07\/engenharia-de-prompt-para-raspagem-bibliografica-na-web-scientometrics\/\" class=\"home-blog-btn\">Ler mais<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2}},"categories":[21],"tags":[3376,3552,3568],"class_list":["post-31916","post","type-post","status-publish","format-standard","hentry","category-informeci","tag-chatgpt","tag-webscraper","tag-webscraping"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","views":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/www.pedroandretta.info\/index\/wp-json\/wp\/v2\/posts\/31916","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.pedroandretta.info\/index\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.pedroandretta.info\/index\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.pedroandretta.info\/index\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.pedroandretta.info\/index\/wp-json\/wp\/v2\/comments?post=31916"}],"version-history":[{"count":0,"href":"https:\/\/www.pedroandretta.info\/index\/wp-json\/wp\/v2\/posts\/31916\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.pedroandretta.info\/index\/wp-json\/wp\/v2\/media?parent=31916"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.pedroandretta.info\/index\/wp-json\/wp\/v2\/categories?post=31916"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.pedroandretta.info\/index\/wp-json\/wp\/v2\/tags?post=31916"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}