Busque publicaciones científicas en Internet. Parte 2. Dónde y cómo buscar

Continuación (comienzo - aquí )



1.3. Motores de búsqueda: especializados y no tan



En general, los resultados de la búsqueda dependen principalmente de la tarea y la exactitud de la solicitud. Pero estos resultados suelen ser, por un lado,



a) redundantes

y, por otro, b) incompletos.



Afortunadamente, tanto los autores como los editores, por regla general, están interesados ​​en que los motores de búsqueda indexen la información sobre las publicaciones, pero hay algunos matices: no siempre se permite la indexación del contenido de los archivos PDF y, en algunos casos, solo ciertos motores de búsqueda pueden indexar sitios (por ejemplo, el más grande la biblioteca electrónica nacional elibrary.ru prohibió en un momento la indexación de la mayoría de los archivos para google).



Entre otras cosas, los resultados de la consulta dependen del orden de las palabras y de la dirección IP desde la que se realiza la búsqueda.



Si hablamos de la búsqueda de publicaciones, entonces la pregunta "qué motor de búsqueda usar" tiene una respuesta: Google (esto sin contar los buscadores bibliográficos especializados, sobre ellos más abajo).



Primero, Google indexa el contenido de la web de forma bastante completa. En segundo lugar, una gran cantidad de configuraciones de búsqueda avanzada (incluidas aquellas con el uso de operadores) facilitan enormemente el trabajo. En tercer lugar, como ya indiqué, el contenido de los archivos pdf está indexado por googl incluso si el pdf consta de imágenes y la capa de texto está ausente en el archivo.







, . Pander, C. H. (1830). Beiträge zur Geognosie des Russischen Reiches. St.Petersburg, Karl Kray. 150 S.







Configuración de búsqueda avanzada de Google. En Yandex, desafortunadamente, la mayoría de las configuraciones de búsqueda avanzada que estaban disponibles anteriormente han desaparecido hace mucho tiempo, hay pequeñas cosas como buscar por extensión de archivo (solo en lugar del tipo de archivo de Google: se usa el operador mime :)



Para buscar publicaciones, las más útiles son las configuraciones avanzadas y los operadores que le permiten limitar la búsqueda a archivos un determinado formato (por ejemplo, pdf usando filetype: pdf), ciertos sitios / dominios. Por ejemplo, si necesito ver qué sitios chinos han publicado publicaciones en formato pdf, dónde se mencionan las amonitas, esta consulta me ayudará: ammonites filetype: pdf site: cn... Bueno, "+" y "-" se utilizan para indicar términos obligatorios o indeseables. Por ejemplo, al buscar información sobre cefalópodos, amonitas, generalmente no necesita información sobre el explosivo del mismo nombre o una tribu que alguna vez vivió en el Medio Oriente y que se menciona regularmente en la Biblia. En consecuencia, la solicitud se puede corregir de la siguiente manera: ammonites tipo de archivo: pdf -explosivos -Biblia

Si está buscando una publicación específica, entonces es conveniente poner parte de su título o el título completo entre comillas.



También es importante que Google tenga dos proyectos separados que están directamente relacionados con la búsqueda de publicaciones:



1) Google booksEn realidad, es un motor de búsqueda independiente que indexa el contenido de una gran cantidad de libros, revistas, colecciones y otras publicaciones. Al mismo tiempo, una parte importante de las publicaciones está disponible para su descarga en formato pdf (por regla general, se trata de publicaciones antiguas, de principios del siglo XX en adelante); dependiendo de la IP, la lista de publicaciones disponibles para descargar puede variar significativamente, el número máximo de obras está disponible para usuarios de Estados Unidos.



Hay muchas publicaciones disponibles para su visualización total o parcial. Estos trabajos se pueden descargar utilizando programas especiales como el descargador de libros de Google EDS o complementos (como Greasemonkey para Mozilla combinado con un programa de descarga automática de archivos como Download Master ).



Y, finalmente, se puede obtener un beneficio considerable incluso de la información que está presente en publicaciones que generalmente son inaccesibles para su visualización en cualquier forma, excepto por fragmentos en varias líneas ( vista de fragmentos ). Sin embargo, existen dos dificultades principales con estas publicaciones:



a) por supuesto, puede intentar buscar esas obras en otro lugar, pero la probabilidad de que estén disponibles solo en la biblioteca es bastante alta.



b) hay mucha confusión en los nombres de las fuentes (especialmente aquellas que originalmente no se dieron en latín), y la información mostrada suele ser incompleta.



Sin embargo, la información contenida en dichos fragmentos puede ser muy importante y prácticamente no se puede encontrar de otras formas.







Así es como se ve una versión típica de la publicación en Google Books en el formato de vista de fragmentos: como regla, falta parte de la información bibliográfica necesaria (el número de edición de la revista, a veces partes importantes del título de la publicación). Es bueno si la revista tiene 2 números al año. ¿Y si 20? ¿Qué pasa si el nombre está mal escrito?



2) Google Académico(Academia de Google en ruso). Se trata de un motor de búsqueda bibliográfica que busca bien tanto los artículos en sí como los enlaces a ellos, al mismo tiempo que le permite copiar inmediatamente los títulos de las publicaciones formateadas según los tipos de citas populares (APA, Harvard, GOST, etc.). Entre las comodidades de este sistema está el hecho de que no solo se indexan los sitios de los editores, sino también las redes sociales especializadas y una variedad de sitios donde los artículos científicos a menudo se presentan de forma gratuita, y todos los enlaces a las versiones de texto completo se agrupan en un solo grupo. Sin embargo, Google Académico no indexa todas las publicaciones; es fácil de verificar con la misma consulta de búsqueda "palabras clave" tipo de archivo: pdfen Google y Google Scholar. Esta distinción es especialmente pronunciada con palabras clave raras.



Bueno, la característica más útil de Google Scholar es la capacidad de suscribirse a una variedad de notificaciones (más sobre esto en la continuación de esta publicación)







Emisión de búsquedas de palabras clave en Google Scholar. Preste atención a las opciones de clasificación, las opciones de rango de tiempo y los grupos de artículos.



Los motores de búsqueda bibliográfica (BPS) orientados a trabajar con publicaciones son ahora muy diversos y numerosos. Además de los proyectos de Google anteriores, se pueden señalar los siguientes sitios, que se pueden considerar como BPS:



1) sitios que indexan una gran cantidad de publicaciones en todo el mundo. En primer lugar, este es Scopus yWeb of Science , disponible por suscripción (en el caso de Scopus, también se proporciona acceso a revisores de las revistas de Elsevier), así como el sitio más grande que asigna DOI a publicaciones ( CrossRef ) o un agregador de información sobre publicaciones, becas, investigadores, etc. Dimensiones .



Todos ellos, excepto Dimensions, le permiten buscar información sobre una cantidad limitada de datos; esto es principalmente un título / palabras clave / currículum. Para peor, CrossRef se destaca aquí: allí la búsqueda se realiza solo por nombre y con una referencia estricta a la forma de la palabra. Es cierto que CrossRef tiene significativamente más publicaciones en ruso indexadas que en otros BTS desde este punto, y además, esta es la forma más conveniente de resolver un problema como "Tengo un nombre de publicación, necesito encontrar su DOI" (todos los DOI no se pueden encontrar así el único registrador de identificadores digitales para publicaciones, también existe DataCite, por ejemplo, pero, curiosamente, simplemente no existe un servicio universal para resolver ese problema).





Búsqueda simple en Dimensiones



Dimensions es un proyecto muy interesante que ha aparecido recientemente, principalmente debido a una variedad de entornos diferentes, una amplia cobertura de publicaciones (solo se indexan las publicaciones con DOI, todavía hay un poco menos que en CrossRef) y búsqueda de texto completo. Más bien, aquí puede seleccionar diferentes opciones de búsqueda (texto completo / por currículum / por título y palabras clave). Los resultados se pueden ordenar de una amplia variedad de formas (fecha / relevancia / número de enlaces / número de altmetrics), y se pueden limitar por diferentes parámetros (fuente / autor / años / tema y mucho más). Las dimensiones tienen diferentes versiones (incluidas las de pago y las corporativas), aquí solo se considera la opción gratuita (todavía no hemos tratado con otras). Por separado, puede buscar información tanto por publicaciones,y en bases de datos y subvenciones (la última opción solo está disponible mediante suscripción).







Analytical view , , ( — 2016 2020 ). , , ..



Se ofrecen opciones adicionales en la pestaña Vista analítica. Facilitan la comprensión de quién está involucrado en un tema en particular ahora o en cualquier intervalo de tiempo seleccionado, en qué revistas estas personas escriben artículos y con qué coautores. Esta es una manera conveniente de encontrar coautores y revisores potenciales, especialmente para aquellos que acaban de comenzar a trabajar en un tema y no tienen una idea muy clara de lo que se está haciendo con él a escala global. Para aquellos investigadores que tienen un ORCID en sus artículos, el perfil contiene tanto este identificador como el ID del autor de Scopus, así como (si está disponible) el perfil / ResearcherID en Publons que se adhiere a ellos automáticamente. Repito: Dimensions es un proyecto extremadamente útil e intuitivo. Puede presionar todos los botones seguidos y acceder a todas las pestañas.



2) también los sitios de las mayores editoriales internacionales (Elsevier, Wiley, Springer, Taylor & Francis, etc.) y los distribuidores (Ingentaconnect, GeoscienceWorld) de publicaciones científicas pueden considerarse como BTS especializados. Sin embargo, limitar los resultados de la búsqueda a uno u otro editor o distribuidor generalmente no es beneficioso y puede ser útil para familiarizarse brevemente con un tema en particular.



3) hasta cierto punto, las funciones de BTS son realizadas por redes sociales científicas ( Academia.edu , ResearchGate ), así como un "híbrido" de una red social y un gestor bibliográfico Mendeley (tanto una versión offline como programa como su versión online están disponibles); muchas opciones de Scopus ahora están disponibles allí después de que Elsevier compró Mendeley). Sin embargo, el contenido de las redes sociales científicas está bien indexado por googl, por lo que tiene sentido navegar regularmente por el feed de actualizaciones en busca de algo completamente nuevo.



4) en una categoría separada de BTS, se pueden distinguir sitios regionales o especializados, donde principalmente hay datos sobre publicaciones publicadas en cualquier país o varios países (por ejemplo, la Biblioteca Nacional Electrónica elibrary.ru en Rusia, el Instituto Nacional de Informática en Japón, la Biblioteca Nacional Francia ), así como sitios especializados dedicados a algunas áreas científicas específicas (por ejemplo, la Biblioteca del Patrimonio de la Biodiversidad(BHL))



Un rasgo característico de dichos portales es que son extremadamente reacios a permitir que los motores de búsqueda de terceros indexen su contenido, por lo que si necesita encontrar algo en francés o japonés, es más confiable buscar en los sitios relevantes y buscar allí.







Hasta hace poco, en el sitio web de la Biblioteca Nacional de Francia, toda la interfaz era francesa, hasta que finalmente adjuntaron allí primero una versión en inglés del sitio y luego la traducción automática sobre IP.



Por separado, debería decirse sobre BHL. Este es un proyecto extremadamente útil para todos los investigadores que de alguna manera están involucrados en el estudio de organismos modernos o fósiles. Esta biblioteca se distingue por una amplia gama de fuentes (incluidas varias rarezas) y la presencia de herramientas de búsqueda especiales (como una búsqueda de taxón en la pestaña Búsqueda avanzada; si alguien recopila materiales sobre un grupo particular de animales y plantas, esta es una muy buena manera de encontrar rápidamente publicaciones en tema). Entre las deficiencias de BHL, se puede observar que la capa de texto a menudo se puede reconocer incorrectamente (con el idioma incorrecto), así como la calidad monstruosa de las ilustraciones predeterminadas (la calidad de un .djvu borroso mal).



Dado que la calidad de la imagen suele ser de gran importancia para los estudios taxonómicos, el enfoque más correcto aquí es descargar la publicación requerida en formato jp2 y luego procesar los archivos (primero reformatear en jpg / tiff normal, luego procesar ScanTailor y OCR). Por cierto, todas las publicaciones de BHL se publican en archive.org y, a veces, es más conveniente realizar una búsqueda de texto completo exactamente en archive.org (esto puede ser relevante en caso de buscar alguna rareza; algo interesante puede encontrarse aquí, incluidas las subidas por los usuarios.







Un ejemplo de salida al buscar por taxón en BHL







Si necesita un PDF de alta calidad, es mejor guardar el archivo usando el método "Descargar contenido - Descargar libro - Descargar JPEG 2000" y luego procesarlo



Y, por supuesto, si necesita encontrar publicaciones en ruso, no puede prescindir de buscar en la biblioteca en combinación con cyberleninka . Aunque la cobertura de las fuentes en la elibrary es mucho mayor, normalmente nos encontramos con una situación en la que el elibrary ofrece pagar por un artículo, y en el sitio web de Cyberleninki el mismo artículo es de dominio público.



A pesar de una serie de deficiencias inherentes a la biblioteca, parece desde el nacimiento (la imposibilidad de descargar incluso trabajos de acceso abierto sin ingresar un nombre de usuario / contraseña; la falta de una versión en inglés y la opción de suscribirse a ciertas actualizaciones), la búsqueda allí es bastante decente. Pero si es necesario realizar un seguimiento regular de la información en revistas en ruso, también vale la pena crear un directorio separado de enlaces a los sitios de las publicaciones necesarias; en la biblioteca no puede adivinar cuándo y por qué pueden cerrar repentinamente el acceso a ciertas publicaciones. Y una cosa más: en el caso de que la revista no sea de dominio público y se distribuya solo por dinero tanto a través de la biblioteca como a través del sitio web de la editorial, en el sitio web de la editorial, los artículos pueden ser más baratos (tal es la situación, por ejemplo, con la revista "Oil Industry" ).







Configuración de búsqueda avanzada en la biblioteca (en la página de inicio del sitio, en la parte superior izquierda del enlace "búsqueda avanzada"). El historial de consultas de búsqueda anteriores también se guarda aquí



5) Los proyectos "piratas" más grandes que brindan acceso gratuito a publicaciones científicas, SciHub y LibGen , pueden considerarse BTS , ya que tienen la capacidad de buscar por título de publicación o palabras clave de una forma u otra.

Y si sci-hub se puede usar como una adición conveniente a la búsqueda en Dimensions, entonces aparecen regularmente monografías raras en LibGen, que no se encuentran en ningún otro lugar; son escaneadas por entusiastas y publicadas en LibGen en privado.



Y finalmente, cabe mencionar por separado sobre la búsqueda de disertaciones. Aunque muchas disertaciones (tanto rusas modernas como a veces extranjeras bastante antiguas) se publican en Internet en el dominio público y son indexadas por motores de búsqueda, tiene sentido consultar el sitio web de VAK para obtener información sobre las últimas disertaciones que solo se planea defender . Allí, las disertaciones ahora se pueden buscar por especialidad, palabras clave, fecha de defensa y otros parámetros (en este caso, la búsqueda se realiza por separado para las disertaciones de VAK y por separado para las que se defienden en los consejos de las organizaciones que tienen derecho a otorgar títulos de forma independiente). Pero hay un matiz: si tiene uBlock Origin instalado, bloquea la búsqueda en este sitio.







Un ejemplo de búsqueda en el sitio web de VAK



Continuará.



All Articles