UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE CIENCIAS
RECURSOS BIBLIOMÉTRICOS EN SCI Y PUBMED PARA LA HISTORIA DE LA CIENCIA
SEMINARIO DE TITULACIÓN
QUE PARA OBTENER EL TÍTULO DE: BIÓLOGO PRESENTA:
TANIA CORTÉS VILLAFRANCO
DIRECTORA DEL SEMINARIO DE TITULACIÓN: DRA. LAYLA MICHÁN AGUÍRRE 2010
Índice: Resumen……………………………………………………………………..……...3 Justificación………………………………………………………………..………..5 Introducción…………………………………………………………..……………..6 Objetivos.………………………………………………………………….………..10 Material y Método………………………………………………………….….......11 Resultados……………………………………………………………….………....20 Discusión………………………………………………………………….………..39 Conclusiones……………………………………………………………….……...63 Perspectivas……………………………………………………………….………65 Apéndices……………………………………………………………………........66 Referencias……………………………………………………………...………...68
2
RESUMEN La posibilidad de realizar análisis de cantidades inmensas de documentos científicos simultáneamente y de manera automática a través de aplicaciones disponibles en la web (meta-análisis) constituye una herramienta novedosa para la investigación historiográfica de la ciencia. En especial a partir de 1900, acorde al crecimiento exponencial de los investigadores, las instituciones, las publicaciones y los subsidios, todos ellos actores imprescindibles en la práctica científica e imposibles de evaluar de manera integral con algún otro enfoque tradicional, razones por las cuales esta herramienta podría constituirse en un componente básico de los denominados estudios sobre la ciencias en los que interactúan la historia, la filosofía, la sociología, la etnología, la evaluación y la política científica por ejemplo. Para cualquier análisis cuantitativo de bibliografía (basado en la cantidad de registros) primero es necesario identificar las características básicas de la producción científica general y global de una disciplina y caracterizarla por medio de análisis bibliométricos para obtener los indicadores básicos, (que constituyen el sustento de cualquier estudio basado en literatura contenida en bases de datos bibliográficas especializadas). En el presente trabajo se exploran, sistematizan y explican los recursos bibliométricos básicos disponibles en la Web de dos bases de datos bibliográficas: SCI (Science Citation Index) de Thomson Reuters y PubMed del NIH (National Institute of Health) para identificar proporciones y tendencias de manera directa, simultánea, automatizada, eficiente, inmediata, actualizada, exhaustiva y organizada con aplicación en la historia de la ciencia utilizando como objeto de estudio un caso biológico, la investigación científica acerca de la mosca Drosophila melanogaster, uno de los organismos multicelulares mejor caracterizados (principalmente a nivel genético), representada mediante su producción bibliográfica. Se analizaron 48, 981 registros totales extraídos de SCI y 34, 300 de PubMed. En SCI se analizan bibliométricamente los campos: autor, país, tipo de documento, institución, idioma, publicación por año y el comparativo de Drosophila con otros nueve géneros comúnmente usados como organismos modelo en biología experimental. Posteriormente se presentan los 50 documentos con más citas sobre Drosophila, el análisis de las revistas más productivas, la proporción y la tendencia temporal de las disciplinas más comunes en la investigación sobre Drosophila. Se compara la producción de ambas bases de datos y finalmente se exponen los resultados obtenidos para PubMed respecto a: publicación por año y palabras clave: encabezados (headings) y calificadores (qualifiers), ambos descriptores adicionales del tesauro de PubMed, el MeSH (Medical Subject Headings); con lo cual se ejemplifican y establecen las tendencias globales de la investigación. Se presenta el método básico usado para obtener proporciones y tendencias de la producción académica en estas bases de datos. Las ventajas del análisis métrico en línea obtenido de los sistemas de información SCI y PubMed 3
son: rapidez, bajo costo (dependiendo del acceso de la institución), se obtienen resultados instantáneos usando herramientas de procesamiento avanzadas y los resultados son reproducibles. También se describen y comparan las principales características bibliométricas de ambas bases de datos para el estudio de la ciencia actual. PubMed provee libre acceso al público especializado y en general, a diferencia de SCI que pertenece a proveedores comerciales y por lo tanto requiere una cuota de acceso. La búsqueda por palabras clave de PubMed ofrece una frecuencia de actualización óptima e incluye versiones previas de los artículos en línea. En Web of Science existen más posibilidades de búsquedas, se pueden realizar búsquedas rápidas (introduciendo un tema), búsquedas avanzadas, búsquedas generales y búsqueda de referencias y citas; y cada búsqueda puede ser limitada por autor citado, trabajo citado, años citados, también puede consultarse el índice de autor citado y el índice de trabajo citado.
4
JUSTIFICACION La revolución informática es causa y efecto del progreso científico y tecnológico del siglo XX, este cambio ha afectado de manera importante la manera en la que se comunica, cataloga, consulta, analiza y almacena la bibliografía. El poder de las nuevas tecnologías electrónicas ha aumentado de manera exponencial, se han diseñado gran cantidad de aplicaciones que permiten agrupar, clasificar y visualizar los documentos de manera inmediata y sistematizada lo que ha reducido la energía, el costo y el tiempo requeridos para el análisis de la literatura especializada. Los documentos sobre temas científicos que se producen en la actualidad son diversos, su cantidad es colosal y la mayoría de la bibliografía primaria (artículos) se encuentran en línea sistematizados en bases de datos, catálogos o listas; su consulta puede ser libre o restringida; consta de: libros, revistas, artículos páginas electrónicas. Implica la mención de términos, métodos, teorías novedosas e innovadores como: ciberinfraestructura, e-ciencia, e-investigación, redes, colaboratorios, conocimiento basado en la literatura, minería de textos, web semántica, índice de impacto, cocitación, web 2.0 y 3.0, computación en nube, redes sociales, plagio, por mencionar los más comunes. La principal fuente de información certificada que utilizan los científicos está en los documentos, especialmente en los artículos de investigación, revisiones y memorias de congresos. Los estudios bibliométricos encargados de estudiar cuantitativamente estos documentos han tenido un auge importante durante las últimas décadas, simultáneo al apogeo de las ciencias y las tecnologías de la información y comunicación, que han fomentado el aumento, digitalización y sistematización de la información y la producción de una gran cantidad y diversidad de bases de datos bibliográficas. Así se manejan cantidades inmensas de datos y se aplican análisis estadísticos e indicadores matemáticos para reconocer las regularidades de la producción y la difusión de la ciencia, respecto a publicación, autoría, colaboración e impacto de las disciplinas, los temas, las regiones, los investigadores y las instituciones, por mencionar algunos.
5
INTRODUCCIÓN Desde el año de 1950 las TICs (Tecnologías de la Información y la Comunicación) han tenido un desarrollo espectacular, se han diseñado gran cantidad de herramientas, recursos y servicios electrónicos (ciberinfraestructura) de innumerables tipos y capacidades inéditas para generar, sistematizar, compartir, transmitir, analizar y difundir la información (Atkins et al., 2003). Todas ellas han repercutido de manera dramática en las relaciones científicas, sociales, económicas, políticas y culturales del mundo (Morales, 2003). Durante los últimos años ha habido un crecimiento vertiginoso de las publicaciones científicas, en especial los artículos y las memorias de congresos, se calcula que para la primavera del 2006 existían 23, 750 revistas académicas que publicaron aproximadamente 1, 346, 000 documentos (Björk et al., 2009). Este aumento se debe a la adopción del formato electrónico en los documentos lo que ha promovido la edición, aumentado la difusión y disminuido los costos de las publicaciones (Arunachalam, 1999), además ha reducido el trabajo, el costo y el tiempo requeridos para acceder a ellos (Van Orsdel y Born, 2006). La cantidad, variedad y sofisticación es tal, que se producen a diario nuevas y variadas herramientas para realizar búsquedas más eficientes y precisas de bibliografía, para realizar mejores y más extensos análisis (Hull et al., 2008), tener acceso inmediato a los datos de una gran variedad de fuentes especializadas de diversas procedencias y temas; lo que ha fomentado la colaboración, la integración y la interdisciplinariedad en la práctica científica (NSF, 2005). Por otro lado el desarrollo de las bases de datos bibliográficas, la construcción de algoritmos y el uso de Internet, han permitido formas sistémicas de análisis de cantidades colosales de información (terabites) (Neufeld y Cornog, 1986; Saracevic, 1999). Todo ello ha fomentado el origen de nuevas (inter) disciplinas que han generado nuevas formas de sistematizar, acceder y analizar la información generada por los científicos, acorde con el progreso de sus propias prácticas (Schoepflin y Glanzel, 2001; Schubert, 2002) y que aplican métodos innovadores, técnicas novedosas y herramientas integradoras lo que ha repercutido de manera importante en la forma de hacer investigación bibliográfica. La herramienta utilizada por excelencia para sistematizar la literatura son las bases de datos; el diseño y la difusión de una gran cantidad de colecciones bibliográficas (también llamadas reservorios, repositorios) disponibles sobre temas biológicos, particularmente las de ciencias biomédicas que se pueden consultar en línea, fue sin duda, el resultado de un fenómeno representativo de finales del siglo XX y principios del siglo XXI (Lowe et al., 1996). En general todas las bases de datos bibliográficas actuales son relacionales (constan de tablas relacionadas), se caracterizan por contener la información necesaria para localizar un documento, esto es el registro bibliográfico básico también llamado asiento o ficha bibliográfica, se refiere a la información básica que describe uno o más documentos 6
tratados como una entidad que permiten identificar un documento sobre un tema o autor determinado para localizarlo y adquirirlo. En general está información va acompañada de meta-datos e incluso la liga al documento en texto completo en varios formatos. La información que contiene generalmente se refiere a: 1) los documentos (generalmente artículos) como título, tipo de documento, idioma, palabras clave, descriptores, volumen, número y páginas; 2) la fuente de donde provienen (principalmente revistas) como título, año de publicación y tema; y 3) la autoría, el o los nombres de los autores, institución de inscripción y país. Para cada documento (o la fuente en algunos casos) se asignan descriptores para clasificarlos y utilizarlos posteriormente como referencia para recuperarlos por medio de las búsquedas. Los índices más completos también contienen resúmenes, referencias, citas, ligas al documento en texto completo (libre o restringido a un pago), los documentos relacionados, análisis bibliométricos sencillos (cuentas de autores, temas, países, tipo de documento, idioma y descriptores) o complejos (citación, vida media e índice h), catálogos y tesauros, y herramientas electrónicas para salvar, etiquetar (tagging), almacenar, sistematizar, analizar y manejar las referencias recuperadas. Entre las características más importantes a considerar en una base de datos documentales están: la cantidad de registros y el tipo de campos que capturan, los criterios de inclusión, sistematización, relación y clasificación de la información (para lo cual se utilizan catálogos y tesauros diseñados por los especialistas en ciencias de la información (documentalistas) y constituyen una herramienta importante para buscar y analizar la información de manera completa, consistente y eficaz), el tipo de acceso, las características de la aplicación, las herramientas de búsqueda, manejo y análisis de los registros, la cobertura (representación) tipológica, idiomática, temática, geográfica y temporal. Generalmente es necesario consultar varios índices para tener la representación más completa de la literatura sobre el tema de interés (Michán, 2009a). Cada base de datos bibliográfica tiene características diferentes, destacan por su
gran
tamaño,
cobertura
mundial
y
actualización
constante:
Académico
(http://scholar.google.com.mx/schhp?hl=es), Science Citation Index Expanded (Thomson Scientific, 2009), Scopus y PubMed (de la U.S. National Library of Medicine). Un análisis detallado sobre las bases de datos bibliográficas más relevantes con información sobre biología se puede consultar en Valtierra (2009) y Michán (en preparación). La inmensa cantidad de registros bibliográficos contenidos en las bases de datos ha permitido identificar y caracterizar cada uno de los actores y procesos involucrados en la práctica científica; a saber, los investigadores, los grupos de investigación, las instituciones, los países y la producción científica, para determinar sus relaciones y dinámica. Los estudios métricos de la información están conformados por disciplinas emergentes como la informetría (Wilson, 1999; Mike Thelwall, 2005), la ciencimetría, la bibliometría (White y McCain, 1989; Bailón-Moreno et al., 2005) y , la webometría (Wilson, 1999; Bar-Ilan, 2001; Björneborn e Ingwersen, 2001; 2004; Mike Thelwall, 2005; Aguillo et al., 7
2006). Estas disciplinas se encargan de estudiar los aspectos cuantitativos de la información, la ciencia, los documentos y las páginas electrónicas, respectivamente. El precursor de estos métodos fue Derek de Solla Price (1963) y han sido difundidos de manera importante por Eugene Garfield (Garfield, 1955; 1972; 1979ab; 1998; 2001) Francis Narin (Narin et al., 1972; 1994; Narin, 1995; Narin et al., 1997) y más recientemente Loet Leydesdorff (Leydesdorff y Wouters, 1999; Leydesdorff, 2000; 2001; 2003; 2007; Leydesdorff y Wagner, 2008; 2009; Leydesdorff et al., 2009). Los enfoques métricos han tenido un auge importante durante las últimas décadas acorde al aumento, digitalización y sistematización de la información y la producción de una gran cantidad y diversidad de bases de datos bibliográficas (Hood y Wilson, 2003). Implican el manejo de cantidades de datos inmensas (cientos y miles) y la aplicación de análisis estadísticos e indicadores matemáticos para reconocer las regularidades de la producción y la difusión de la ciencia con respecto a diversas variables con las distintas unidades de análisis, por ejemplo: 1) la producción científica permite identificar y caracterizar los procesos involucrados a través de inventarios y conteos (Bradford, 1948; Van Raan, 2000; Shiffrin y Börner, 2004; Börner et al., 2007), analizar los documentos respecto a la autoría (Batista et al., 2006), la colaboración (Beaver, 2001; Björneborn, 2001; Barabási et al., 2002; Beaver, 2004; Bookstein et al., 2006; Leydesdorff y Wagner, 2009), los temas, dominios y disciplinas (Bhattacharya et al., 2003; Börner et al., 2003; Boyack, 2004; Boyack et al., 2005) las regiones, los investigadores (Börner et al., 2004) y las instituciones a partir de la literatura (principalmente los artículos científicos) (Lotka, 1926; Bradford, 1948; Buela-Casal, 2003; Larsen, 2008). 2) La difusión con base en el impacto (Bordons et al., 2002; Bornmann y Daniel, 2005) estudiado a través de las citas que reflejan las relaciones que se producen en el proceso de investigación y permiten identificar núcleos significativos de autores y revistas (Malin, 1968; Rothman y Woodhead, 1971; Garfield, 1972, 1979a; Shearer y Moravscik, 1979), la cocitación que ayuda a determinar la asociación de los investigadores, 3) Los contenidos, los títulos, los resúmenes, las palabras clave o los descriptores representan características detalladas de lo expuesto en el documento (Charum y Usgame, 2005) y 4) la institucionalización, (conformación de universidades, institutos, sociedades, revistas) son un buen indicador de la profesionalización de una disciplina (Garfield, 1973; Michán, 2009b). Este tipo de aproximaciones también permiten caracterizar disciplinas y dominios de las ciencias, estudiar su clasificación jerárquica y analizar la dinámica científica de cada una de ellas. Los resultados obtenidos de los análisis métricos de la información tienen áreas de aplicación diversas; por ejemplo, los científicos los utilizan para investigar el estado de su disciplina; los historiadores, sociólogos y etnólogos de la ciencia como sustento empírico; los bibliotecarios para diseñar sus colecciones de literatura científica y las instancias
8
gubernamentales o institucionales, como herramienta de evaluación para el diseño de la gestión y la política científica (Albornoz, 2002). Estos análisis para las ciencias biológicas se realizan generalmente con información de bases de datos con énfasis en biología experimental como Web of Science (WoS), especialmente el Science Citation Index Expanded (SCI), Pubmed y más recientemente Scopus, se han hecho pocos estudios utilizando otras bases de datos con gran cantidad de información biológica como Biosis, Zoological Record, CAB, Agrícola, por mencionar las más importantes. El actual “análisis de la ciencia” es un área de investigación innovadora cuya finalidad es evaluar la estructura y el desarrollo de la ciencia desde una perspectiva interdisciplinaria en la que conviven la historia, la sociología, la etnología y los estudios métricos de la información. Este tipo de estudio es una práctica en evolución y crecimiento, incluye diversas áreas que abordan como objeto de estudio a las ciencias desde distintas perspectivas y con interpretaciones variadas, para investigar sus características, estructura, relaciones, desarrollo, contexto, tendencias y aplicaciones. Implica enfoques interdisciplinarios que incluyen a la historia, la sociología, la antropología, la economía, la tecnología, algunas ramas de la filosofía y las ciencias de la información y la comunicación, además de los estudios métricos de las ciencias, por mencionar las más importantes. Cada una de las cuales ha aportado herramientas, técnicas, preguntas y métodos propios de análisis e interpretación (Michán y Llorente en prensa). Esta investigación consistirá en explorar, sistematizar y difundir los recursos bibliométricos básicos disponibles en SCI (Thomson Reuters) y PubMed (NIH) para identificar proporciones y tendencias de manera directa, eficiente, inmediata, actualizada, exhaustiva y organizada; para facilitar el manejo de grandes cantidades de registros documentales, la selección entre la inmensa cantidad de información existente, elegir la más relevante, manejar los registros seleccionados y conocer las formas de análisis de literatura digital más novedosas, a partir de las cuales se pueda y deba extraer la información para estudiar la historia reciente de la ciencia. Para lograrlo se utilizará como estudio de caso la producción bibliográfica sobre la mosca Drosophila melanogaster. La investigación de la mosca de la fruta como un organismo experimental ha jugado un importante papel desde hace más de 100 años en diferentes áreas como son: comportamiento de los cromosomas, biología celular, genética clásica, molecular, y de poblaciones, biología del desarrollo, ecología evolutiva y la genómica. Empezando en 1906 con Thomas Hunt Morgan y el “Fly Room” en la Universidad de Columbia en Nueva York hasta la secuenciación de las regiones eucromáticas completas de los cromosomas de Drosophila en el 2000 y el inicio en las investigaciones del RNA de interferencia (RNAi) de 2001 a la fecha muchos conceptos, fenómenos y procesos biológicos han sido descubiertos con la mosca de la fruta. Las consideraciones evolutivas siempre han sido importantes en la genética de 9
Drosophila, en parte porque el auge de esta disciplina en los 1930s coincide con el desarrollo de la Síntesis Moderna de la Teoría Evolutiva que combinó la selección natural darwiniana con la herencia mendeliana (Sturtevant, 1965). Esta síntesis fue posible en gran medida gracias al análisis de polimorfismos en los patrones de banda de los cromosomas de glándulas salivales con especies y por comparaciones de los patrones de bandas entre especies (Dobzhansky, 1937). Virtualmente cada concepto importante en genética de poblaciones y evolución ha sido influenciado hasta cierto punto por estudios de poblaciones naturales o en laboratorio de Drosophila (Lewontin, 1974). Muchos sistemas genéticos como las respuestas celulares al estrés por calor y a hormonas esteroides fueron originalmente descubiertas en moscas. A nivel de los genes, las secuencias codificantes de los genes homeóticos representan una clase de genes fundamentalmente importantes que fueron descubiertos por investigaciones en el organismo (Merriam et al., 1991). Drosophila es un modelo de organismo apropiado entre otros para la aplicación de herramientas genéticas, bioquímicas, moleculares y fisiológicas; y recientemente bioinformáticas.
OBJETIVOS Explorar, caracterizar y explicar los recursos bibliométricos básicos disponibles en Science Citation Index Expanded (Thomson Reuters) y PubMed (NIH) con aplicación en la historia de la ciencia actual a través de un caso biológico. Presentar el método básico para obtener proporciones y tendencias de la producción académica en estas bases de datos. Identificar y comparar las características bibliométricas de Science Citation Index Expanded y PubMed para el estudio de la ciencia actual.
10
MATERIAL Y MÉTODO Esta investigación forma parte del proyecto de investigación “Análisis de las ciencias biológicas actuales” encabezado por la doctora Layla Michán con la colaboración de las Doctoras Rosario Rodríguez Arnaiz y América Nitxin Castañeda Sortibrán para el área de Biología Experimental, en lo que corresponde a genética y Drosophila. La investigación consistió en el procedimiento básico aplicable a cualquier análisis bibliométrico: búsqueda, recuperación, migración, normalización, análisis y visualización de la información (Fig. 1).
Figura 1. Etapas de un análisis bibliométrico, modificado de Michán y Llorente (2003)
Se investigó la posibilidad de análisis bibliométrico en las dos bases de datos internacionales que contienen mayor cantidad de registros y son de cobertura mundial sobre literatura científica biológica: Science Citation Index Expanded (SCI) y PubMed. SCI es la base de datos más utilizada, porque presenta herramientas sofisticadas de recuperación y análisis de información, cubre revistas de corriente principal (alto impacto), tiene criterios estrictos de selección de los títulos, tiene una cobertura desde 1900, ha afinado el modo de recuperación de información y tiene 11
registradas las referencias de todos los documentos que indiza. En la siguiente tabla (Tabla 1) se describen las características generales de ambas bases de datos que justifican su utilización.
Tabla 1. Características generales de las bases de datos SCI y PubMed. Característica
SCI
Nombre Acceso Editor-Productor
Science Citation Index Expanded Restringido con acceso en la UNAM Thomson Reuters Artículos, bibliografías, reseñas de libros, correcciones y agregados, debates, editoriales, artículos de revisión, reseñas de software, hardware de computadora y bases de datos. Multidisciplinaria
Cobertura Tipológica
Cobertura Temática Cobertura Temporal Cobertura Geográfica
1900-actual Mundial Autor, país, tipo de documento, institución, idioma, año de la publicación, fuente (revista) y disciplinas y conference proceedings (a partir del 2009). http://docs.google.com/Doc?docid=0AVIt9BV0M6MZGZjamZxdnZfNDRndjRzc3BnNQ& hl=es&invite=CIuAxZwE
Campos de Búsqueda
Fecha en la que se inició la base de datos Idioma de los Documentos
Tamaño
Exportación de Registros Seleccionados Documentos Relacionados Permite Guardar la Consulta Permite ver la Lista de Referencias del Documento Resultados de Búsqueda que Despliega
Criterios de Registros
Selección
de
Extracción para Meta-análisis Meta-análisis
PubMed PubMed Libre National Institute of Health Artículos de revistas científicas, referencias bibliográficas, abstracts, acceso a texto completo, literatura gris. Multidisciplinaria con énfasis biomédicas. 1950-actual Mundial con énfasis en EU
en
ciencias
Autor, país, tipo de documento, institución, idioma, año de la publicación, fuente (revista), disciplinas, palabras clave (encabezados y calificadores).
1964
1950 como Medline, como Pubmed en 1997
Inglés(privilegiado) y 49 más (50 total) Obtenidos contando las opciones -SCI-Expanded (Science Citation Index Expanded--1900-present): 6650 revistas. -SSCI (Social Sciences Citation Index--1956present) 1950 revistas. -A&HCI (Arts & Humanities Citation Index--1975present) 1, 150revistas -Total: 9, 760 revistas. 42, 726, 750 registros únicos 44, 307, 539 (a julio 2009)
Inglés (privilegiado), o en otro idioma pero que tengan abstract en inglés.
Sí, a EndNote, RefMan.
No
Sí Sí
Sí Sí en My NCBI.
Sí
No 10, 25 ó 50
36, 487 en 10 de octubre
Más de 19 millones
5, 10, 20, 50, 100, 200 ó 500
Selección de “revistas de corriente principal” de la ciencia, en todas las áreas del conocimiento, las que reciben alto número de citas en la literatura internacional. Toma en cuenta: los estándares de publicación, el contenido editorial, la diversidad internacional y la información de citas. http://scientific.thomson.com/knowtrend/essays/ selectionofmaterial/journalselection/ Sí Sí: bibliométricos, factor de impacto, tendencias, índice H (autor), genefactor, citas totales por
12
Ámbito y aplicación: temas periféricos a biomedicina. -Calidad del contenido: revista original, buena contribución, importancia y validez internacional. -Objetiva, credibilidad, buen contenido, revisión por pares. -Calidad de la producción. -Impresas en papel libre de ácido. -Que no sea de interés local -Resumen en inglés Se extraen datos No realiza ningún tipo de meta-análisis
Característica
SCI
PubMed
autor, índice de inmediatez (artículos), vida media (artículos), documentos más citados, umbrales de frecuencia de citas, análisis de redes. Registros relacionados (meta-análisis de un documento) Analyze results (100, 000), Citation report (10, 000). http://isiwebofknowledge.com/ http://apps.isiknowledge.com/WOS_GeneralSea rch_input.do?highlighted_tab=WOS&product=W OS&last_prod=WOS&SID=4DL9HC43Akemb6gI 4P6&search_mode=GeneralSearch http://docs.google.com/Doc?id=dhns64fx_60dqq txnm8&btr=EmailImport http://docs.google.com/Doc?docid=0AVIt9BV0M6MZGZjamZxdnZfNDRndjRzc3BnNQ& hl=es&invite=CIuAxZwE http://apps.isiknowledge.com/WOS_GeneralSea rch_input.do?highlighted_tab=WOS&product=W OS&last_prod=WOS&SID=4DL9HC43Akemb6gI 4P6&search_mode=GeneralSearch http://isiwebofknowledge.com/
URL
Referencias
http://www.ncbi.nlm.nih.gov/sites/entrez?db=Pub Med&itool=toolbar
http://www.nlm.nih.gov/pubs/factsheets/jsel.html http://preview.ncbi.nlm.nih.gov/bookshelf/br.fcgi ?book=helppubmed&part=pubmedhelp http://wwwcf.nlm.nih.gov/serials/journals/index.c fm ftp://ftp.ncbi.nih.gov/pubmed/
La descripción de las características de la Tabla 1 se puede ver en http://ciberliteraturaunam.blogspot.com
Se realizaron varias pruebas utilizando los términos: Drosophila, Drosophila melanogaster y fruitfly en distintas combinaciones en el campo de “title” para asegurarnos de que el artículo no sólo mencionará a este organismo sino que se tratará de un estudio específicamente sobre él (Tabla 2).
Tabla 2. Resultados obtenidos con las consultas: Drosophila, Drosophila melanogaster y fruitfly en SCI y PubMed.
Drosophila Drosophila melanogaster Fruitfly
Título (TI) SCI (Cantidad de Registros) 48, 981
Título (TI) PubMed (Cantidad de Registros) 34, 300
18, 291
12, 171
100
19
Con base en este resultado se determinó que el universo más representativo se obtenía a partir del uso del término Drosophila y se realizó la consulta. Las características de la consulta usada en ambas bases de datos se muestran en la siguiente tabla (Tabla 3).
13
Tabla 3. Parámetros de las consultas realizadas en cada base de datos. Parámetros Base de Datos
SCI-EXPANDED.
PubMed
Título
Drosophila
Drosophila
Intervalo de Tiempo 1900-2008.
1900-2008
Para cada una de las bases de datos se recuperaron todos los registros obtenidos a partir de la consulta de búsqueda que consistió en la palabra: Drosophila (Tabla 2). La recuperación de información se realizó en octubre del 2009 para ambas bases de datos y abarcó todos aquellos registros publicados desde el año 1900 hasta el año 2008. Las frecuencias obtenidas para cada variable de cada base de datos (ver adelante) se migraron y normalizaron en una base de datos relacional utilizando un manejador de bases de datos (Microsoft Access); para representar en una estructura lógica toda la información extraída y facilitar la realización de consultas que permiten un manejo adecuado, un procesamiento eficaz y el análisis consistente. En cada etapa se depuró, se normalizó y se validó la información (Fig. 2).
Figura 2. Pantalla de los campos normalizados en la base de datos.
14
A continuación, se realizaron las consultas y la creación de tablas de datos que se utilizaron para hacer los análisis cuantitativos y los gráficos respectivos en una hoja de cálculo. Para SCI se recuperaron 48, 981 registros y se obtuvieron las frecuencias utilizando la herramienta Analyze Results se obtuvo la cantidad de documentos respecto a los siguientes campos: autor, país, tipo de documento, institución, idioma, año de la publicación, fuente (nombre de la revista) y disciplinas (Fig. 3).
Figura 3. Pantalla de Analyze Results en SCI.
Con base en la información extraída pudimos observar que existen disparidades o incongruencias en los registros, ocasionadas durante la captura debido a que no se utilizan parámetros específicos (el mismo criterio) en todos los casos, por ello para representar la información de manera correcta, se normalizaron los campos donde se requería: 1) Autor; en el que por ejemplo se identificó que “Jan, Y. N.” y “Jan, L. Y.” se refiere a investigadores distintos incluso cuando ambos laboran en la misma institución; 2) País; donde se validaron varios países que han cambiado su nombre a 15
lo largo de la historia, por ejemplo el de la URSS que fue normalizado dentro del país Rusia; 3) el de institución; que presentaba diferencias en la captura de información y al uso de distintas abreviaturas para la misma institución, por ejemplo los registros de la Academia Científica Rusa, se encontraban bajo distintos nombres como: “ACAD MED SCI USSR”, “Acad sci ussr” y “Russian acad sci”. Posteriormente se seleccionaron las 10 primeras disciplinas con mayor número de publicaciones y se excluyó la categoría de “multidisciplinarias”, por no representar algún tema en específico, quedando un total de 9, para las cuales se graficó la cantidad de documentos (publicaciones) en el tiempo de cada una: Genética y Herencia, Bioquímica y Biología Molecular, Biología Celular, Biología del Desarrollo, Neurociencias, Biología Evolutiva, Ecología, Zoología y Toxicología. Además, se identificaron los 50 documentos más citados, se obtuvieron las frecuencias para cada una de las ocho variables arriba mencionadas y se graficaron las tendencias temporales. Posteriormente para cada una de las 15 revistas más productivas se obtuvo el factor de impacto de acuerdo con el Journal Citation Report del 2008 (Thomson Reuters, 2009a). Para comparar las tendencias y establecer el contexto científico en el que se ha desarrollado la investigación sobre Drosophila en la literatura científica desde 1900, se realizaron búsquedas de información en SCI de los otros 10 organismos modelo más comunes en la investigación experimental en Biología. Las consultas se realizaron con los mismos parámetros usados para Drosophila para los géneros: Escherichia, Saccharomyces, Arabidopsis, Zea, Neurospora, Dictyostelium, Chlamydomonas, Caenorhabditis, Schizosaccharomyces y Danio. Se hicieron las búsquedas correspondientes y se siguió el mismo método aplicado anteriormente para Drosophila (Tabla 6, Fig. 12). Respecto a la base de datos PubMed se recuperaron 34, 300 registros para los cuales se obtuvo la cuantificación de documentos para cada una de las variables (Tabla 4) y se siguió el mismo procedimiento que para SCI (Fig. 1). Se graficaron los resultados de las frecuencias obtenidas para todas las publicaciones, encabezados del MeSH (headings) (Fig. 23) y calificadores del MeSH (qualifiers) (Fig. 24). Para los primeros 20 encabezados y los primeros 17 calificadores se obtuvieron también las tendencias por año. El MeSH (Medical Subject Headings) es el tesauro de vocabulario controlado por la Biblioteca Nacional de Medicina de los Estados Unidos consiste en una serie de términos designados descriptores en una estructura jerárquica que se asignan a los documentos por especialistas en bibliometría y documentación con base en el contenido del artículo (http://www.nlm.nih.gov/mesh) (Fig. 4).
16
Figura 4. Pantalla de PubMed con la búsqueda en MeSH de Drosophila.
Los descriptores del MeSH están organizados de forma alfabética dentro de una estructura jerárquica. En el nivel más general de la jerarquía están encabezados (títulos) muy amplios como “Anatomy” (Anatomía) o “Mental Disorders” (Trastornos Mentales). Los títulos (encabezados) más específicos se encuentran en la parte más baja de la estructura de 11 niveles, tales como “Ankle” (tobillo) y “Conduct Disorder” (Trastornos de la Conducta). Hay un total de 25, 186 descriptores en el MeSH 2009 necesarios para describir los documentos indizados en PubMed (Fig. 5).
17
Figura 5. Pantalla con la estructura jerárquica del MeSH correspondiente Drosophila.
Los tres tipos básicos de registros del MeSH son: Descriptores, calificadores y conceptos suplementarios de los registros (SCRs en inglés) (http://www.nlm.nih.gov/mesh/intro_record_types.html) (Fig. 6). Descriptores: También conocidos como Encabezados Principales (Main Headings). Son usados para indizar citas (citations) en la base de datos MEDLINE de la Biblioteca Nacional de Medicina (NLM) de E. U., para catalogar publicaciones y otras bases de datos, se pueden buscar en PubMed como [MH], o <MeSHHeading>. La mayoría de los descriptores indican el tema (la disciplina) de un registro indizado, como un artículo, esto es, acerca de que trata el artículo. Los descriptores son actualizados generalmente por año. Calificadores: Existen 83 calificadores temáticos, también conocidos como Subencabezados (Subheadings), son usados para indizar y catalogar junto con los Descriptores. Los calificadores proporcionan un medio conveniente para agrupar aquellas citas (citations) que se refieren a un aspecto particular de un tema (disciplina). Por ejemplo: liver/drug effects (hígado/efectos de fármacos) indica que el artículo o el libro no trata sobre el hígado en
18
general, sino acerca del efecto de fármacos en el hígado. Los calificadores se pueden buscar en PubMed como MeSH Subheadings (Subencabezados) [SH]. Los Calificadores son actualizados por año. Registros Suplementarios de Conceptos (SCRs): Anteriormente llamados Registros Suplementarios Químicos, se usan para indizar productos químicos, drogas y otros conceptos para Medline y se pueden buscar por Nombre de la Sustancia [NM] en PubMed. Contrario a los descriptores, los SCRs no tienen números de la jerarquía, sin embargo, cada SCR está ligado a uno o más descriptores y son actualizados semanalmente.
Figura 6. Pantalla de búsqueda principal del tesauro MeSH.
19
RESULTADOS Se analizaron 48, 981 registros totales extraídos de SCI y 34, 300 de PubMed en la tabla 4 se presenta la síntesis de los indicadores bibliométricos obtenidos para cada caso, así como la cantidad de registros para cada variable en ambas bases de datos.
Tabla 4. Cantidad de registros obtenidos en SCI y PubMed para cada una de las variables bibliométricas disponibles en cada una de las aplicaciones.
Registros totales
SCI
PubMed
48, 981 documentos que abarcaron 104 años.
34, 300 documentos que abarcaron 93 años.
499 Autores para 44, 915 registros (91%) 500 Autores para 34, 277 registros (99%) 4, 066 no tuvieron asignado algún autor 23 no tuvieron asignado algún autor (1%). (9%). Tabla 5. 119 Países para 41, 757 registros (85%). 7, 224 no tuvieron asignado algún país * País (14.7%). Fig. 7 16 Tipos de documentos para 48, 981 37 Tipos de documentos para 34, 300 Tipo de Documento registros (100%). Fig. 8 registros (100%). 500 Instituciones para 41, 756 registros (85%). 7, 225 no tuvieron asignado * Institución alguna institución (14.7%). Fig. 9 14 Idiomas para 48, 981 registros (100%). * Idioma Fig. 10 48, 981 registros (100%).para 104 años 34, 300 registros (100%) para 93 años. Publicaciones por Año Fig. 11 500 Revistas para 46, 788 registros (95%). 2, 193 no tuvieron asignada 500 Revistas para 33, 226 registros (97%) alguna revista (5%). Fig. 16. También en 1074 no tuvieron asignada alguna revista Fuente (Revistas) la fig. se presenta el Factor de impacto (3%). por revista (JCR) 139 Disciplinas para 41757 registros (85%). 7, 224 no tuvieron asignada 104 Disciplinas para 33, 261 registros alguna disciplina (14.7%). Fig. 17. (97%) 1, 039 no tuvieron asignada alguna Disciplinas Tópicos (disciplinas) por año (tendencias disciplina (3%). temporales). Fig. 18 50 documentos más citados. Tabla 7. No documentada Documentos más citados *Los campos de país, institución e idioma en PubMed están relacionados con el de autor, para el cuál sólo se Autor
capturaba al primer autor hasta el año 1999.
A continuación se presentan los resultados obtenidos en SCI para Drosophila en el orden en que aparecen en la aplicación: autor, país, tipo de documento, institución, idioma (Figs. 7-10), publicación por año para Drosophila y el 20
comparativo de Drosophila con otros nueve géneros comúnmente usados como organismos modelo en biología experimental (Tabla 6, Figs. 11-15). Posteriormente se presentan los 50 documentos con más citas sobre Drosophila (Tabla 7), el análisis de las revistas más productivas (incluyendo su factor de impacto), la proporción y la tendencia temporal de las disciplinas más importantes en la investigación sobre Drosophila (Figs. 16-21), se compara la producción de SCI y PubMed (Fig. 22) y finalmente se exponen los resultados obtenidos para PubMed respecto a: publicación por año y palabras clave (encabezados y calificadores) (Figs. 23-24).
Tabla 5. Autores con mayor cantidad de publicaciones sobre Drosophila en SCI. Autor
Cantidad de 50 más Citados Registros (48981)
Rubin, GM
220
David, JR
203
Dobzhansky, T
185
Perrimon, N
184
Hall, JC
170
Mukai, T
164
Zhimulev, IF
161
Jan, YN
155
Gehring, WJ
149
Jackle, H
148
Ayala, FJ
143
1
Hoffman, AA
139
1
Jan, LY
131
Bownes, M
126
Parsons, PA
126
Partridge, L
126
Ashburner, M
123
Green, MM
122
Belyaeva, ES
122
Glover, DM
119
Levine, M
115
Mahowald, AP
115
King, RC
111
Singh, BN
111
Elgin, SCR
110
Wurgler, FE
110
Korochkin, LI
109
Hartl, DL
109
5
2
2
1
21
Georgiev, PG
106
Kaufman, TC
103
Wu, CF
103
Rosbash, M
101
Ehrman, L
101
Mackay, TFC
101
1
Los autores en negritas son los que aparecen en la lista de los 50 más citados.
País
E. U. A. (31) Alemania (5) Francia (2) Inglaterra (8) Japón 3.8% 4.9% 6.1%
3.8% 3.3% 2.6%
Rusia Canadá (1) 53.3%
España (2) Suiza (2)
6.9%
Australia (2) 7.1%
8.1%
Figura 7. Países con mayor cantidad de publicaciones sobre Drosophila en SCI. Se tomaron los países con más de 1, 000 publicaciones, el número entre paréntesis corresponde a los 50 artículos más citados.
22
Tipo de Documento
Artículo (86%) Resumen de Congreso Revisión (12%) Nota (2%) Otros Memorias de Congreso
2.86%
2.65% 2.00% 1.12%
15.06%
76.30%
Figura 8. Tipos de documentos con mayor cantidad de publicaciones sobre Drosophila en SCI. Se tomaron los tipos de documentos con más del 1% de publicaciones; los menores al 1% se agruparon en la categoría "otros" y son: carta al editor, material editorial, corrección, corrección y adición, noticias, revisión de libro, discusión, bibliografía, revisión de la base de datos, reimpresión y revisión de software. El número entre paréntesis corresponde al porcentaje de los 50 artículos más citados.
23
1400
1200 5
1000 1
2
Documentos
800
2 3
600
2
3
1
2
2
400
200
0 Cornell
Irvine
Pennsylvania
Max Planck
Texas
Zurich
Wisconsin
Carolina N
Stanford
San Francisco
Yale
París
Berkeley
Cambridge
Washington
Harvard
CNRS
Aca Cie Rusa
Institución Figura 9. Instituciones con mayor cantidad de publicaciones sobre Drosophila en SCI. Se tomaron las instituciones con más de 500 publicaciones, el número sobre la barra corresponde a la lista de 50 artículos más citados.
24
Idioma
Japonés 1.35%
Francés 0.89%
Alemán 0.32%
Ruso 2.29%
Inglés 95.15%
Figura 10. Idiomas con mayor cantidad de publicaciones sobre Drosophila en SCI. Se tomaron los idiomas con más de 100 publicaciones. 1800
1600
1400
Documentos
1200
1000
y = 4.0727e0.0658x 800
600
400
200
0
2005
2000
1995
1990
1985
1980
1975
1970
1965
1960
1955
1950
1945
1940
1935
1930
1925
1920
1915
1910
1905
Año Figura 11. Publicaciones por año sobre Drosophila en SCI (desde 1900 al 2008). Se hizo una gráfica temporal de número de publicaciones por año. La línea punteada representa la línea de tendencia del gráfico así como la ecuación que la define. 25
Tabla 6. Cantidad de documentos para cada modelo en el campo título en SCI 1900-2008. Título
Cantidad de Registros
Escherichia
94, 873
Saccharomyces
27, 549
Arabidopsis
18, 094
Zea
7, 636
Neurospora
6, 640
Dictyostelium
6, 191
Chlamydomonas
5, 646
Caenorhabditis
5, 353
Schizosaccharomyces
3, 183
Danio
973
Las consultas se hicieron con los mismos parámetros de Drosophila.
Figura 12. Publicaciones por año sobre Drosophila y otros organismos modelo en SCI (desde 1900 al 2008).
26
3000
Escherichia (94873) 2500 Drosophila (48989)
Saccharomyces (27549) 2000
Neurospora (6640)
Documentos
Dictyostelium (6191) Schizosaccharomyces (3183)
1500
1000
500
0 2005
2000
1995
1990
1985
1980
1975
1970
1965
1960
1955
1950
1945
1940
1935
1930
1925
1920
1915
1910
1905
1900
Año
Figura 13. Detalle de los organismos modelo que disminuyen su producción en la última década en SCI.
250
200 Zea (7636)
Chlamydomonas (5646)
Documentos
150
100
50
0 2005
2000
1995
1990
1985
1980
1975
1970
1965
1960
1955
1950
1945
1940
1935
1930
1925
1920
1915
1910
1905
1900
Año
Figura 14. Detalle de los organismos modelo que mantienen su producción en la última década de acuerdo con SCI.
27
2000
Arabidopsis (18094)
1500
Documentos
Caenorhabditis (5353)
Danio (973) 1000
500
0
2005
2000
1995
1990
1985
1980
1975
1970
1965
1960
1955
1950
1945
1940
1935
1930
1925
1920
1915
1910
1905
1900
Año Figura 15. Detalle de los organismos modelo que aumentan su producción en la última década en SCI.
Tabla 7. 50 artículos más citados sobre Drosophila en SCI. Citas Referencia del documento totales Adams et al. (2000). The genome sequence of Drosophila melanogaster. Science, 287(5461):2185–2195+. Rubin, G. M. and Spradling, A. C. (1982). Genetic-transformation of Drosophila with transposable element vectors. Science, 218(4570):348–353+. Tautz, D. and Pfeifle, C. (1989). A non-radioactive insitu hybridization method for the localization of specific rnas in Drosophila embryos reveals translational control of the segmentation gene hunchback. Chromosoma, 98(2):81–85+. Lewis, E. B. (1978). Gene complex controlling segmentation in Drosophila. Nature, 276(5688):565–570+. Medzhitov et al. (1997). A human homologue of the Drosophila toll protein signals activation of adaptive immunity. Nature, 388(6640):394–397+. Nussleinvolhard, C. and Wieschaus, E. (1980). Mutations affecting segment number and polarity in Drosophila. Nature, 287(5785):795–801+. Lemaitre et al. (1996). The dorsoventral regulatory gene cassette spatzle/toll/cactus controls the potent antifungal response in Drosophila adults. Cell, 86(6):973–983+. Spradling, A. C. and Rubin, G. M. (1982). Transposition of cloned p elements into Drosophila germ line chromosomes. Science, 218(4570):341–347+. Robertson et al. (1988). A stable genomic source of p-element transposase in Drosophilamelanogaster. Genetics, 118(3):461–470+. 28
2751 2184 2126
1906 1752 1727 1277 1228 1153
Citas Referencia del documento totales Hammond et al. (2000). An rna-directed nuclease mediates post-transcriptional gene silencing in Drosophila cells. Nature, 404(6775):293–296+. Ashburner, M. and Bonner, J. J. (1979). Induction of gene activity in Drosophila by heat shock. Cell, 17(2):241–254+. Mcdonald, J. H. and Kreitman, M. (1991). Adaptive protein evolution at the adh locus in Drosophila. Nature, 351(6328):652–654+. Xu, T. and Rubin, G. M. (1993). Analysis of genetic mosaics in developing and adult Drosophila tissues. Development, 117(4):1223–1237+. Bateman, A. J. (1948). Intra-sexual selection in Drosophila. Heredity, 2(3):349–368+. Ephrussi, B. and Beadle, G. W. (1936). A technique of transplantation for Drosophila. American Naturalist, 70:218–225+. Clary, D. O. and Wolstenholme, D. R. (1985). The mitochondrial-dna molecule of Drosophilayakuba - nucleotide-sequence, gene organization, and genetic-code. Journal of Molecular Evolution, 22(3):252–271+. Konopka, R. J. and Benzer, S. (1971). Clock mutants of Drosophila-melanogaster. Proceedings of the National Academy of Sciences of the United States of America, 68(9):2112–&+. Ayala et al. (1972). Enzyme variability in Drosophila-willistoni group .4. genic variation in natural populations of Drosophila-willistoni. Genetics, 70(1):113–&+. Ellisen et al. (1991). Tan-1, the human homolog of the Drosophila notch gene, is broken by chromosomal translocations in t-lymphoblastic neoplasms. Cell, 66(4):649–661+. Wu, C. (1980). The 5‟ ends of Drosophila heat-shock genes in chromatin are hypersensitive to dnase-i. Nature, 286(5776):854–860+. Rock et al. (1998). A family of human receptors structurally related to Drosophila toll. Proceedings of the National Academy of Sciences of the United States of America, 95(2):588–593+. Giot et al. (2003). A protein interaction map of Drosophila melanogaster. Science, 302(5651):1727–1736+. Cavener, D. R. (1987). Comparison of the consensus sequence flanking translational start sites in Drosophila and vertebrates. Nucleic Acids Research, 15(4):1353–1361+. Orr, W. C. and Sohal, R. S. (1994). Extension of life-span by overexpression of superoxidedismutase and catalase in Drosophila-melanogaster. Science, 263(5150):1128–1130+. Ingham, P. W. (1988). The molecular-genetics of embryonic pattern-formation in Drosophila. Nature, 335(6185):25–34+. Akam, M. (1987). The molecular-basis for metameric pattern in the Drosophila embryo. Development, 101(1):1–&+. Stjohnston, D. and Nussleinvolhard, C. (1992). The origin of pattern and polarity in the Drosophila embryo. Cell, 68(2):201–219+. Ritossa, F. (1962). New puffing pattern induced by temperature shock and dnp in Drosophila. Experientia, 18(12):571–&+. Pelham, H. R. B. (1982). A regulatory upstream promoter element in the Drosophila hsp 70 heatshock gene. Cell, 30(2):517–528+. Hahn et al. (1996). Mutations of the human homolog of Drosophila patched in the nevoid basal cell carcinoma syndrome. Cell, 85(6):841–851+. Lewontin, R. C. and Hubby, J. L. (1966). A moleuclar approach to study of genic heterozygosity in natural populations .2. amount of variation and degree of heterozygosity in natural populations of Drosophila pseudoobscura. Genetics, 54(2):595–&+. Schneide (1972). Cell lines derived from late embryonic stages of Drosophila-melanogaster. Journal of Embryology and Experimental Morphology, 27(APR):353–&+. Bhanot et al. (1996). A new member of the frizzled family from Drosophila functions as a wingless receptor. Nature, 382(6588):225–230+. Mcginnis et al. (1984). A conserved dna-sequence in homoeotic genes of the Drosophila antennapedia and bithorax complexes. Nature, 308(5958):428–433+. Halder, G., Callaerts, P., and Gehring, W. J. (1995). Induction of ectopic eyes by targeted expression of the eyeless gene in Drosophila. Science, 267(5205):1788–1792+. 29
1147 1135 1117 1091 1079 942 930
902 900 894 872 861 853 845 838 837 834 831 829 807 800 796
785 758 756 737
Citas Referencia del documento totales Feany, M. B. and Bender, W. W. (2000). A Drosophila model of parkinson‟s disease. Nature, 404(6776):394–398+. Krauss, S., Concordet, J. P., and Ingham, P. W. (1993). A functionally conserved homology of the Drosophila segment polarity gene-hh is expressed in tissues with polarizing activity in zebrafish embryos. Cell, 75(7):1431–1444+. Cho, K. O., Hunt, C. A., and Kennedy, M. B. (1992). The rat-brain postsynaptic density fraction contains a homolog of the Drosophila disks-large tumor suppressor protein. Neuron, 9(5):929– 942+. Graham, A., Papalopulu, N., and Krumlauf, R. (1989). The murine and Drosophila homeobox gene complexes have common features of organization and expression. Cell, 57(3):367–378+. Tkachuk, D. C., Kohler, S., and Cleary, M. L. (1992). Involvement of a homolog of Drosophilatrithorax by 11q23 chromosomal translocations in acute leukemias. Cell, 71(4):691–700+. Poole et al. (1985). The engrailed locus of Drosophila - structural-analysis of an embryonic transcript. Cell, 40(1):37–43+. Ohare, K. and Rubin, G. M. (1983). Structures of p-transposable elements and their sites of insertion and excision in the Drosophila-melanogaster genome. Cell, 34(1):25–35+. Vandewetering et al. (1997). Armadillo coactivates transcription driven by the product of the Drosophila segment polarity gene dtcf. Cell, 88(6):789–799+. Gu et al. (1992). The t(4-11) chromosome-translocation of human acute leukemias fuses the all-1 gene, related to Drosophila-trithorax, to the af-4 gene. Cell, 71(4):701–708+. Tissiere, Mitchell, H. K., and Tracy, U. M. (1974). Protein-synthesis in salivary-glands of Drosophila-melanogaster - relation to chromosome puffs. Journal of Molecular Biology, 84(3):389–&+. Ingolia, T. D. and Craig, E. A. (1982). 4 small Drosophila heat-shock proteins are related to each other and to mammalian alpha-crystallin. Proceedings of the National Academy of Sciences of the United States of America-Biological Sciences, 79(7):2360–2364+. Smith, D. E. and Fisher, P. A. (1984). Identification, developmental regulation, and response to heat-shock of 2 antigenically related forms of a major nuclear-envelope protein in Drosophila embryos - application of an improved method for affinity purification of antibodies using polypeptides immobilized on nitrocellulose blots. Journal of Cell Biology, 99(1):20–28+. Elbashir et al. (2001). Functional anatomy of sirnas for mediating efficient rnai in Drosophila melanogaster embryo lysate. Embo Journal, 20(23):6877–6888+. Padgett, R. W., Stjohnston, R. D., and Gelbart, W. M. (1987). A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth-factor-beta family. Nature, 325(6099):81–84+. Garciabe, Ripoll, P., and Morata, G. (1973). Developmental compartmentalization of wing disk of Drosophila. Nature-New Biology, 245(147):251–253+.
30
729 723
721
719 714 705 700 695 694 671
651
647
641 639
636
12%
[4.002]
(6%) 4860
10%
% Documentos
8%
6% [6.812]
(4%) 1765
4%
[4.416]
1689
[9.380]
(6%) 1528
[31.434] [3.198]* [31.253]
(22%) 1039
891
[5.558]
[5.520]
(26%) 843
[9.120]
[1.980]
(2%)
(2%)
699
693
660
649
605
J Cell Biol
Genetica
Embo J
731
Evolution
784
[8.295]
J Bio Chemistry
2%
837
[4.737]
0%
Genetika
Mol Bio Cell
Cell
Mutation Research
Nature
Japan J Genetics
PNAS
Devel Biol
Development
Genetics
Revista Figura 16. Revistas con mayor cantidad de publicaciones sobre Drosophila en SCI. Se tomaron las revistas con más de 600 publicaciones, el número sobre las barras indica la cantidad de publicaciones de cada revista, el número entre paréntesis corresponde al porcentaje de los 50 artículos más citados. También se obtuvo el factor de impacto (número entre corchetes) de las revistas más productivas de acuerdo al Journal Citation Report (JCR).*: Se refiere a tres revistas: Fundamental and Molecular Mechanisms of Mutagenesis (3.198), Genetic Toxicology and Environmental Mutagenesis (2.363) y Reviews in Mutation Research (5.912); se tomó el valor de en medio es decir el de Fundamental and Molecular Mechanisms of Mutagenesis (3.198).
31
40%
(6)
17900
35% 30% (18)
% Documentos
25%
10907
(15)
20%
8137 (3)
15%
6328 (20)
4310
10%
(1)
(2)
2519
2482
2365
(3) 2340
(2)
1258 1811 1231
1200
782
706
C Comportamiento
1258
Biotec y Microbio
1465
Biofísica
5%
0%
Fisiología
Toxicología
Entomología
Ecología
Bio Evolutiva
Zoología
Biología
Neurociencia
C Multidisciplinarias
Bio Desarrollo
Bio Celular
Bioquí y Bio Mol
Genética y Herencia
Disciplina Figura 17. Disciplinas con mayor cantidad de publicaciones sobre Drosophila en SCI. Se tomaron las disciplinas con más de 500 publicaciones, el número sobre las barras indica la cantidad de publicaciones para cada tema, el número entre paréntesis corresponde a los 50 artículos más citados. Se eligieron las 10 primeras disciplinas con mayor número de publicaciones y se excluyó la categoría de “multidisciplinarias” por no representar ningún tema en específico, quedando un total de 9 para las cuales se graficó la cantidad de publicaciones en el tiempo.
32
600
Genética y Herencia Bioquímica y Biología Molecular
500
Biología Celular Biología del Desarrollo Neurociencias
400
Biología Evolutiva
Documentos
Ecología Zoología
300
Toxicología
200
100
0 2005
2000
1995
1990
1985
1980
1975
1970
1965
1960
1955
1950
1945
1940
1935
1930
1925
1920
1915
1910
1905
Año Figura 18. Publicaciones por año sobre Drosophila en SCI (desde 1900 al 2008) de acuerdo a las disciplinas más relevantes. Las disciplinas se dividieron en tres partes para facilitar su visualización (Figs.19-21).
33
600
500 Genética y Herencia Bioquímica y Biología Molecular
400
Documentos
Biología Celular 300
200
100
0
2005
2000
1995
1990
1985
1980
1975
1970
1965
1960
1955
1950
1945
1940
1935
1930
1925
1920
1915
1910
1905
Año
Figura 19. Detalle del primer grupo de disciplinas sobre Drosophila en la última década de acuerdo con SCI.
400
350 Biología del Desarrollo 300
Neurociencias 250
Documentos
Toxicología 200
150
100
50
0
2005
2000
1995
1990
1985
1980
1975
1970
1965
1960
1955
1950
1945
1940
1935
1930
1925
1920
1915
1910
1905
Año
Figura 20. Detalle del segundo grupo de disciplinas sobre Drosophila en la última década de acuerdo con SCI.
34
100 90 80
Biología Evolutiva
70
Ecología
Documentos
60
Zoología
50 40 30
20 10 0 2005
2000
1995
1990
1985
1980
1975
1970
1965
1960
1955
1950
1945
1940
1935
1930
1925
1920
1915
1910
1905
Año Figura 21. Detalle de las disciplinas sobre Drosophila en la última década de acuerdo con SCI.
35
1800 1600
SCI Expanded
1400
PubMed
Documents
1200 1000 800 600 400
y= 1,704e 0,070x
200 0
2005
2000
1995
1990
1985
1980
1975
1970
36
1965
Figura 22. Publicaciones por a単o sobre Drosophila en PubMed y SCI.
1960
1955
1950
1945
1940
1935
1930
1925
1920
1915
1910
1905
A単o
100%
31837
75%
% Documentos
18425
50%
14984
10201
9614
25%
8548 7931 6838
5319 5049
4184 3517 3381 3358 3309 2832 2778 2687 2654 2626
0%
Clonación molecular
Transcripción genética
Proteínas de unión DNA
Mapeo cromosómico
DNA
Larva
Regulación exp. génica
Factores transcripción
Fenotipo
Insecto, genes
Secuencia aminoácidos
Secuencia base
Secuencia molecular
Mutación
Macho
Hembra
Drosophila proteínas
Drosophila
D. melanogaster
Animales
Encabezados MeSH Figura 23. MeSH Headings con mayor cantidad de publicaciones sobre Drosophila en PubMed. Se consideraron los encabezados del MeSH con más de 2, 500 publicaciones, el número sobre las barras corresponde a la cantidad de registros para cada encabezado.
37
70%
23265
60%
50% 13586
40%
% Documentos
11655
30% 6843
20% 4685
4177
3712
3414
3246
2931
2859
2574
2361 1524
1408
1201
1163
Aislamiento, purificación
Anatomía e histología
Métodos
Efectos de radiación
10%
0%
Biosíntesis
Análisis
Ultraestructura
Efectos de drogas
Enzimología
Farmacología
Química
Crecimiento, desarrollo
Citología
Embriología
Fisiología
Metabolismo
Genética
Calificadores MeSH Figura 24. MeSH Qualifiers con mayor cantidad de publicaciones sobre Drosophila en PubMed. Se tomaron los calificadores del MeSH con más de 1, 000 publicaciones, el número sobre las barras corresponde a la cantidad de registros para cada calificador.
38
DISCUSIÓN Esta investigación permitió identificar los recursos bibliométricos directos de las aplicaciones disponibles en las bases de datos: Science Citation Index Expanded (Thomson Reuters) y PubMed (NIH) con aplicación en la historia de la ciencia actual. A través del uso de aplicaciones en línea de SCI fue posible obtener proporciones y tendencias directas respecto a diez variables: registros totales, autor, país, tipo de documento, institución, idioma, publicaciones por año, fuente (revistas), disciplinas y documentos más citados. Si se considera que es posible combinar cada una de estas variables con una o más de las nueve restantes, habría al menos 90 combinaciones posibles, incluso es posible hacer mayor cantidad de combinaciones si se crean subconjuntos de variables, por ejemplo si se seleccionan cada una de las disciplinas y se analizan para cada variable y así sucesivamente. Ejemplos de algunas combinaciones se presentan en las figuras 7-9, 16-21. En cuanto a PubMed las posibilidades de análisis directos son menores, pero el análisis del contenido resulta ser más detallado a través del uso de los descriptores del MeSH (Figs. 22-24). El uso de estas herramientas que fueron inicialmente diseñadas para la selección de literatura ha sido recientemente utilizado también para determinar empíricamente tendencias, frecuencias y producciones respecto a la investigación científica como sustento empírico para la historia de la ciencia (Leydesdorff, 2001; Garfield, 2009). Las bases de datos bibliográficas proveen las fuentes de información necesarias para realizar los estudios bibliométricos (Hood y Wilson, 2003), algunas de ellas además, proporcionan algunas herramientas analíticas necesarias para realizar estos análisis respecto a la orientación temática de las disciplinas: con base en descriptores y palabras clave, información geográfica e institucional, etc. (Deogan, 1987). Algunas ventajas del análisis métrico en línea obtenido de los sistemas de información SCI y PubMed aquí analizados son: rapidez, no es costoso (dependiendo del acceso de la institución), se obtienen resultados instantáneos usando herramientas de procesamiento avanzadas y los resultados son reproducibles (Ingwersen y Christensen, 1997). Sin embargo, dado que la mayoría de las bases de datos están diseñadas para extraer información referente a los documentos y el propósito de realizar estudios bibliométricos es secundario; presentan algunas limitaciones como: errores o inconsistencia en la información, problemas con las herramientas de análisis o de extracción de información disponibles o la falta de ellas, a) a nivel micro están: errores en la literatura primaria en sí misma, como errores de captura y deletreo de las palabras y referencias; la falta de estándares de abreviación y diferencias idiomáticas cuando se captura información en idiomas distintos; b) a nivel macro puede haber registros faltantes, o duplicados de información (Coile, 1977). Para solucionar estos problemas y mejorar las búsquedas y los análisis bibliométricos, se requiere un esfuerzo de parte de los productores de las bases de datos, así como de los autores y editores para adoptar un estilo uniforme (estandarización, normalización) (Hawkins, 1977; 39
Stefaniak, 1987). En el presente estudio, para resolver todas estas deficiencias se llevó a cabo el proceso de normalización posterior a la extracción de la información. (Fig. 1). Otra limitante para la obtención de indicadores bibliométricos representativos utilizando las bases de datos bibliográficas es la cobertura tipológica, esto es, pocas bases de datos incluyen libros, capítulos de libros y tesis y prácticamente ninguna contiene la llamada literatura gris (memorias de congresos, informes técnicos, conferencias, notas técnicas, etc.) (Macías-Chápula, 1998), toda esta producción es importante desde el punto de vista histórico. En los últimos años esta limitante ha sido solucionada parcialmente, por ejemplo PubMed incluye ya preimpresiones (preprints) y SCI a partir de octubre del 2008 memorias de congresos (conference proceedings). Los análisis bibliométricos básicos susceptibles a realizarse a partir de una base de datos de registro bibliográfico dependen básicamente de dos elementos: 1) sus características y cobertura, en especial resaltan: tamaño, cobertura temporal, actualización, volumen de información, la cobertura disciplinar y la temática y 2) el tipo de información que registran para cada documento. Para SCI y PubMed las primeras están detalladas en la tabla 1 y las segundas en la tabla 8.
Tabla 8. Registro bibliográfico para cada una de las bases de datos analizadas, en la que se presenta la información capturada para cada documento con sus campos correspondientes: PubMed PMID- 17759620 OWN - NLM STAT- Publisher DA - 20070830 IS - 1095-9203 (Electronic) IS - 1095-9203 (Linking) VI - 32 IP - 812 DP - 1910 Jul 22 TI - SEX LIMITED INHERITANCE IN DROSOPHILA. PG - 120-122 AU - Morgan TH LA - ENG PT - JOURNAL ARTICLE TA - Science JT - Science (New York, N.Y.) JID - 0404511 EDAT- 1910/07/22 MHDA- 1910/07/22 CRDT- 1910/07/22 AID - 32/812/120 [pii] AID - 10.1126/science.32.812.120 [doi] PST - ppublish SO - Science. 1910 Jul 22;32(812):120-122. PMID- 10731132
SCI PT AU
J Morgan, TH Sex limited inheritance in Drosophila SCIENCE 0036-8075 JUL-DEC 1910 32 1 120 122 ISI:000201859900021
TI SO SN PD PY VL IS BP EP UT
PT
J 40
PubMed SCI OWN - NLM AU Adams, MD y 93 autores mรกs. STAT- MEDLINE TI The genome sequence of Drosophila melanogaster DA - 20000330 SO SCIENCE DCOM- 20000330 The fly Drosophila melanogaster is one of the most LR - 20090928 intensively studied organisms in biology and serves as a IS - 0036-8075 (Print) model system for the investigation of many developmental IS - 0036-8075 (Linking) and cellular processes common to higher eukaryotes, VI - 287 including humans. We have determined the nucleotide IP - 5461 sequence of nearly all of the approximately 120-megabase DP - 2000 Mar 24 TI - The genome sequence of Drosophilaeuchromatic portion of the Drosophila genome using a wholegenome shotgun sequencing strategy supported by extensive melanogaster. clone-based sequence and a high-quality bacterial artificial PG - 2185-95 AB - The fly Drosophila melanogaster is one of thechromosome physical map. Efforts are under way to close the most intensively studied organisms in biology andremaining gaps; however, the sequence is of sufficient serves as a model system for the investigation ofaccuracy and contiguity to be declared substantially complete many developmental and cellular processes commonand to support an initial analysis of genome structure and to higher eukaryotes, including humans. We havepreliminary gene annotation and interpretation. The genome determined the nucleotide sequence of nearly all ofencodes approximately 13,600 genes, somewhat fewer than the approximately 120-megabase euchromatic portionthe smaller Caenorhabditis elegans genome, but with AB functional diversity. of the Drosophila genome using a whole-genomecomparable shotgun sequencing strategy supported by extensive SN 0036-8075 clone-based sequence and a high-quality bacterial PD mar-24 artificial chromosome physical map. Efforts are under PY 2000 way to close the remaining gaps; however, the sequence is of sufficient accuracy and contiguity to be VL 287 declared substantially complete and to support an IS 5461 initial analysis of genome structure and preliminary 2185 gene annotation and interpretation. The genome BP encodes approximately 13,600 genes, somewhat EP 2195 fewer than the smaller Caenorhabditis elegans UT ISI:000086049100033 genome, but with comparable functional diversity. AD - Celera Genomics, 45 West Gude Drive, Rockville, MD 20850, USA. FAU - Adams, M D AU - Adams MD LA - eng GR - P50-HG00750/HG/NHGRI NIH HHS/United States GR - Howard Hughes Medical Institute/United States PT - Journal Article PT - Research Support, Non-U.S. Gov't PT - Research Support, U.S. Gov't, P.H.S. PL - UNITED STATES TA - Science JT - Science (New York, N.Y.) JID - 0404511 RN - 0 (Chromatin) RN - 0 (Euchromatin) RN - 0 (Heterochromatin) RN - 0 (Insect Proteins) RN - 0 (Nuclear Proteins) RN - 9035-51-2 (Cytochrome P-450 Enzyme System) SB - IM MH - Animals MH - Biological Transport/genetics MH - Chromatin/genetics 41
PubMed SCI MH - Cloning, Molecular MH - Computational Biology MH - Contig Mapping MH - Cytochrome P-450 Enzyme System/genetics MH - DNA Repair/genetics MH - DNA Replication/genetics MH Drosophila melanogaster/*genetics/metabolism MH - Euchromatin MH - Gene Library MH - Genes, Insect MH - *Genome MH - Heterochromatin/genetics MH - Insect Proteins/chemistry/genetics/physiology MH - Nuclear Proteins/genetics MH - Protein Biosynthesis MH - *Sequence Analysis, DNA MH - Transcription, Genetic EDAT- 2000/03/25 MHDA- 2000/04/01 CRDT- 2000/03/25 AID - 8392 [pii] PST - ppublish SO - Science. 2000 Mar 24;287(5461):2185-95. Para el artículo de Adams et al., 2000, se eliminaron a los 93 autores restantes para ahorrar espacio. El significado de las abreviaturas de cada campo se puede ver en los apéndices 1 y 2.
En este ejemplo en el que se presentan dos artículos uno de 1910 y uno del año 2000, es evidente también la evolución de la información que se captura para un documento, para 1910 se capturaba sólo el registro bibliográfico básico, para el 2000 se pueden encontrar incluso las referencias y las citas al documento. Además, de la información que estas bases de datos proporcionan como el cambio en las citas o la cantidad de publicaciones, autores, países, revistas e instituciones, deben tomarse en cuenta las palabras clave utilizadas (Garfield, 1990). La ventaja de este estudio es que usaron tanto los campos básicos como las palabras clave o descriptores adicionales del MeSH de PubMed, lo que permite ejemplificar las tendencias globales y particulares de la investigación (Li et al., 2009)
Método básico para obtener proporciones y tendencias de la producción académica en SCI y PubMed para la historia de la ciencia El interés es obtener tendencias de producción generales usando herramientas bibliométricas básicas para lo cuál se analizó la literatura científica y se examinaron 1) Documentos: tendencias temporales, tipo de documento, idioma, los tópicos más frecuentes y su desarrollo, y los documentos más relevantes basado en indicadores de citación (JCR), 2) 42
Investigadores: las instituciones y países más productivos y de mayor adscripción, 3) Revistas: las más importantes, los temas que tratan y su factor de impacto (JCR). A continuación se detalla el proceso para todo aquel que esté interesado en reproducirlo. Se
accede
a
la
página
de
Web
of
Science
(http://apps.isiknowledge.com/UA_GeneralSearch_input.do?product=UA&search_mode=GeneralSearch&SID=3A3PMa5iI hhMno8NfJf&preferencesSaved=) y se escoge la base de datos Web of Science (Fig. 25).
Figura 25. Pantalla principal de ISI Web of Knowledge.
Una vez ahí se inserta la búsqueda especificando los campos, el periodo de tiempo en el que se desea buscar y la colección deseada. Los parámetros de la búsqueda para el presente estudio de caso se observan en la figura 26.
43
Figura 26. Pantalla de búsqueda de Web of Science.
Se elige la opción search (buscar) lo que nos lleva a la página de resultados de la búsqueda (Fig. 27). La cantidad total de registros encontrados aparece en negritas debajo de las especificaciones de la búsqueda (a). En el lado izquierdo de la pantalla, está el recuadro de refine results (refinar los resultados) el cual permite limitar los resultados de la búsqueda a los campos y subcategorías de nuestro interés (b). Del lado derecho de la pantalla está la opción sort by (acomodar por) que permite reacomodar los resultados con base en: latest date (última fecha), times cited (cantidad de citas), relevance (relevancia), first author (primer autor), source title (título de la revista), publication year (año de publicación) y conference title (título de la conferencia); debajo de sort by se encuentra el botón de Analyze Results (c).
44
Figura 27. Pantalla de Results (resultados) de Web of Science.
Al dar clic en el botón de Analyze Results se recuperan los registros (resultados) y se obtienen las frecuencias de la cantidad de documentos respecto a los siguientes campos: autor, país, tipo de documento, institución, idioma, año de la publicación, fuente (nombre de la revista) y disciplinas (Fig. 3). En la siguiente pantalla se observan las frecuencias obtenidas para el campo: año de publicación, del estudio de caso (Drosophila).Fig. 28. El botón de Save analysis data to file (a), ubicado en la parte inferior derecha de la pantalla, permite guardar las frecuencias para su posterior procesamiento.
45
Figura 28. Pantalla de frecuencias del campo Año de Publicación (1985-2009) para Drosophila en SCI.
Se guardan dichas frecuencias en un archivo de texto de bloc de notas, después se pega la información en una hoja de cálculo (de Microsoft Excel) donde se procesan los datos y se obtienen las gráficas correspondientes de cada campo y subcategoría. Los campos básicos de los que es posible obtener información desde la aplicación son: autor, país, tipo de documento, institución, idioma, publicaciones por año, fuente (revistas) y disciplinas (ver tabla 4). Sin embargo, una vez obtenidos dichos datos se pueden realizar “combinaciones” de la información (subcategorías) para obtener nueva información. Por ejemplo, al combinar el campo disciplinas con el de publicaciones por año se obtiene la gráfica temporal de las 9 disciplinas más importantes (con mayor cantidad de documentos) para el estudio de caso (Figs. 18-21). Lo cual nos permite ver las tendencias de estas 9 disciplinas y su productividad (cantidad de publicaciones) en el tiempo. Complementando el estudio, en el campo publicaciones por año, se realiza la búsqueda de otros 10 organismos modelo y se comparan los resultados obtenidos con los de Drosophila; con lo cuál se puede ver el comportamiento (tendencias) de estos organismos modelo en el tiempo (ha disminuido, aumentado o se ha mantenido). (Figs. 12-15). En cuánto a las citas es posible obtener los resultados para dos variables: 1) los documentos: se obtiene el listado de los 50 artículos más citados (Tabla 7), información combinada con la de los campos: autor, país, tipo de documento, institución y revistas. Para obtener los 50 artículos más citados, en la pantalla de resultados (Fig. 27) se da 46
clic en el menú de Sort by (acomodar por) y se seleccionan los primeros 50 registros que aparecen en orden decreciente por cantidad de citas (Times cited). Y 2) las revistas: se puede obtener además el factor de impacto de las revistas más productivas de acuerdo al Journal Citation Reports (JCR) del 2008 de WoS. Para ello se accede a la página del JCR (http://admin-apps.isiknowledge.com/JCR/JCR?SID=3FC6Kpade@hpmBDNDoO) se selecciona el JCR Edición de Ciencias (JCR Science Edition del 2008), después se selecciona la opción Search for a specific journal y se le da Submit (Fig. 29).
Figura 29. Pantalla principal del JCR de Web of Science.
Posteriormente se busca el factor de impacto de cada una de las revistas con mayor número de publicaciones (Fig. 16). Por ejemplo, la revista con mayor número de publicaciones obtenida fue Genetics; en la página de búsqueda de la revista (Journal Search) se selecciona buscar por (Search by) título completo de la revista (Full journal title); y en el recuadro de Type search term (escribir el término de búsqueda) se escribe el nombre de la revista Genetics, (en caso de tener dudas acerca del nombre de la revista se da clic en ver lista de los títulos completos de las revistas (view list of full journal titles) lo que despliega una lista con el nombre completo de todas las revistas indizadas (a); y se da clic en Search (Fig. 30).
47
Figura 30. Pantalla de búsqueda de la revista del JCR de Web of Science.
De este modo se llega a la página de resultados de los índices bibliométricos de la revista Genetics, donde además de obtener el factor de impacto (a) se obtienen otros índices de la revista como: cantidad total de citas, el factor de impacto calculado para cinco años, el índice de inmediatez, la vida media de citas, etc. (Fig. 31).
Figura 31. Pantalla de resultados de los índices bibliométricos de citas para la revista Genetics del JCR de Web of Science.
48
Si se desea mayor información acerca de los índices obtenidos para la revista, así como la forma de obtenerlos, se da clic en el nombre de la revista y esto lleva a otra pantalla, donde se ve con detalle la obtención de los índices (Fig. 32-35).
Figura 32. Detalle de los índices bibliométricos obtenidos para la revista Genetics del JCR de Web of Science. Parte 1.
49
Figura 33. Detalle de los índices bibliométricos obtenidos para la revista Genetics del JCR de Web of Science. Parte 2
Figura 34. Detalle de los índices bibliométricos de citas obtenidos para la revista Genetics del JCR de Web of Science. Parte 3. 50
Figura 35. Detalle de los índices bibliométricos de citas obtenidos para la revista Genetics del JCR de Web of Science. Parte 4.
Aunque en el presente estudio sólo se obtuvo el análisis de citas para dos variables: documentos y revistas; también es factible obtenerlo para otra variable que es el autor, de la siguiente manera. Después de introducir la búsqueda (TI=Drosophila), en la pantalla de resultados, se va al recuadro de Refine Results se da clic en la flecha de Authors (autores (a) y seleccionamos la casilla de Rubin, GM (que fue el autor con mayor cantidad de publicaciones, ver tabla 5 (b) y damos clic en el botón de Refine (c) Fig. 36).
51
Figura 36. Pantalla de Results (resultados) de Web of Science.
En la pantalla de resultados de la b煤squeda refinada por autor (Rubin, GM), se da clic en el bot贸n de Create Citation Report (Crear reporte de citas) (a) Fig. 37.
52
Figura 37. Pantalla de resultados de la búsqueda (Title=Drosophila) redefinida por el autor Rubin, GM en Web of Science.
Así se llega a la pantalla de Citation Report de la búsqueda especificada, en donde se muestran dos gráficas: los artículos publicados por el autor por año y de las citas que obtuvo por año, así como la suma total de citas, el índice h, promedio de citas y la lista de los resultados encontrados (Fig. 38). Las definiciones de cada uno de los indicadores se pueden consultar en la propia pantalla.
53
Figura 38. Pantalla de Citation Report del autor Rubin, GM en Web of Science.
El procedimiento descrito anteriormente para la obtención de las frecuencias de los campos de interés (autor, país, tipo de documento, institución, idioma, publicaciones por año, fuente (revistas) y disciplinas) se puede repetir en otras bases de datos como PubMed; sin embargo, como se puede observar en la gráfica comparativa entre SCI y PubMed para el campo publicaciones por año (Fig. 22) ambas bases de datos arrojan resultados de frecuencias muy similares, por tanto y para evitar redundar en la información, los resultados de frecuencias en PubMed (para estos campos) no son presentados en este trabajo
Posibilidades bibliométricas de Science Citation Index Expanded y PubMed En el campo de la biomedicina, la Biblioteca Nacional de Medicina (NLM) de los Estados Unidos introdujo la primera base de datos bibliográfica interactiva de búsquedas (Medline) en 1971 y posteriormente en 1996 agregaron la “vieja” base de datos Medline con cobertura de publicaciones entre 1950 y 1965. En 1997 se lanzó por Internet PubMed (resultado de la combinación de la vieja Medline y Medline) y se ha convertido en una de las fuentes más populares y confiables para médicos e investigadores. PubMed provee libre acceso al público especializado y en general, a diferencia de Web of Science que es una base de datos que pertenece a proveedores comerciales y requiere una cuota de acceso. La búsqueda por palabras clave de PubMed ofrece una frecuencia de actualización óptima e incluye versiones previas de 54
los artículos en línea. Permite buscar bajo ciertos criterios (búsqueda avanzada) por ejemplo: búsqueda por autores, revistas, fecha de publicación, fecha de integración a PubMed, o tipo de artículo. Los resultados de la búsqueda pueden ser desplegados en una lista que incluye de 5 a 5, 000 registros por página, o como resumen (en donde se presentan: título completo, nombres de los autores, fuente e identificador de PubMed PMID). Si hay abstracts (resumen) o acceso al texto completo aparece un botón para acceder a ellos. Los resultados de una búsqueda pueden ser fácilmente enviados a texto, un archivo, portapapeles, e-mail o suscripciones (RSS o feeds). PubMed también permite el uso directo y simultáneo de otros buscadores desarrollados por la NLM, como son: GENSAT, OMIM y PMC. Una de las mayores ventajas de PubMed que no ofrece Web of Science, es que se mantiene actualizada no solo con literatura impresa sino que también presenta literatura en versiones preliminares de varias revistas antes de que sean publicadas (preprints). Otra fuente conocida de bibliografía científica es el Instituto de Información Científica (ISI) de Thomson Reuters una compañía privada, que en 1964 creó dos bases de datos científicas particulares, el Science Citation Index (SCI) y el Social Science Citation Index (SSCI), que cubren respectivamente las ciencias exactas y las ciencias sociales. El ISI presenta además un informe anual, disponible en forma de microfichas, que representa el análisis de las citas de revistas el Journal Citation Reports (JCR) y da entre otras cosas, el factor de impacto a partir de las citas recibidas por los artículos publicados de la revista; una herramienta útil para evaluar la importancia e influencia de publicaciones específicas. (Callon et al., 1995). En Web of Science (Thomson Reuters, 2009b) existen más posibilidades bibliométricas ya que Thomson Reuters ha desarrollado en la base de datos mayor cantidad de herramientas de la web 2.0 (Macías, 2009; Macías y Michán, 2009); se pueden realizar búsquedas rápidas (introduciendo un tema), búsquedas avanzadas, búsquedas generales y búsqueda de referencias y citas; y cada búsqueda puede ser limitada por autor citado, trabajo citado, años citados, también puede consultarse el índice de autor citado y el índice de trabajo citado. Los resultados de la búsqueda pueden ser desplegados como una lista de 10 a 50 registros por página. El título completo, nombres de los autores y fuente (revistas) son proporcionados. Cuando el texto completo está disponible, se presenta la opción “view free full text” (“ver el texto completo gratuito”). Se pueden encontrar registros relacionados, acomodados por última fecha, cantidad de veces citada, relevancia, primer autor, año de publicación y título de la revista. Los resultados pueden ser analizados (por ejemplo: por autor, país/territorio, tipo de documento) y el citation report (reporte de citas) es presentado como un cuadro. Los resultados pueden ser refinados y el investigador puede ver o excluir dichos registros. El SCI ha sido la referencia principal para obtener cifras e indicadores respecto a las tendencias de producción y difusión de la ciencia mundial (UNESCO, 2005; CONACYT, 2006; OECD, 2007; OST, 2007; RICYT, 2007). PubMed es 55
una base de datos accesible, rápida y fácil de usar; su practicidad en el uso, el hecho de que es gratuita y la autoridad que ha ganado a través de los años la ha hecho la fuente más usada de información en el campo biomédico. Los artículos incluidos en SCI y PubMed son considerados como los más importantes por cumplir con características de calidad tales como, la inclusión de revistas de amplia cobertura temática (multidisciplinaria) y geográfica (internacional), así como el registro de publicaciones periódicas arbitradas (De Moya-Anegón et al., 2007) relevantes, de impacto, de publicación continua, seleccionadas rigurosamente y analizadas con criterios detallados y formatos estandarizados. Sin embargo, ninguna de las dos bases de datos es suficientemente representativa de la producción mundial, en especial de los países en desarrollo como los de América Latina, pues la producción científica está desigualmente registrada en lo que a origen geográfico e idioma de publicación se refiere, ya que por ejemplo E. U. A: o Gran Bretaña tienen mayor proporción de revistas que otros países industrializados como son Alemania o Francia, donde el inglés no es el idioma oficial, porque dentro de los criterios e inclusión se le da prioridad al inglés (Gómez et al., 1999; Michán et al., 2008). Esto para SCI se ha tratado de subsanar como reporta Thomson-Reuters Scientific desde mayo del 2008 se han agregado 700 revistas con la finalidad de mejorar su cobertura “regional”. Leydesdorff y Wagner (2009) encontraron un cambio significativo de esta extensión en la cobertura en contribuciones de Europa oriental pero mucho menos para otras regiones del mundo. En cuanto a la cobertura del idioma de las revistas en las dos bases de datos, se observa que tanto en SCI como en Pubmed existe una deficiencia de cobertura de idiomas distintos al inglés (Maricic, 1997; Van Leeuwen et al., 2001). Pero considerando que la mayoría de las publicaciones de corriente principal y gran impacto a nivel mundial están incluidas en ambas bases de datos, podemos asegurar que el estudio bibliométrico a partir de estas colecciones aporta resultados significativos. PubMed es actualizado diariamente, incluye versiones preliminares de artículos en línea (preprints), lo que permite un seguimiento comprensivo de un tema específico, Web of Science (WoS) se actualiza menos frecuentemente, generalmente por semana. PubMed se centra en las ciencias médicas y biomédicas, mientras que WoS cubre casi todos los campos científicos. WoS cubre publicaciones más antiguas, ya que sus registros indizados van hasta 1900. PubMed permite usar el mayor número de palabras clave por búsqueda, pero no permite hacer análisis de citas. Tanto PubMed como WoS son bases de datos de origen estadounidense. PubMed fue creada por la NLM de los Estados Unidos con la intención de hacer accesible el contenido de Medline vía internet; WoS fue creada por Thomson Reuters para hacer análisis de citas (que E. Garfield evaluó a principios de los 60´s) accesibles vía internet (Garfield, 1963, 1964; Garfield et al., 1964)
56
En la siguiente tabla (tabla 9) se comparan bibliométricas de cada una de acuerdo con los campos obtenidos en este estudio. Tabla 9. Tabla comparativa de los tipos, características y campos disponibles en SCI y PubMed utilizadas en esta investigación. Característica
SCI
PubMed
Meta-análisis
Análisis de frecuencias directo de 8 campos hasta 100, 000 registros máximo por búsqueda:
Factor de impacto de las revistas
Para cada año, se calcula con base en 2 y 5 años.
Documentos citados
Captura las referencias bibliográficas de cada documento, lo que permite hacer análisis de citas. Captura autor y/o grupos de autores.
Se pueden extraer hasta 10, 000 documentos el análisis directo de las frecuencias se puede hacer con aplicaciones como PubMedReminer, GoPubMed, etc.* No captura referencias bibliográficas de cada documento por lo tanto no es posible obtener este indicador. No captura referencias bibliográficas de cada documento por lo tanto no es posible obtener este indicador. Hasta el año 1999 solo se capturaba al primer autor. Con base en el contenido, utiliza como referencia MeSH
Autor
más
Utiliza palabras clave pero no es posible obtener frecuencias directamente sobre esta variable. La asignación del tema se hace a la revista no a cada documento. *La lista de las demás aplicaciones de PubMed se pueden consultar en la tesis Calderón, 2010.
Descriptores
Otra de las ventajas de PubMed es que es una base de datos gratuita. Por otra parte, de las ventajas más importantes de SCI es que permite hacer análisis de los resultados y permite su extracción para meta-análisis; por ello las instituciones más importantes la utilizan para obtener indicadores bibliométricos. La excepción es el análisis temático de los descriptores, el cual está muy bien representado gracias a las palabras clave extraídas de PubMed (MeSH).
Aplicación de la bibliometría en la historia de la ciencia Existen estudios bibliométricos mundiales de algunas disciplinas biológicas como células madre, envejecimiento, cáncer, ecología (Neff y Corley, 2009) y evolución. Dichos análisis generalmente son llevados a cabo con información extraída de bases de datos con énfasis en biología experimental como el SCI y PubMed. Este enfoque mediante el cual la ciencia puede ser representada por los resultados obtenidos, se basa en la noción de que el fundamento de las investigaciones científicas es la producción de conocimiento y que la literatura científica es la base de dicho conocimiento. La idea de examinar la literatura se remonta a los inicios del siglo XX, sin embargo, no fue hasta 1963 con la creación del Science Citation Index (SCI), que se abrió el camino para todos los que buscaban medir la ciencia mediante métodos 57
cuantitativos y objetivos (Macías-Chápula, 1998). Los indicadores bibliométricos son muestra de la actividad científica, lo que permite la definición y medición de la información entre la comunidad científica (Glanzel y Shoepflin, 1994). Recientemente la OCDE se refirió a la bibliometría como una herramienta mediante la cual se puede observar el estado de la ciencia y la tecnología a través de la producción global de la literatura científica en un nivel dado de especialización. La bibliometría constituye un medio para situar la producción de un país con respecto al mundo, una institución en relación con su país y hasta los científicos en relación con sus propias comunidades. Estos indicadores científicos son igualmente apropiados para los macroanálisis por ejemplo, de participación de un país determinado en la producción global de literatura científica durante un periodo específico; y los microanálisis por ejemplo, del papel de una institución dada en la elaboración de artículos en un campo de la ciencia altamente restringido. En combinación con otros indicadores, los estudios bibliométricos pueden ayudar a valorar el estado actual de la ciencia y apoyar en la toma de decisiones y la dirección de la investigación. El análisis métrico de los datos brinda información sobre la orientación y el dinamismo científico de un país y sobre su participación en la ciencia y la tecnología a nivel mundial, pone de manifiesto también la estructura de las disciplinas científicas y las relaciones entre ellas. Los indicadores se basan en un enfoque comparativo, pues necesitan ser interpretados sobre la base de las tendencias reales y artificiales en los datos y en el método utilizado para contarlos. La cuantificación de las publicaciones es el elemento básico de la mayor parte de los estudios bibliométricos, mientras que la de las citas puede usarse directamente como medida de la repercusión o importancia de una publicación, o de las publicaciones de una persona, institución o país (Lícea de Arenas y Santillán-Rivero, 2002). Los indicadores bibliométricos básicos son: -Número de publicaciones: Refleja la producción científica medida por el conteo de trabajos y el tipo de documentos (libros, artículos de revistas, publicaciones científicas, informes, etc.). La dinámica de investigación de un país determinado puede monitorearse y seguirse sus tendencias a través del tiempo. -Número de citas: Refleja el impacto de los artículos en los asuntos citados. -Campos científicos (países, instituciones, idioma): Refleja las posiciones relativas de diferentes países en la cooperación científica global. Las técnicas bibliométricas se han aplicado para realizar análisis internacionales y nacionales de la literatura científica. Algunos estudios han examinado el aporte de esta literatura en varios países en un periodo determinado, otros han presentado datos que muestran cuántas veces se cita a varios países, o para comparar países. El proceso de institucionalización de una disciplina científica se refiere al establecimiento de instituciones en las que se realiza, 58
desarrolla, difunde, enseña, comunica, fomenta o profesionaliza la práctica científica, como universidades, laboratorios de investigación, museos y sociedades, que en su conjunto reflejan la estructura social y el robustecimiento de una disciplina. Los productos especializados y colectivos característicos de dicho proceso son las publicaciones periódicas, uno de los indicadores más representativos de la actividad científica de una región (Vessuri, 1995). La información que proporcionan los análisis bibliométricos sirven para: identificar esferas de interés; donde se encuentran las materias; comprender cómo y con qué frecuencia se comunican los científicos (McGrath, 1989); identificar características de las fuentes de publicaciones, sobre todo de la distribución de artículos sobre una disciplina dada en las revistas; identificar características de la relación autor-productividad, medida por el número de artículos o por otros medios, el grado de colaboración; realizar análisis de citas, distribución por autores, artículos, instituciones, revistas, países; utilización de las citas en la evaluación, representación de las disciplinas basada en las cocitaciones; identificar el nivel de obsolescencia de la literatura medida según el uso y las citas; así como el crecimiento de la literatura especializada, bases de datos, bibliotecas, el desarrollo simultáneo de nuevos conceptos; identificar las tendencias y el crecimiento del conocimiento en las distintas disciplinas; estimar la cobertura de las revistas secundarias; identificar los usuarios de las distintas disciplinas, identificar autores y tendencias en distintas disciplinas, predecir las tendencias de publicación, identificar las revistas núcleo de cada disciplina, predecir la productividad de editores, autores individuales, organizaciones, países; por mencionar algunas (Macías-Chápula 1998). Algunas posibilidades de aplicación de las técnicas bibliométricas son (Wilson, 1999): adaptar políticas de descarte de publicaciones, formular políticas de adquisición ajustadas al presupuesto, diseñar normas para estandarización, diseñar procesos automáticos de indización, clasificación y confección de resúmenes, revisiones de política científica, medición de insumos como: gastos y personal de investigación y su desarrollo, asignación de recursos, tiempo, dinero, etc. (el medio más común de otorgar méritos y reconocimientos es mediante las citas) (Spinak, 1998). Los resultados de los análisis bibliométricos proveen una nueva forma de explorar las relaciones entre políticas públicas, cambio tecnológico y la evolución de las prioridades científicas (Neff y Corley, 2009).
Análisis bibliométricos complejos Hasta aquí se han presentado los análisis bibliométricos básicos que permiten identificar las principales características de la producción científica, pero en la actualidad existen varios métodos sofisticados para identificar desarrollo, tendencias, estructura, contenidos y relaciones con más detalle, tal es el caso de la incorporación de métodos novedosos como el análisis de redes o el descubrimiento basado en la literatura que complementa el enfoque bibliométrico. 59
El análisis de redes es una disciplina reciente encargada de estudiar a las redes, cualquiera que estas sean: sociales, de información (o de conocimiento), biológicas o tecnológicas. Las redes de comunicación, la World Wide Web (www), el genoma humano, las redes de proteínas, las redes neuronales, las de transportes, las redes sociales o las redes de colaboración científica son algunos ejemplos (Barabási y Bonabeau, 2003; Barrat et al., 2004; Börner et al., 2005). Las redes complejas describen una amplia cantidad de sistemas naturales y sociales (Albert y Barabási, 2002), están constituidas por nodos (actores) y vértices (relaciones) con una estructura (topología determinada) que tiene información cuantitativa respecto a las conexiones, tendencias y patrones de la información. Las redes son estructuras abiertas que pueden expandirse sin límites integrando nuevos nodos en función de las posibilidades de comunicación que existan en su entorno y siempre que compartan códigos de comunicación compatibles. El análisis de redes es una práctica interdisciplinaria que integra, contrasta y compara técnicas, y algoritmos desarrollados por matemáticos, estadistas, físicos, sociólogos o especialistas en información y/o informática (Börner et al., 2007). El análisis de redes sociales ha sido un método practicado desde la sociología y se ha utilizado para investigar las relaciones existentes entre distintos actores (Eom, 1996; Cahlik, 2000; Boyack, 2004; Boyack et al., 2005; Colin y Ke, 2006). Una red social es una estructura social compuesta por nodos (pueden ser individuos, organizaciones, documentos, dominios, revistas, bases de datos) y relaciones de interdependencia como valores, visiones, ideas, financiamiento, intercambio, amistad, conflicto, enfermedades, rutas, copalabras, colaboración y cocitación, las tres últimas has sido las más utilizadas en el análisis de información bibliométrica (De Solla Price, 1965; Barabási et al., 2002; Leydesdorff, 2003; Balconi et al., 2004; Boyack, 2004; Garfield, 2004; Boyack et al., 2005; Leydesdorff, 2007; Leydesdorff y Wagner, 2008). Estas redes operan en distintos niveles, desde personas, grupos, organizaciones hasta naciones, cualquier entidad que procese información o conocimiento (Jamali y Abolhassani, 2006), constituyen un mapa con las conexiones más relevantes entre los nodos estudiados que dan información respecto a los patrones y relaciones existentes, que son aplicados en resolver problemas sociales, caracterizar el funcionamiento de las organizaciones y el grado en el que los individuos alcanzan sus objetivos, por ejemplo (Hanneman y Riddle, 2005). Uno de los programas más utilizados para el análisis de redes sociales es el software libre Pajek (Batagelj y Mrvar, 2008). En la siguiente figura (Fig. 39) se muestra un ejemplo de un análisis de redes simple.
60
Fig.
39.
Análisis
de
redes
de
coautoría
de
Rubin,
GM
obtenido
con
la
aplicación
PubNet
(http://pubnet.gersteinlab.org/out/090930102709.png) para PubMed.
El descubrimiento basado en la literatura, también denominado en algunos casos minería de textos (literaturebased discovery, knowledge discovery database o text mining), se utiliza para la generación de nuevo conocimiento interesante, plausible, e inteligible. Consiste en vincular dos o más conceptos de la literatura que hasta ahora no han sido relacionados (es decir, disjuntos) por medio del uso de programas y algoritmos diseñados para tal fin (Song y Bruza, 2006; Kostoff, 2008; Kostoff et al., 2008; Kostoff et al., 2008). Para que se dé el descubrimiento basado en literatura se necesita: que exista gran cantidad de información, disponible en formato electrónico, organizada y normalizada en bases de datos; y computadoras y algoritmos cuyos métodos permitan encontrar nuevo conocimiento de las relaciones ya conocidas (Jensen et al., 2006). El descubrimiento basado en literatura (LBD) fue iniciado por Swanson (Swanson, 1987), quien usó una combinación de análisis de citas y un manual de revisiones en su proceso de descubrimiento; que sirvió para determinar novedades detectando literaturas disjuntas. El proceso de descubrimiento comienza con un término 61
inicial de interés para el investigador, después el sistema de LBD utiliza un enfoque de correlación de minería (correlation-mining approach) para encontrar los términos que están directamente correlacionados con el término inicial. A estos primeros términos correlacionados se les llama términos de unión (linking terms), para cada uno de éstos el sistema de LBD usa el mismo enfoque de correlación para identificar términos relacionados con ellos. Los últimos términos relacionados se llaman términos objetivos (target terms). Se asume entonces que los términos de unión representan las conexiones entre los términos ya conocidas; y que los términos objetivos son los nuevos descubrimientos potenciales. Finalmente, el sistema de LBD ordena los términos objetivo con un enfoque de categorías (ranking approach) (Swanson, 1988). Los avances en las tecnologías de minería de textos y descubrimiento basado en literatura (Fayyad, 1996) facilitan el compartir conocimiento y experiencia entre investigadores de disciplinas relacionadas. Esto es especialmente importante en ciencias interdisciplinarias como la biomedicina (Shortliffe, 1993). Cuando se encuentran nuevas relaciones que son interesantes desde un punto de vista médico, pueden ser verificadas por distintos investigadores de otras disciplinas, lo que contribuye al mejor entendimiento del fenómeno. Para la obtención de indicadores bibliométricos complejos, como el análisis de redes y el descubrimiento basado en literatura, primero es necesario identificar las características básicas de la producción científica general y global de una disciplina y caracterizarla por medio de análisis bibliométricos para obtener los indicadores básicos expuestos en el presente trabajo, que constituyen el sustento de cualquier estudio basado en literatura registrada en las bases de datos bibliográficas especializadas. En este trabajo destacamos la importancia de los análisis bibliométricos de la información como una herramienta que nos permite conocer tendencias y puntos clave en un área de investigación. Dichos análisis son posibles debido a que, como resultado de la revolución informática, se han capturado grandes cantidades de información resultado de la investigación científica, en bases de datos, que a su vez han desarrollado herramientas que permiten visualizarla, extraerla y analizarla para que la interacción entre el investigador y la información sea lo más didáctica y sencilla posible. Sin embargo, dichas técnicas aún son desconocidas o poco usadas por la mayoría de los investigadores debido a lo reciente de su creación y a la especialización del área de estudio. Dado que los investigadores conocen y dominan su objeto de estudio, son los más acertados a interpretar los resultados que se obtengan de los análisis, así como para llevar a cabo el planteamiento del problema y definir las palabras clave de su área, que lleven a resultados precisos. Por tanto, es de suma importancia el desarrollo de manuales y guías descriptivas no sólo para investigadores, sino incluso para el público en general. Se deben llevar a cabo estudios cuantitativos y cualitativos que permitan conocer y difundir la 62
inmensa cantidad de información existente acumulada a lo largo de estos años, para poder establecer el curso de las investigaciones, definir parámetros y tendencias, establecer políticas sociales y de investigación para otorgar subsidios, inversiones, etc. A pesar de todas las ventajas que las bases de datos nos ofrecen, la información en las bases de datos internacionales como las usadas en este trabajo es parcial, porque aun no se ha capturado o llevado a formato electrónico toda la información generada antes del uso de las bases de datos. Otro problema es que la información local o regional de suma importancia no es indizada en estas grandes bases de datos; por ello debería proponerse la creación de una base de datos nacional en donde se almacenara la bibliografía producida en México, a la cual se pudiera referir primeramente y después comparar, completar o cotejar con la información almacenada en las grandes bases de datos internacionales, para así poder lograr los objetivos de la investigación.
63
CONCLUSIONES En este trabajo se exploran, sistematizan y explican los recursos bibliométricos básicos disponibles en la Web de las dos bases de datos bibliográficas SCI (Thomson Reuters) y PubMed (NIH) más importantes en el área de la biología; así como las posibilidades que ofrecen para identificar proporciones y tendencias de manera directa, simultánea, automatizada, eficiente, inmediata, actualizada, exhaustiva y organizada y su aplicación en la historia de la ciencia actual. Para dicho propósito se utiliza un caso biológico como objeto de estudio, la producción mundial de 1900 al 2008 sobre la mosca de la fruta (Drosophila melanogaster) que es uno de los organismos multicelulares mejor caracterizados. Los análisis bibliométricos básicos susceptibles a realizarse en las dos bases de datos bibliográficas usadas dependen básicamente de dos elementos: 1) sus características y cobertura, en especial resaltan: tamaño, cobertura temporal, actualización, volumen de información, la cobertura disciplinar y la temática y 2) el tipo de información que registran para cada documento. En lo que se refiere a las características de las bases de datos destacan las ventajas del análisis métrico en línea: rapidez, bajo costo (dependiendo del acceso de la institución), obtención de resultados instantáneos (que son reproducibles) usando herramientas de procesamiento avanzadas. En cuánto a las características particulares se tiene por ejemplo, que PubMed provee libre acceso al público especializado y en general, mientras que Web of Science al pertenecer a proveedores comerciales, requiere una cuota de acceso; entre otras. En Web of Science existen más posibilidades de búsquedas que en PubMed, a través del uso de aplicaciones en línea de SCI fue posible obtener proporciones y tendencias directas respecto a once variables: registros totales, autor, país, tipo de documento, institución, idioma, publicaciones por año, fuente (revistas), disciplinas (y tendencias temporales de las más importantes en la investigación), documentos más citados y factor de impacto de las revistas más productivas. Sin embargo, la parte temática está mejor representada en PubMed, gracias a la búsqueda por palabras clave dadas por los descriptores de su tesauro (MeSH). En total se analizaron 48, 981 registros extraídos de SCI y 34, 300 de PubMed, se presenta la síntesis de los resultados obtenidos para cada indicador bibliométrico, así como la cantidad de registros para cada variable en ambas bases de datos; y el método usado para llevar a cabo la búsqueda, extracción, normalización y procesamiento de la información. El análisis descriptivo del proceso es de suma importancia ya que para cualquier análisis cuantitativo de bibliografía primero es necesario identificar las características básicas de la producción científica general y global de una
64
disciplina y caracterizarla por medio de análisis bibliométricos para obtener los indicadores básicos, que constituyen el sustento de cualquier investigación basada en la literatura registrada en las bases de datos bibliográficas especializadas. Se presentan los análisis bibliométricos básicos que permiten identificar las principales características de la producción científica, pero en la actualidad existen varios métodos sofisticados para identificar desarrollo, tendencias, estructura, contenidos y relaciones con más detalle, tal es el caso de la incorporación de métodos novedosos como el análisis de redes o el descubrimiento basado en la literatura que complementa el enfoque bibliométrico.
65
PERSPECTIVAS Con base en el presente trabajo resaltamos la importancia de los análisis bibliométricos como la aproximación más sencilla y básica que sirve como referencia para los demás meta-análisis. Por ello, sería importante realizar trabajos próximos que se enfoquen en la importancia, desarrollo y estudio de los otros dos tipos de meta-análisis mencionados, estos son: el análisis de redes y el descubrimiento basado en literatura y su utilidad para el análisis de la historia de la ciencia actual. También sería conveniente realizar análisis bibliométricos más complejos utilizando bases de datos como SCI y PubMed y algunas de las aplicaciones que existen para hacer minería de textos (text mining), muchas de ellas diseñadas para PubMed. E incluso explorar la posibilidad de obtener análisis bibliométricos de textos completos, tablas e imágenes producto de la investigación científica. Sería interesante hacer descripciones respecto a los avances tecnológicos que existen para extraer y normalizar la información de las bases de datos bibliográficas. Además es importante estudiar las posibilidades que presentan otras colecciones de datos para hacer análisis bibliométricos de las ciencias biológicas como son: Scopus, Biosis, CAB, Zoologial Record (de carácter mundial) y regionales como Periódica, Scielo y Redalyc.
66
APÉNDICE 1 Apéndice 1: Abreviaturas y significado de los campos que captura PubMed.
Abreviatura
Significado
PMID OWN
PubMed Identifier o PubMed Unique Identifier- Número único asignado a cada artículo en PubMed. Owner (propietario) El nombre de la organización que dio la información de las citas. Status Contiene información usada por la NLM para mantenimiento y pruebas. Identifica las citas STAT que no serán indizadas, ya sea porque los artículos están fuera del alcance o porque son artículos publicados antes de que la revista fuera indizada. Date Created (antes Date entry) Indica la fecha en que se empezó el procesamiento del registro DA bibliográfico. Date Completed (Fecha completada) Indica la fecha en la que se completó el procesamiento del DCOM registro bibliográfico. Last Revision date (Última fecha de revisión) Indica la última fecha en la que se hizo una revisión del LR artículo. IS ISSN Indica el número ISSN (International Standard Serial Number) en Oldmed. VI Volume/Issue (Volumen/número) Indica el volumen y número de la revista en Oldmed. Issue/Part/Supplement (Número/parte/suplemento) Indica el número, parte o suplemento de la IP revista. DP Date of publication (Fecha de publicación) Indica la fecha en la que fue publicado el artículo. TI Title (Título) Indica el nombre del artículo PG Page (páginas) Indica las páginas del artículo AB Abstract (Resumen) Muestra el resumen del artículo AD Address (Dirección) Indica la dirección del lugar de afiliación del primer autor. FAU First author name (Nombre del primer autor) Indica el nombre del primer autor del artículo. AU Author-Autor(es) Muestra los nombres de los autores. LA Language (idioma) Muestra el idioma del artículo. GR Grant Number (Número de subvención) Indica el número de subvención o contrato. PT Publication type (tipo de publicación) Indica el tipo de publicación. PL Place of publication (Lugar de publicación) Indica el lugar de publicación. TA Title Abbreviation (Título abreviado) en Oldmed. Indica el nombre abreviado del artículo. JT Journal title (Nombre de la Revista) Indica el nombre de la revista. JID NLM Unique ID Muestra el identificador del registro dentro de la NLM. CAS Registry/EC Number Da el Registro CAS (Nomenclature and Chemical Abstracts Service) y/o el RN Número EC (Enzyme Commission). Journal Subset (Subconjunto de la revista) Da información acerca de a que subconjunto de revistas SB indizadas pertenece el artículo. En el caso de Adams et al., 2000 IM significa Indexed Index Medicus journals. MH MeSH Headings (Encabezados del MeSH) Muestra las palabras clave asignadas del tesauro MeSH EDAT Entrez Date Indica la fecha en que se agregó el registro a Entrez. MHDA MeSH Date Indica la fecha en que se agregó el registro al tesauro MeSH. CRDT Create Date Indica la fecha en que el registro fue agregado a PubMed. Article ID (ID del artículo) Indica el DOI (Digital Object Identifiers) y/o PII (Publisher Item Identifier) AID del artículo. PST Información no disponible. SO Source (fuente) Indica la revista, fecha, el volumen, número y páginas del artículo. http://www.nlm.nih.gov/pubs/techbull/new_index.html
67
APÉNDICE 2 Apéndice 2: Abreviaturas y significado de los campos que captura SCI.
Abreviatura
Significado
PT
Publication type (tipo de publicación) Indica el tipo de publicación.
AU TI
Author-Autor(es) Muestra los nombres de los autores.
SO
Source (fuente) Indica la revista donde se publicó el artículo.
AB
Abstract (Resumen) Muestra el resumen del artículo.
SN
Identificador de Web of Science
PD
Title (Título) Indica el nombre del artículo.
Publication Date (Fecha de publicación) Indica el Día-Mes de publicación del artículo.
PY
Publication Year (Año de publicación) Indica el año de publicación del artículo.
VL
Identificador de Web of Science
IS
ISSN Indica el número ISSN (International Standard Serial Number).
BP
Identificador de Web of Science
EP
Identificador de Web of Science
UT
Identificador de Web of Science
68
REFERENCIAS Adams, M.D. et al. (2000). The genome sequence of Drosophila melanogaster. Science 287, 2185–2195. Aguillo, I. F., B. Granadino, et al. (2006). Scientific research activity and communication measured with cybermetrics indicators. Journal of the American Society for Information Science and Technology 57(10): 1296-1302. Albert, R. y A. L. Barabási (2002). Statistical mechanics of complex networks. Reviews of Modern Physics 74(1): 47-97. Albornoz, M. 2002. Situación de la ciencia y la tecnología en las Américas. Centro de Estudios sobre Ciencia, desarrollo y educación superior. Buenos Aires. 52 p. Arunachalam, S. (1999). Information and knowledge in the age of electronic communication: a developing country perspective. Journal of Information Science 25(6): 465-476. Atkins, D. E., Droegemeier, K. K., Feldman, S. I., Garcia-Molina, H., Klein, M. L., Messerschmitt, D. G., et al. (2003). Revolutionizing Science and Engineering Through Cyber infrastructure: Science. Bailón-Moreno, R., E. Jurado-Alameda, et al. (2005). Bibliometric laws: Empirical flaws of fit. Scientometrics 63(2): 209229. Balconi, M., S. Breschi, et al. (2004). Networks of inventors and the role of academia: An exploration of Italian patent data. Research Policy 33(1): 127-145. Barabási, A. L., H. Jeong, et al. (2002). Evolution of the social network of scientific collaborations. Physica A: Statistical Mechanics and its Applications 311(3-4): 590-614. Barabási, A. L. y Bonabeau, E. Redes sin escala. En: Investigación y ciencia, (2003), julio, p. 58-67. Barrat, A.; Barthélemy, M.; Pastor-Satorras, R. et al. The architecture of complex weighted networks. En: Proceedings of the National Academy of Sciences of the United States of America, (2004), 101 (11), p. 3747-3752. Bar-Ilan, J. (2001). Data collection methods on the web for info metric purposes - A review and analysis. Scientometrics 50(1): 7-32. Batagelj, V. y A. Mrvar. (2008). Pajek, Program for large network analysis. from http://pajek.imfm.si/doku.php?id=download. Batista, P. D., M. G. Campiteli, et al. (2006). Is it possible to compare researchers with different scientific interests? Scientometrics 68(1): 179-189. Beaver, D. D. (2001). Reflections on scientific collaboration (and its study): Past, present, and future. Scientometrics 52(3): 365-377. Beaver, D. D. (2004). Does collaborative research have greater epistemic authority? Scientometrics 60(3): 399-408. Bhattacharya, S., H. Kretschmer, et al. (2003). Characterizing intellectual spaces between science and technology. Scientometrics 58(2): 369-390. Björk, B.-C., A. Roos, et al. (2009). Scientific journal publishing: yearly volume and open access availability. Information Research 14(1). Björneborn, L. (2001). Small-world linkage and co-linkage. Proceedings of the ACM Conference on Hypertext. Björneborn, L. y P. Ingwersen (2001). Perspectives of web metrics. Scientometrics 50(1): 65-82. Björneborn, L. y P. Ingwersen (2004). Toward a basic framework for web metrics. Journal of the American Society for Information Science and Technology 55(14): 1216-1227. Börner, K., C. Chen, et al. (2003). Visualizing knowledge domains. Annual Review of Information Science and Technology. 37: 179-255. Börner, K., J. T. Maru, et al. (2004). The simultaneous evolution of author and paper networks. Proceedings of the National Academy of Sciences of the United States of America 101(SUPPL. 1): 5266-5273. Börner, K.; Dall‟Asta, L.; Ke, W. et al. Studying the emerging global brain: analyzing and visualizing the impact of coauthorship teams. En: Complexity, (2005), 10 (4), p. 57-67. Börner, K., S. Sanyal, et al. (2007). Network science. Annual Review of Information Science and Technology 41: 537607. Bookstein, A., H. Moed, et al. (2006). Measures of international collaboration in scientific literature: Part II. Information Processing and Management 42(6): 1422-1427. Bordons, M., M. T. Fernández, et al. (2002). Advantages and limitations in the use of impact factor measures for the assessment of research performance in a peripheral country. Scientometrics 53(2): 195-206. Bornmann, L. y H. D. Daniel (2005). Does the h-index for ranking of scientists really work? Scientometrics 65(3): 391392. Boyack, K. W. (2004). Mapping knowledge domains: Characterizing PNAS. Proceedings of the National Academy of Sciences of the United States of America 101: 5192-5199 Boyack, K. W., R. Klavans, et al. (2005). Mapping the backbone of science. Scientometrics 64(3): 351-374. Bradford, S. C. (1948). Documentation. Londres, Crosby Lockwood and Son, Ltd.
69
Buela-Casal, G. (2003). Evaluating quality of articles and scientific journals. Proposal of weighted impact factor and a quality index? Evaluación de la calidad de los artículos y de las revistas científicas: Propuesta del factor de impacto ponderado y de un índice de calidad 15(1): 23-35. Cahlik, T. (2000). Comparison of the maps of science. Scientometrics 49(3): 373-387. Calderón, R. (2010). Ciberinfraestructura para el uso de literatura especializada en Biomédicas. Tesis. Facultad de Ciencias, Biología. Universidad Nacional Autónoma de México. Callon, M; Courtial, JP; Penan, H. (1995) Cienciometría: el estudio cuantitativo de la actividad científica. De la bibliometría a la vigilancia tecnológica. Gijón: Trea. pp. 35-36, 91 Charum, J y D. Usgame (2005). Structuring Bibliographic Information of Authors Linked with Colombian Institutions Indexed in CAB Database, 1997-2002. Estructuración de la información bibliográfica en la base de datos CAB de autores vinculados a instituciones colombianas de 1997 a 2002. Acta Biológica Colombiana. Coile, RC. (1977). A bibliometric examination of the square root theory of scientific publication productivity. American Society for Information Science. Vol.14 Colin, M. y W. a. B. Ke, Katy. (2006). Mapping Scientific Disciplines and Author Expertise Based on Personal Bibliography Files. CONACYT (2006) Informe General del Estado de la Ciencia y la Tecnología. México. www.siicyt.gob.mx/siicyt/referencias/publicacionesMenu2.do (Cons. 10/02/2008). De Moya-Anegón F, Chinchilla-Rodríguez Z, Vargas-Quesada B, Corera-Álvarez E, Muñoz-Fernández FJ, GonzálezMolina A, Herrero-Solana V (2007) Coverage analysis of Scopus: A journal metric approach. Scientometrics 73: 5378. Deogan, M. S. (1987). On-line bibliometrics, Lucknow Librarian, 19: 43–48. Dobzhansky T (1937) Genetics and the Origin of Species. Columbia University Press, New York. Eom, S. B. (1996). Mapping the intellectual structure of research in decision support systems through author cocitation analysis (1971-1993). Decision Support Systems 16(4): 315-338. Fayyad U, Piatetsky-Shapiro G, Smyth P. Knowledge discovery and data mining: towards a unifying framework. In: Proceeding of the second international conference on knowledge discovery and data mining, Oregon: Portland; (1996). p. 82–8. Garfield, E. (1955). Citation Indexes for Science - New Dimension in Documentation through Association of Ideas. Science 122(3159): 108-111. Garfield, E. (1963).Science Citation Index. Science Citation Index, 1961, p.v-xvi, 1963. Garfield, E. (1964).Science Citation Index -- A New Dimension in Indexing. Science, 144(3619) p.649-54. Garfield, E., I. H. Sher, y R. J. Torpie.(1964). The Use of Citation Data in Writing the History of Science. Published by The Institute for Scientific Information. Garfield, E. (1972). Citation Statistics May Help Scientists Choose Journals in Which to Publish. Current Contents/Life Sciences 15(7): 5-&. Garfield, E. (1973). What Scientific Journals Can Tell Us About Scientific Journals. Ieee Transactions on Professional Communication PC 16(4): 200-203. Garfield, E. (1979) a. Citation Indexing: Its Theory and Application in Science, Technology, and Humanities. Garfield, E. (1979) b. Current-Contents - Its Impact on Scientific Communication. Interdisciplinary Science Reviews 4(4): 318-323. Garfield, E. (1990). Keywords plus-ISIS breakthrough retrieval method. 1. Expanding your searching power on currentcontents on diskette. Current contents, 32: 5-9. Garfield, E. (1998). From citation Indexes to info metrics: Is the Tail Now Wagging the Dog? Scientometrics 43(1): 6976. Garfield, E. (2001). The Evolution of the Science Citation Index Search Engine to the Web of Science, Scientometric Evaluation and Historiography. Garfield, E. (2004). Historiographic mapping of knowledge domains literature. Journal of Information Science 30(2): 119145. Garfield, E. (2009). From the science of science to Scientometrics visualizing the history of science with HistCite software. Journal of Informetrics, 3(3), 173-179. doi: 10.1016/j.joi.2009.03.009. Glanzel, W. y U. Schoepflin. (1994), Little scientometrics, big scientometrics… and beyond? Scientometrics, 30: 375– 384. Gómez I, Sancho R, Moreno L, Fernández MT (1999) Influence of Latin American journals coverage by international databases. Scientometrics 46: 443-456. Hanneman, R. A. y M. Riddle (2005). Introduction to Social Network Methods. Riverside, University of California. Hawkins, DT (1977). Unconventional uses of on-line information retrieval systems: on-line bibliometric studies, Journal of the American Society for Information Science, 28: 13–18. 70
Hood, W. W. y C. S. Wilson (2003). Infometric studies using databases: Opportunities and challenges. Scientometrics 58(3): 587-608. Hull D, Pettifer SR, Kell DB. Defrosting the Digital Library: Bibliographic Tools for the Next Generation Web. PLoS Comput Biol. 2008; 4(10). Ingwersen P. y FH. Christensen. (1997). Data set isolation for bibliometric online analysis of research publications: fundamental methodological issues. Journal of the American Society for Information Science 48(3), pp. 205-217. Jamali, M. y H. Abolhassani Different Aspects of Social Network Analysis. Web Intelligence, 2006. WI 2006. IEEE/WIC/ACM International Conference on In Web Intelligence, (2006). WI 2006. IEEE/WIC/ACM International Conference on (2006), pp. 66-72. Jensen, L. J., Saric, J., y Bork, P. (2006). Literature mining for the biologist: From information retrieval to biological discovery. Nature Reviews Genetics, 7 (2), 119-129. URL http://dx.doi.org/10.1038/nrg1768 Kostoff, R. N. (2008). Literature-related discovery (LRD): Introduction and background. Technological Forecasting and Social Change 75(2): 165-185 Kostoff, R. N., J. A. Block, et al. (2008) a. Literature-related discovery (LRD): Lessons, learned and future research directions. Technological Forecasting and Social Change 75(2): 276-299. Kostoff, R. N., M. B. Briggs, et al. (2008) b. Literature-related discovery (LRD): Methodology. Technological Forecasting and Social Change 75(2): 186-202. Larsen, P. (2008). The state of the art in publication counting. Scientometrics 77(2): 235-251. Lewontin RC (1974) The Genetics Basis of Evolutionary Change. Columbia University Press, New York. Leydesdorff, L., y Wouters, P. (1999). Between texts and contexts: Advances in theories of citation? (A rejoinder). Scientometrics, 44(2), 169-182. doi: 10.1007/BF02457378. Leydesdorff, L. (2000). The triple helix: an evolutionary model of innovations. Research Policy, 29(2), 243-255. doi: 10.1016/S0048-7333(99)00063-3. Leydesdorff, L. (2001). The Challenge of Scientometrics: The Development, Measurement, and Self-Organization of Scientific Communications. Leydesdorff, L. (2003). Can networks of journal-journal citations be used as indicators of change in the social sciences? Journal of Documentation 59(1): 84-104. Leydesdorff, L. (2007). Visualization of the citation impact environments of scientific journals: An online mapping exercise. Journal of the American Society for Information Science and Technology 58(1): 25-38. Leydesdorff, L. y C. S. Wagner (2008). International collaboration in science and the formation of a core group. Journal of Informetrics 2(4): 317-325. Leydesdorff, L., y Wagner, C. S. (2009). Macro-level Indicators of the Relations between Research Funding and Research Output in preparation. Leydesdorff, L., de Moya-Anegón, F., y Guerrero-Bote, V. (2009). Journal maps on the basis of Scopus data: A comparison with the journal citation reports of the ISI. Journal of the American Society for Information Science and Technology, 9999(9999), n/a-n/a. doi: 10.1002/asi.21250. Li, L., Ding, G., Feng, N., Wang, M., y Ho, Y. (2009). Global stem cell research trend: Bibliometric analysis as a tool for mapping of trends from (1991 to 2006). Scientometrics, 80(1), 39-58. doi: 10.1007/s11192-008-1939-5. Licea De Arenas J. y E. Santillán-Rivero. (2002). Bibliometría: ¿para qué?. Biblioteca Universitaria Nueva Época, México D.F., v.5, p.13-10. Lotka, A. J. (1926). The frequency distribution of scientific productivity. Journal of the Washington Academy of Sciences 16(12): 317-323. Lowe, H. J., E. C. Lomax, et al. (1996). The World Wide Web: A review of an emerging Internet-based technology for the distribution of biomedical information. Journal of the American Medical Informatics Association 3(1): 1-14. McGrath, W. (1989) What bibliometricians, scientometricians and informetricians study; a typology for definition and classification; topics for discussion. International Conference on Bibliometrics, Scientometrics and Informetrics, Ontario. Macías, L. (2009). Ciberinfraestructura para el uso de literatura especializada en Biología. Tesis. Facultad de Ciencias, Biología. Universidad Nacional Autónoma de México. Macías, L., y Michán, L. (2009). Los recursos de la Web 2.0 para el manejo de información académica. Fuente, 1(1), 18-27. Macías-Chápula, CA (1998). Papel de la informetría y de la cienciometría y su perspectiva nacional e internacional. ACIMED ;9(1):35-41. Disponible en: http://bvs.sld.cu/revistas/aci/vol9_s_01/sci06100.pdf Malin, M. V. (1968). Science Citation Index - a New Concept in Indexing. Library Trends 16(3): 374-&. Maricic, S. (1997). The mainstream-peripheral science communication. Technoscience, 10 (Winter 1997, at http://cybermetrics.cindoc.csic.es/cybermetrics/pdf/394.pdf). Merriam J, Ashburner M, Hartl DL, Kafatos FC (1991) Toward cloning and mapping the genome of Drosophila. Science 254: 221-225. 71
Michán, L. y J. Llorente (2003). La taxonomía en México durante el siglo xx. Publ. Esp. Mus. Zool 13, 1-250. Michan, L., et al., (2008). Análisis de la sistemática actual en Latinoamérica. Interciencia, 33(10). Michán, L. (2009) a. Recursos didácticos para el manejo electrónico de literatura en Biología. México: Proyecto PAPIME:PE201509. Michán, L. (2009) b. Las revistas y la institucionalización de la sistemática en América Latina. Revista Mexicana de Biodiversidad E. Vol. 80, No. 1. Michán, L. en preparación. ¿Qué bases de datos deberíamos utilizar para analizar la literatura sobre sistemática latinoamericana?. Revista Española de Documentación Científica, Enviado. Michán, L. y J. Llorente en prensa. Análisis bibliométrico de la producción sobre sistemática biológica sobre América Latina durante el siglo XX en tres bases de datos mundiales. Revista de Biología Tropical. Mike Thelwall, L. V. L. B. (2005). Webometrics. Annual Review of Information Science and Technology 39(1): 81-135. Morales, E. (2003) Infodiversidad, globalización y derecho a la información. Sociedad de Investigaciones Bibliotecológicas. Buenos Aires, 203 p. Narin, F., Carpenter, M., y Berlt, N. (1972). Interrelationships of scientific journals. Journal of the American Society for Information Science, 23(5), 323-331. doi: 10.1002/asi.4630230508. Narin, F., Olivastro, D., y Stevens, K. (1994). Bibliometrics/Theory, Practice and Problems. Evaluation Review, 18(1), 65-76. doi: 10.1177/0193841X9401800107. Narin, F. (1995). Inventive productivity. Research Policy, 24(4), 507-519. doi: 10.1016/S0048-7333(94)00780-2. Narin, F., Hamilton, K., y Olivastro, D. (1997). The increasing linkage between U.S. technology and public science. Research Policy, 26(3), 317-330. doi: 10.1016/S0048-7333(97)00013-9. Neff, M., y Corley, E. (2009) 35 years and 160,000 articles: A bibliometric exploration of the evolution of ecology. Scientometrics, 80(3), 657-682. doi: 10.1007/s11192-008-2099-3. Neufeld, M. L. y M. Cornog (1986) Database history - from dinosaurs to compact disks. Journal of the American Society for Information Science 37(4): 183-190. NSF (2005). Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century, National Science Foundation: 87. OECD (2007) Stats: Science, Technology and Patents. http://stats.oecd.org/wbos/Default.aspx?usercontext=sourceoecd (Cons. 06/02/2008). OST (2007) Rapport Biennal Edition 2006. Key Figures on Science and Technology 2006. L‟Observatoire des Sciences et des Techniques. Paris, Francia. www.obs-ost.fr/ (Cons. 05/10/2007). Price, D. S. (1963) Big science, little science. Columbia University, New York. 119 p. Price, D. S. (1965) Networks of scientific papers. RICYT (2007) Indicadores comparativos. www.ricyt.edu.a r / i n t e r i o r / i n t e r i o r. a s p ? Nivel1=1&Nivel2=2&Idioma= (Cons. 05/10/2007). Rothman, H. y M. Woodhead (1971). Use of Citation Counting to Identify Research Trends. Journal of Documentation 27(4): 287-&. Saracevic, T. (1999). Information science. Journal of the American Society for Information Science 50(12): 1051-1063. Schoepflin, U. y W. Glanzel (2001). Two decades of "scientometrics - An interdisciplinary field represented by its leading journal. Scientometrics 50(2): 301-312. Schubert, A. (2002). The web of scientometrics: A statistical overview of the first 50 volumes of the journal. Scientometrics 53(1): 3-20. Shearer, E. y M. J. Moravscik (1979). Citation patterns in little science and big science. Scientometrics V1(5): 463-474. Shiffrin, R. M. y K. Börner (2004). Mapping knowledge domains. PNAS 101 suppl1: 5183–5185. Shortliffe, E. H. (1993) The adolescence of AI in medicine: will the field come of age in the „90s?, Atif Intell Med 5 (2), pp. 93–106. Song, D. W. y P. Bruza (2006). Text based knowledge discovery with information flow analysis. Frontiers of Www Research and Development - Apweb 2006, Proceedings. Berlin, Springer-Verlag Berlin: 692-701. Spinak, E. (1998). Indicadores Cienciométricos. Ciência da Informação, 27(2), 141-148. Stefaniak, B. (1987). Use of bibliographic databases for scientometric studies. Scientometrics 12(3-4): 149-161. Sturtevant A. H. (1965) A History of Genetics. Harper and Row, New York. Swanson, D. R. (1987) Two medical literatures that are logically but not bibliographically connected, J. Am. Soc. Inf. SCI. 38, pp. 228–233. Swanson, D. R. (1988) Migraine and magnesium: eleven neglected connections, Perspect Biol Med 31 pp. 526–557. Thomson Reuters, (2009) a. Journal Citation Reports. Thomson Reuters. http://scientific.thomsonreuters.com/products/jcr/ Thomson Reuters, (2009) b. Web of Science (WoS). Thomson Reuters. http://apps.isiknowledge.com/ Thomson Scientific, 2009. Science Citation Index (SCI). Thomson Reuters. http://scientific.thomson.com/products/sci/ 72
UNESCO (2005) Science report 2005. UNESCO. París, Francia. 274 pp. www.unesco.org/science/psd/publications/science_report2005.pdf (Cons. 05/05/2007). Valtierra, E (2009). Bases de datos bibliográficas especializadas en biología. Tesis. Facultad de Ciencias, Biología. Universidad Nacional Autónoma de México. Van Leeuwen, T. N., Moed, H. F., Tijssen, R. J. W., Visser, M. S., & Van Raan, A. F. J. (2001). Language biases in the coverage of the Science Citation Index and its consequences for international comparisons of national research performance. Scientometrics, 51(1), 335-346. Van Orsdel, L. C. y K. Born (2006). Journals in the time of Google. Library Journal 131(7): 39-44. Van Raan, A. F. J. (2000). On growth, ageing, and fractal differentiation of science. Scientometrics 47(2): 347-362. Vessuri, H. (1995). Recent strategies for adding value to scientific journals in Latin America. Scientometrics 34:139-161. White, H. D. y K. W. McCain (1989). Bibliometrics. Annual Review of Information Science and Technology 24: 119-186. Wilson, C. S. (1999). Informetrics. Annual review of information science and technology. M. E. Williams, Information Today. 34: 107–247.
73