Bibliometryczna trylogia
Andrzej Kajetan Wróblewski
Uniwersytet Warszawski. Wydział Fizyki
Andrzej-Kajetan.Wroblewski@fuw.edu.pl
W moim referacie zamierzam omówić trzy zagadnienia, które są albo mało znane, albo w ogóle nieznane nawet osobom, które zajmują się bibliometrią. Przedstawię wyniki własnych analiz danych z baz NSI (National Science Indicators) i NCR (National Citation Report).
Pierwsze zagadnienie to wnioski, jakie można wyciągnąć z bazy NSI, w której przyjęto zasadę whole counting, a więc zaliczania każdej publikacji z taką samą wagą jednostkową wszystkim państwom, z których pochodzi chociaż jeden współautor tej publikacji. Wskutek nieznajomości tej kwestii niestaranne posługiwanie się bazą NSI nawet przez poważne osoby i instytucje prowadzi do nieporozumień. Tak, na przykład, mało kto potrafi rozróżnić procentowy udział danego kraju w światowej bazie publikacji od procentowego udziału publikacji z autorami z tego kraju. Tymczasem uważna analiza danych w bazie NSI pozwala na wyciąganie ciekawych wniosków o współpracy międzynarodowej w badaniach naukowych i jej efektywności, zarówno globalnie, jak i w poszczególnych dziedzinach.
Drugie zagadnienie to sprawa tzw. wskaźnika impact dla poszczególnych państw (nie należy tego mylić ze wskaźnikiem impact factor !). Ten wskaźnik staje się bardzo popularny dla oceny jakości nauki w poszczególnych krajach i jest często cytowany w poczytnych i wpływowych periodykach (np. Nature, Science Watch). Wskaźnik impact jest to średnia liczba cytowań jednej publikacji z danego kraju (czyli stosunek całkowitej liczby cytowań do całkowitej liczby publikacji z danego kraju). Tymczasem prosty rachunek matematyczny pozwala wniknąć w "strukturę" tego wskaźnika. W referacie przedstawię ten rachunek i wykażę, że impact nie charakteryzuje jakości badań naukowych w danym kraju, lecz raczej strukturę jego nauki.
Trzecie zagadnienie, to osławiony impact factor (IF), który tak chętnie jest stosowany w niektórych dziedzinach mimo niepoprawnej definicji i znanych wad. Przeprowadziłem analizę polskich publikacji z fizyki w bazie NCR 1980-1999 i pokażę dowody świadczące o niewielkiej sensowności posługiwania się IF do - apriorycznej oceny pracowników naukowych. Okazuje się, że rozkład liczby cytowań w danym czasopiśmie nie jest gaussowski (jak zapewne sądzą niektórzy) lecz wykładniczy o dużej skośności. Nawet dla periodyków o dużym IF maksimum rozkładu liczby cytowań zamieszczanych tam publikacji występuje przy zerze ! Okazuje się także, że jest tylko minimalna korelacja między wartością IF a np. maksymalną liczbą cytowań zanotowaną dla danego czasopisma, inaczej mówiąc występowanie artykułów o dużej liczbie cytowań bardzo słabo zależy od IF czasopisma.