Technologie informacyjne dla chemików
SPONSORZY FQS Poland Sp. z o.o. (GRUPA FUJITSU) oprogramowanie dla ſirm http://www.fqs.pl/pl LABART wyposażenie laboratoriów http://www.labart.pl Merck Sp. z o.o. http://www.merck.pl
Perkin Elmer http://www.perkinelmer.com
PPG Industries http://www.ppg.com Wydawnictwo Helion http://helion.pl
Wydawnictwo Naukowe PWN http://www.pwn.pl
Maltańska Służba Medyczna Oddział Kraków http://www.malta-sluzba.med.pl/
Fabryka Pomocy Naukowych Spółka z o.o. http://sklep.fpnnysa.com.pl
PATRONAT MEDIALNY Laboratoryjny Serwis Informacyjny http://laboratoria.net/pl
TECHNOLOGIE INFORMACYJNE DLA CHEMIKÓW
Wydział Chemii UJ Kraków 2008
Prace zawarte w niniejszej książce podlegały recenzji merytorycznej, jednakże zostały wydrukowane na odpowiedzialność autorów.
Redakcja, skład, opracowanie graficzne Iwona Maciejowska Agnieszka Węgrzyn Stefan Witkowski Weronika Rożek Monika Ruszak Publikacja Wydział Chemii Uniwersytet Jagielloński ul. Ingardena 3 30-060 Kraków ISBN 978-83-921505-4-1
Spis treści
OD REDAKCJI
7
ICT W PRACY NAUKOWEJ
Wacław Makowski CHEMIA W INTERNECIE – O WYKORZYSTANIU ZASOBÓW INTERNETU W PRACY NAUKOWEJ CHEMIKA
11
Grzegorz Fic, Grażyna Nowak STRATEGIE PRZESZUKIWANIA INTERNETOWYCH BAZ STRUKTUR CHEMICZNYCH
15
Maciej Szaleniec MODELOWANIE ZŁOŻONOŚCI W CHEMII METODAMI STATYSTYCZNYMI Z WYKORZYSTANIEM PAKIETU STATISTICA
19
Grzegorz Mazur, Marcin Makowski, Mateusz Brela CACHE -AWARE LOAD -BALANCING ALGORITHM FOR COMPUTATIONAL CHEMISTRY APPLICATIONS
27
Krzysztof Kruczała, Łukasz Łańcucki, Tomasz Spałek, Zbigniew Sojka REKONSTRUKCJA PROFILI STĘŻENIA WIDM 1 D EPRI METODĄ VC-GA: WPŁYW SZUMÓW NA POPRAWNOŚĆ ODWZOROWANIA
32
Krzysztof Czarniecki BADANIE PRZEMIAN FAZOWYCH Z WYKORZYSTANIEM CYFROWEJ REJESTRACJI OBRAZU MIKROSKOPOWEGO PRÓBKI
37
Dariusz Szczepanik, Janusz Mrozek COMMUNICATION THEORY OF CHEMICAL BOND
42
Dorota Majda, Filipe A. Almeida Paz, Robert G. Bell, Jacek Klinowski DISCOVERING NEW ZEOLITIC FRAMEWORKS
44
Ewa Luchter-Wasylewska, Magdalena Górny OBLICZENIA KOMPUTEROWE STAŁYCH KATALITYCZNYCH DLA REAKCJI KATALIZOWANYCH ENZYMATYCZNIE: DLA STUDENTÓW I NAUKOWCÓW
Grzegorz Stopa KOMPUTEROWE WSPOMAGANIE EKSPERYMENTÓW CHEMICZNYCH
Grzegorz Stopa SUBSTANCJE CHEMICZNE I BHP
48
47
46
ICT W NAUCZANIU CHEMII
Barbara Dębska WYKORZYSTANIE RÓŻNYCH FORM PREZENTACJI MATERIAŁÓW EDUKACYJNYCH W KURSACH UDOSTĘPNIONYCH NA PORTALU WWW .E -CHEMIA .PL
51
Radosław Bomba WORTAL NAUKOWY WIEDZA I EDUKACJA JAKO PRZYKŁAD WYKORZYSTANIA INTERNETU DRUGIEJ GENERACJI DO CELÓW NAUKOWO -EDUKACYJNYCH
57
Małgorzata Miranowicz ZDALNIE O NAUCZANIU ZDALNYM CZYLI MODDLE KROK PO KROKU
58
Agnieszka Jańczyk, Iwona Maciejowska A NEW CHEMGAPEDIA UNIT FOCUSED ON SOLID PHASE CHEMISTRY – SOLID PROJECT
62
Jan Rajmund Paśko CZY ISTNIEJE POTRZEBA PROGRAMÓW SPRAWDZAJĄCYCH WIEDZĘ ?
65
Agnieszka Węgrzyn, Stefan Witkowski PROJEKT AUTOR – OGRANICZANIE PLAGIATÓW W PISEMNYCH PRACACH STUDENTÓW
68
Jan Rajmund Paśko, Danuta Jyż-Kuroś, Aleš Chupáč CZY NAUCZYCIELOWI CHEMII POTRZEBNE SĄ UMIEJĘTNOŚCI PROGRAMISTY?
72
Krzysztof Czarniecki PRAKTYCZNA METODA WYKONANIA KLASYCZNEJ ANALIZY JAKOŚCIOWEJ Z CYFROWĄ WIZUALIZACJĄ EKSPERYMENTÓW
75
Barbara Guzowska-Świder, Michał Urbanek LEKCJA MULTIMEDIALNA WSPOMAGAJĄCA NAUCZANIE INTERPRETACJI WIDM W PODCZERWIENI
80
Małgorzata Nodzyńska ZASTOSOWANIE METOD STATYSTYCZNYCH NA ZAJĘCIACH Z DYDAKTYKI CHEMII
Paweł Cieśla, Jan Rajmund Paśko KOMUNIKACJA I WYMIANA INFORMACJI POMIĘDZY STUDENTAMI A NAUCZYCIELAMI AKADEMICKIMI
91
Jan Rajmund Paśko, Wioleta Kopek PROGRAM WIZUALIZACYJNY MACROMEDIA FLASH JAKO ELEMENT KSZTAŁCENIA PRZYSZŁYCH NAUCZYCIELI
95
E. Rybska, J. Błoszyk, R. Bajaczyk ZASTOSOWANIE TECHNOLOGII INFORMACYJNYCH W NAUCZANIU PRZEDMIOTU BIOGEOGRAFIA NA WYDZIALE BIOLOGII UAM W POZNANIU
Grzegorz Stopa CHEMIA W INTERNECIE – WIARYGODNOŚĆ ŻRÓDEŁ
100
99
85
Grzegorz Stopa KOMPUTER – POMOC CZY ZAGROŻENIE DLA DYDAKTYKI CHEMII
101
Kinga Mlekodaj, Piotr Legutko, Jan Kaczmarczyk, Stefan Witkowski
102
ROZWÓJ SYSTEMU POMOCY W PORTALU ARIA
Monika Pasionek, Jan Kaczmarczyk, Stefan Witkowski BEZPIECZEŃSTWO W LABORATORIUM – ZASTOSOWANIE METOD BLENDED -LEARNINGOWYCH W NAUCZANIU PIERWSZEJ POMOCY
103
Aleksandra Kalisz, Stefan Witkowski, Anna Migdał-Mikuli BADANIE SKUTECZNOŚCI NAUCZANIA METODĄ BLENDED -LEARNING NA PRZYKŁADZIE KURSU PODSTAW CHEMII
104
Monika Ruszak, Agnieszka Węgrzyn, Stefan Witkowski STANDARYZACJA NARZĘDZI E-NAUCZANIA
105
W GLOBALNYM TYGLU NOWEGO NAUCZANIA
Marek Frankowicz, Artur Michalak INFORMATYCZNE WSPOMAGANIE STUDIÓW CHEMICZNYCH
- DOŚWIADCZENIA EUROPEJSKIE 113 Marek Frankowicz, Janusz Mrozek UWAGI O E -LEARNINGU W POLSCE
117
Colin Osborne USING ICT IN CHEMISTRY TEACHING
121
Lucjan Chmielarz, Marcin Molenda, Marek Frankowicz, CHEMEPASS – NOWOCZESNY SYSTEM EZAMINU ELEKTRONICZNEGO
Agnieszka Węgrzyn, Paweł Kozyra ZASTOSOWANIE NARZĘDZI ICT DO EWALUACJI I PODNOSZENIA JAKOŚCI KSZTAŁCENIA
126
Weronika Rożek, Iwona Maciejowska, Andrzej Kotarba, Stefan Witkowski ITINERER DLA PISZĄCYCH PRACE DYPLOMOWE R O K WC ZEŚ N I E J
Indeks autorów
140
137
128
122
Od Redakcji
Współczesny naukowiec i wykładowca chemii jest aktywnym odbiorcą zaawansowanych narzędzi, takich jak technologie wspomagające proces oceniania, laboratoria wspomagane komputerowo, materiały multimedialne, portale edukacyjne, technologie pracy grupowej i zarządzania, w tym zarządzania jednostkami naukowymi, bibliotekami cyfrowymi oraz wydawnictwami internetowymi. Burzliwie rozwijają się także dziedziny takie jak modelowanie procesów, data-mining, sieci neuronowe i semantyczne. W Polsce aktywnie rozwijają się różnorodne portale związane z chemią: zawierające materiały edukacyjne dla konkretnych odbiorców (np: www.e-chemia.pl), poświęcone konkretnym gałęziom chemii i technologii chemicznej (np. ChemgaPedia), a także zawierające ciekawostki i żarty chemiczne, oraz portale społecznościowe. Produktem międzynarodowych projektów edukacyjnych kształcenia ustawicznego (lifelong learning programme), m.in. CITIES, SOLID , CHEMEPASS, stają się materiały multimedialne i interaktywne, technologie wspomagające proces oceniania. Zasoby Internetu wykorzystywane są zarówno w pracy naukowej chemików, jak i w działalności dydaktycznej. Ilość informacji w sieci jest tak wielka, że trzeba opanować szczególne strategie przeszukiwania internetowych baz np. baz struktur chemicznych. Dostęp do ogromnej ilości gotowych tekstów kusi studentów możliwością popełniania bezkarnych plagiatów. Potrzeba minimalizacji tego procederu wywołała zainteresowanie metodami zapobiegania i przeciwdziałania, również bazujących na zasobach Internetu i technologiach informacyjnych. Na wykładach i podczas zajęć laboratoryjnych, a zwłaszcza w trakcie przygotowania studentów do ćwiczeń praktycznych, coraz częściej stosowana jest cyfrowa wizualizacja eksperymentów – podobnie dzieje się na poziomie szkoły średniej. Przykładem może być cyfrowa rejestracja obrazu mikroskopowego próbki do badania przemian fazowych. Technologie informacyjne stały się standardowym elementem kształcenia nauczycieli szkół średnich, i to zarówno w zakresie umiejętności korzystania z już istniejących, jak i tworzenia własnych aplikacji. Narzędzia analizy statystycznej w pakietach profesjonalnego oprogramowania stały się podstawą modelowania układów chemicznych oraz są wykorzystywane do oceny badań z zakresu dydaktyki chemii. Skomplikowane obliczenia molekularne są obecnie coraz łatwiejsze do przeprowadzenia ze względu na przyjaźniejsze dla użytkownika interfejsy i nakładki do obsługi. Rozwija się oprogramowanie do zarządzania laboratoriami chemicznymi. Platformy do zdalnego nauczania, komunikacji ze studentami i przeprowadzania zdalnych egzaminów stają się coraz bardziej popularne.
Organizując Sympozjum „Technologie informacyjne dla chemików” pragnęliśmy zaproponować platformę wymiany opinii pomiędzy użytkownikami zaawansowanych technologii informacyjnych. Technologie, które są tematem Sympozjum (same nie należąc do sfery wiedzy chemicznej) coraz silniej wpływają na przebieg pracy chemika naukowca i dydaktyka. Zmiany dokonują się w trzech głównych obszarach: edukacji, wyposażeniu warsztatu naukowego oraz organizacji wspólnych przedsięwzięć naukowych. W wielu przypadkach już obecnie widać, że zastosowanie odpowiednich aplikacji spowodowało znaczące zwiększenie produktywności bez wyraźnego wzrostu ponoszonych nakładów. Można przypuszczać, że w ciągu kilku ‒ kilkunastu lat dojdzie do głębokiej reorganizacji w obszarze nauki oraz edukacji, która w części będzie skutkiem powszechnej dostępności narzędzi jeszcze niedawno rzadko stosowanych.
Iwona Maciejowska, Agnieszka Węgrzyn, Stefan Witkowski
ICT w pracy naukowej
Technologie Informacyjne dla Chemików
11
CHEMIA W INTERNECIE – O WYKORZYSTANIU ZASOBÓW INTERNETU W PRACY NAUKOWEJ CHEMIKA
Wacław Makowski Uniwersytet Jagielloński, Wydział Chemii, ul. Ingardena 3, 30–060 Kraków
Wprowadzenie Internet jest obecnie podstawowym narzędziem w pracy naukowej, umożliwiającym dostęp do różnych informacji. Specyſiką chemii jako dyscypliny naukowej jest wielka liczba związków chemicznych stanowiących przedmiot jej badań i związana z nią ogromna różnorodność informacji wykorzystywanych w badaniach naukowych. Celem niniejszej pracy jest przegląd i próba klasyſikacji różnego typu zasobów internetowych przydatnych w pracy naukowej chemików. Dla naukowca najpoważniejszym źródłem informacji są publikacje naukowe. Obecnie wszystkie poważne czasopisma udostępniają w formie elektronicznej artykuły publikowane na ich łamach. Natomiast podręczniki i monograſie naukowe nie są szeroko udostępniane w Internecie ze względu na ograniczenia wynikające z praw autorskich. Dodatkowe ułatwienie w wyszukiwaniu publikacji naukowych stanowią bibliograſiczne bazy danych. Oprócz artykułów naukowych w czasopismach, w Internecie można znaleźć także inne publikacje, które mogą być pomocne w pracy naukowej, m.in. materiały konferencyjne, wykłady, raporty z realizacji projektów badawczych, patenty, biuletyny techniczne i noty aplikacyjne. Szczególnie godnym polecenia źródłem wiedzy są prace doktorskie, publikowane w formie elektronicznej przez wiele amerykańskich i europejskich uniwersytetów. Internet jest także dobrym źródłem informacji o właściwościach różnych związków chemicznych i materiałów. Obok prostych danych liczbowych (tj. gęstość, temperatura topnienia i wrzenia, ciśnienie pary nasyconej, współczynnik załamania światła, stała dielektryczna) w naukach chemicznych są wykorzystywane bardziej złożone formy danych (m.in. widma i dane spektroskopowe, dyfraktogramy i struktury krystaliczne, trójwymiarowe modele makrocząsteczek). Istnieje wiele komercyjnych i ogólnodostępnych internetowych baz dotyczących różnych substancji, udostępniających tego typu dane. Poza wspomnianymi powyżej publikacjami i bazami danych w Internecie istnieje wiele innych zasobów, które mogą być źródłem informacji naukowych. Należą do nich m.in.: internetowe serwisy towarzystw naukowych, strony jednostek naukowych, witryny ſirm oferujących odczynniki, aparaturę naukową lub oprogramowanie oraz autorskie strony naukowców. Niezależnie od klasyſikacji wynikającej z rodzaju źródła i jego zawartości, naukowe zasoby internetowe można podzielić na ogólnodostępne (bezpłatne) oraz licencyjne (odpłatne). W Polsce dostęp do zasobów licencyjnych jest realizowany w ramach tzw. Wirtualnej Biblioteki Nauki. Na jej stronach internetowych (http://vls.icm.edu.pl) można znaleźć szczegółowe informacje dotyczące licencji wykupionych przez poszczególne jednostki naukowe. Podobne informacje są także zwykle udostępniane przez centralne biblioteki poszczególnych jednostek.
12
W. Makowski
Wybór zasobów internetowych przydatnych w pracy naukowej chemików Przedstawiony poniżej wybór „chemicznych” stron internetowych jest z konieczności subiektywny, wynika bowiem głównie z zainteresowań naukowych autora. Niemniej jednak stanowi on dosyć reprezentatywny przegląd różnorodnych typów zasobów internetowych, które mogą być przydatne dla chemików zajmujących się pracą naukową. Internetowe wersje czasopism naukowych (licencyjne) • Wydawnictwa American Chemical Society (http://pubs.acs.org/about.html). • Wydawnictwa Elsevier – system ScienceDirect dostępny bezpośrednio (http://www.sciencedirect.com), oraz za pośrednictwem Wirtualnej Biblioteki Naukowej (http://vls.icm.edu.pl/ss.html). • Wydawnictwa Springer (http://www.springerlink.com). • Wydawnictwa Royal Society of Chemistry (http://www.rsc.org/Publishing/journals). • Wydawnictwa Wiley InterScience (http://www3.interscience.wiley.com). Bibliograſiczne bazy danych (licencyjne) • Chemical Abstracts (http://www.cas.org, w Polsce http://bazy.bg.pwr.wroc.pl). • Science Citation Index (http://isiknowledge.com lub http://zatoka.icm.edu.pl/sci). • Scopus (http://www.scopus.com), zintegrowana z systemem ScienceDirect. Wyszukiwarki informacji naukowych i patentów • Scirus (http://www.scirus.com). • Google Patent Search (http://www.google.com/patents). • PatentStorm (http://www.patentstorm.us). • Polska wersja bazy Europejskiego Urzędu Patentowego (http://pl.espacenet.com). Katalogi chemicznych stron WWW • Chemdex (http://www.chemdex.org). Katalog stron www związanych z chemią, ſirmowany przez University of Sheſſield. Ponad 7000 odsyłaczy. • Links for Chemists (http://www.liv.ac.uk/Chemistry/Links/links.html). Fragment większego katalogu stron internetowych (WWW Virtual Library), dotyczący chemii, redagowany przez chemików z University of Liverpool. Zawiera ponad 8000 odnośników. Serwisy chemiczne • ChemCenter (http://www.chemistry.org). Serwis internetowy Amerykańskiego Towarzystwa Chemicznego (ACS). • ChemSoc (http://www.rsc.org/chemsoc). Serwis naukowy brytyjskiego Królewskiego Towarzystwa Chemicznego (RSC).
Technologie Informacyjne dla Chemików
13
Komercyjne bazy danych ſizykochemicznych (licencyjne) • CrossFire (http://info.crossſiredatabases.com) – stworzony przez Elsevier MDL system udostępniający m.in. bazy danych Beilstein (zawierającą dane o własnościach ſizykochemicznych ponad 9 mln związków organicznych oraz opisy ponad 11 mln reakcji i bioorganicznych) oraz Gmelin (zawierającą informacje o ponad 2 mln związków i materiałów nieorganicznych). Do korzystania z bazy CrossFire przeznaczone jest specjalne oprogramowanie (CrossFire Commander). • Knovel (http://www.knovel.com) – baza wiedzy zawierająca ponad 1250 książek, materiałów konferencyjnych i wydawnictw technicznych, z zakresu chemii, nauk przyrodniczych, inżynierii i nauk materiałowych, pochodzących od ponad 40 wydawców. •
- Inorganic Crystal Structure Database (http://icsdweb.ſiz-karlsruhe.de) – baza struktur krystalicznych związków nieorganicznych (100 tys. struktur).
IC SD
Ogólnodostępne bazy danych ſizykochemicznych •
NIST Chemistry WebBook (http://webbook.nist.gov/chemistry). Baza danych National Institute of Standards and Technology (USA ), zawierająca dane ſizykochemiczne dla kilku tysięcy związków chemicznych, także widma IR , UV- VIS i MS.
• WebElements (http://www.webelements.com). Najczęściej wykorzystywany układ okresowy w Internecie. Zawiera wiele informacji o właściwościach ſizycznych i chemicznych pierwiastków oraz prostych związków nieorganicznych. •
– Integrated Spectral Data Base System for Organic Compounds (http://riodb01.ibase.aist.go.jp/sdbs/cgi-bin/cre_index.cgi?lang=eng). Zintegrowana baza widm (IR , UV-VIS, NMR ) związków organicznych, udostępniana przez japoński Narodowy Instytut Badań Naukowych
SDBS
• ChemIDplus (http://chem.sis.nlm.nih.gov/chemidplus). Firmowana przez National Library of Medicine (USA ) baza danych o ponad 360 tys. związków organicznych i nieorganicznych – zawiera m.in. numery CAS oraz wzory strukturalne (2D i 3D). • Database of Zeolite Structures (http://www.iza-structure.org/databases). Bazy danych o strukturach zeolitów, prowadzona przez International Zeolite Association (IZA ). Zawiera m.in. parametry strukturalne, rysunki oraz trójwymiarowe modele. • MinCryst - Crystallographic and Crystallochemical Database for Mineral and their Structural Analogues (http://database.iem.ac.ru/mincryst). Baza zawierająca dane krystalograſiczne ok. 7 tys. minerałów i ich analogów. Dostępne trójwymiarowe rysunki ich struktur. • Protein Data Bank (http://www.rcsb.org/pdb/home). Baza udostępnia dane o strukturach białek, m.in. trójwymiarowe modele cząsteczek. • ChemExper (http://ww.chemexper.com). Baza danych o odczynnikach chemicznych. Zawiera połączenia z internetowymi katalogami większości producentów odczynników. • MatWeb (http://www.matweb.com). Baza danych ſizykochemicznych materiałów (metali, tworzyw sztucznych, kompozytów i ceramiki)
14
W. Makowski
Oprogramowanie chemiczne i obliczenia on-line • ChemSketch (http://www.acdlabs.com/download/chemsk.html) – program przeznaczony do rysowania wzorów strukturalnych i tworzenia trójwymiarowych modeli cząsteczek oraz do rysowania schematów aparatury. Wyposażony w generator nazw systematycznych prostych związków organicznych. •
ISIS Draw (http://www2.mdli.com/downloads/) – popularny program służący do rysowania wzorów strukturalnych cząsteczek oraz mechanizmów reakcji. reakcji. Zawiera bibliotekę wzorów związków organicznych.
• Jmol (http://jmol.sourceforge.net) – interaktywna przeglądarka trójwymiarowych struktur chemicznych (czasteczk i makrocząsteczk, kryształów, materiałów). Oprogramowanie typu open-source, może działać jako samodzielny program na PC albo jako aplet na stronie internetowej, zintegrowany z przeglądarkami stron WWW. • F*A* C*T - Facility for the Analysis of Chemical Thermodynamics. • (http://www.crct.polymtl.ca/fact, zakładka FACT -Web) – oprogramowanie służące do obliczeń termodynamicznych on-line. Umożliwia np. znalezienie składu równowagowego mieszanin gazów oraz roztworów wodnych.
Wyszukiwanie publikacji i danych Obecnie w Polsce większość uczelni i instytutów naukowych ma wykupiony dostęp do internetowych wydań najważniejszych czasopism naukowych, dlatego korzystanie z nich nie sprawia szczególnych trudności. Wyszukiwanie artykułów w czasopismach ułatwia bibliograſiczna baza danych Scopus, zintegrowana z serwisami internetowymi wydawnictw naukowych i dzięki temu umożliwiająca bezpośredni dostęp do znalezionego tekstu. Można też korzystać z baz Science Citation Index i Chemical Abstracts. Ze względu na ograniczony dostęp do licencyjnych baz wiedzy, wyszukiwanie szczegółowych danych dotyczących związków chemicznych i materiałów może sprawiać większe trudności. Do ich wyszukiwania można zastosować wyspecjalizowane wyszukiwarki naukowe (np. Scirus), ale dobre wyniki przynosi też użycie Google’a, pod warunkiem zastosowania odpowiednich kryteriów wyszukiwania, np. uwzględniających oczekiwany rodzaj i format poszukiwanego źródła. W przypadku poszukiwania informacji dotyczących określonej substancji warto posługiwać się numerem CAS (Chemical Abstract Service registry number), stanowiącym jej jednoznaczny identyſikator. Należy też zwrócić uwagę na możliwość przeglądania i przeszukiwania książek, w tym monograſii naukowych, w serwisie Books Google oraz w internetowej księgarni Amazon (opcja Search Inside).
Podsumowanie Po kilkunastu latach rozwoju Internetu znalazły w nim swoje miejsce tradycyjne czasopisma naukowe, które długo jeszcze pozostaną najważniejszym sposobem rozpowszechniania wyników badań naukowych. Warto jednak pamiętać, że oprócz nich istnieją i wciąż powstają nowe różnorodne zasoby internetowe, które mogą być użyteczne w pracy naukowej chemików.
Technologie Informacyjne dla Chemików
15
STRATEGIE PRZESZUKIWANIA INTERNETOWYCH BAZ STRUKTUR CHEMICZNYCH
Grzegorz Fic1*, Grażyna Nowak2 1Zakład Informatyki Chemicznej, 2Katedra Chemii Fizycznej, Politechnika Rzeszowska, al. Powstańców Warszawy 6, 35–959 Rzeszów, *
[email protected] W ciągu niespełna 20 lat Internet stał się największym na świecie zbiorem informacji, w tym także informacji z zakresu chemii i dziedzin pokrewnych. Jednakże, nawet najcenniejsza informacja staje się dopiero wówczas użyteczną, gdy potraſimy do niej dotrzeć i ją odzyskać. W [1] przedyskutowano wybrane metody i narzędzia odzyskiwania zasobów chemicznych dostępnych w Internecie, w [2] internetowe wyszukiwarki (ogólne, naukowe i specjalistyczne−chemiczne) informacji chemicznej, katalogi (ogólne i tematyczne) zasobów WWW z zakresu chemii i dziedzin pokrewnych oraz internetowe zasoby z zakresu chemii analitycznej, w [3] internetowe zasoby z zakresu chemii i technologii organicznej, w [4] zasoby związane z chromatograſią, zaś w [5] internetowe zasoby z zakresu chemii nieorganicznej. W niniejszej pracy przedyskutowano wybrane zagadnienia związane z pozyskiwaniem informacji z internetowych baz struktur chemicznych.
Strategie wyszukiwania informacji o strukturach chemicznych
• • •
• • • • • •
Współcześnie w internetowych serwisach chemicznych stosowane są następujące strategie przeszukiwania zbiorów (baz) struktur i związków chemicznych: wyszukiwanie tekstowe (elementami kwerendy wyszukiwawczej mogą być: nazwa, fragment nazwy, autor, producent, dystrybutor i inne); wyszukiwanie struktur o określonym wzorze sumarycznym (kwerenda: pełny lub częściowy wzór sumaryczny); wyszukiwanie tekstowo−liczbowo−logiczne (np. nazwa, zdeſiniowane przedziały wartości różnych parametrów ſizycznych, chemicznych, biologicznych oraz wartości logiczne zaistnienia określonych cech, rys. 1); wyszukiwanie wszystkich struktur tożsamych ze zdeſiniowaną w kwerendzie wyszukiwawczej (Exact); wyszukiwanie wszystkich struktur zawierających podstrukturę zdeſiniowaną w kwerendzie (Substructure); wyszukiwanie wszystkich struktur będących podstrukturami struktury zdeſiniowanej w kwerendzie (Superstructure); wyszukiwanie struktur podobnych – wyszukiwane są wszystkie struktury spełniające zdeſiniowane przez użytkownika warunki podobieństwa strukturalnego (Similarity), wyszukiwanie prekursorów, tj. struktur, z których można otrzymać zdeſiniowaną strukturę (Precursors, stosowana m.in. w bazie BioPath [7]), Flex – jeden z najnowszych typów strategii, stosowany m.in. w wyszukiwarce bazy NLM (National Library of Medicine) ChemIDplus [8]. Wyszukiwane są struktury posiadające identyczne szkielety jak zdeſiniowana struktura, przy czym podczasbadania tożsamości rozpatrywane są stereochemiczne i tautomeryczne właściwości
16
G. Fic, G. G Nowak
poszzczególnych wiązzań. Oprócz identtyſikacji struktur tożsamych strateegia umożliwia wyszzukanie ich m.in. soli, wodzianów w, mieszanin orazz polimerów;
Rys. 1. Niektóre z elemeentów tekstowoliczbow wo-logicznej kweren ndy wyszukiwawczej w baziee PubChem Compo ound, wchodzącej w skład d systemu wyszukkiwawczego Entrez [6]
• Flexxplus – rozszerzen nie strategii Flex, które dopuszcza zmiany w stereochemii i tau utomerii wiązań wchodzących w w skład szkieletu. W porównaniu do strategii Flex dod datkowo wyszukan ne zostaną m.in. związki, w którycch atom metalu jest związany ze zd deſiniowanym szzkieletem; • wyszzukiwanie hybryd dowe – kwerendaa złożona z wielu u warunków (strukturalnych, teksstowych, liczbowyych i logicznych) wymaganych lub b/oraz zabronion nych w wyszukanych w zwiąązkach/strukturacch (stosowane są operatory logiczn ne orazz arytmetyczne).
Rys. 2. Hybrydowee wyszukiwanie w serwisie ChemExper.com. W pierwszym polu deeſiniuje się operator logiczny (AND , OR R , NOT , ELSOR ), w drrugim atrybut (jeden z pokazanych na ryysunku), w trzecim op perator arytmetycznyy (=, >, =,