Tak można analizować duże bazy danych

Autor: Piotr Wróbel • • 03 sierpnia 2018 08:56

Umiejętna analiza dużych baz danych jest nieoceniona przy określaniu np. rokowania u pacjentów kardiologicznych. Potrafimy już tworzyć takie analizy - wynika z doświadczeń Śląskiego Centrum Chorób Serca w Zabrzu, które zostały przedstawione 19 kwietnia podczas I Konferencji "Nowe Technologie w Schorzeniach Sercowo-Naczyniowych", odbywającej się w Katowicach.

Źródła danych to m.in. dane kliniczne generowane podczas leczenia pacjenta (dane dotyczące historii choroby - rozpoznania, epikryzy), dane przekazywane automatycznie przez urządzenia medyczne (badania obrazowe, aparatura monitorująca parametry życiowe pacjenta), także te tworzone przez systemy laboratoryjne.

Ogromne są bazy danych administracyjnych (np. dane rozliczeniowe, dane dotyczące kosztów). Istnieją też bazy zewnętrzne zawierające dane zbierane prze płatnika. Są i rejestry medyczne powstające w celu badań naukowych oraz bazy usystematyzowanej wiedzy (zawierają np. rekomendacje).

Miliony rekordów pacjentów

Śląskie Centrum Chorób Serca (SCCS) w Zabrzu jest przykładem szpitala, w którym analizowane są wszystkie powyższe dane. W 2001 roku powstały pierwsze formularze historii choroby, które pozwalają zbierać informacje w formie ustrukturyzowanej. - Istnieją do dziś, zbierają mnóstwo informacji, które od początku były przygotowywane do tego, żeby służyć analizom naukowym - mówił Daniel Cieśla z Ośrodka Nauki Szkolenia i Nowych Technologii Medycznych Śląskiego Centrum Chorób Serca w Zabrzu.

Jeszcze w 2003 roku bazy do obliczeń były tworzone głównie poprzez przepisywanie dokumentacji papierowej, co ze względu na czasochłonność pozwalało na wprowadzenie danych dla ok. 100 pacjentów z 50 parametrami opisującymi, gromadzono 5 tys. jednostek informacji. Bazy te powstawały w celu odpowiedzi na konkretnie postawione pytania w celach naukowych.

Teraz, w 2018 roku, trudno w SCCS znaleźć osobę, która nie wprowadza danych do systemu szpitalnego. Praktycznie wszędzie są komputery i każda czynność dotycząca pacjenta potwierdzana jest w systemie szpitalnym.

Bazy istniejące w SCCS są niezwykle obszerne. Sam SIM w 2013 r. zawierał ponad 5 mln rekordów dotyczących 120 tys. pacjentów. Kardiologiczna Historia Choroby - która się opiera na wspomnianych wcześniej formularzach historii choroby (2001-2018) - zawiera informację o ok. 100 tys. pacjentów, przy czym każdego pacjenta opisuje ok. 500 parametrów, co daje 50 mln jednostek informacji.

AMMS to ponad 1000 tabel pozwalających na analizy. W tym wykonane elementy leczenia to aktualnie ponad 11 mln rekordów, wyniki badań laboratoryjnych - ponad 7 mln rekordów. Oprócz baz szpitalnych w dziale nauki SCCS prowadzone są rejestry naukowe zawierające informacje o pacjentach ze Śląska, z Polski i szpitala.

Moc danych

Najważniejsze rejestry prowadzone w dziale nauki SCCS to m.in. Ogólnopolski Rejestr Ostrych Zespołów Wieńcowych - zawiera informacje o 502 tys. chorych, Śląska Baza Sercowo-Naczyniowa SILICARD - dotyczy 763 tys. chorych, Narodowa Baza Danych Zawałów Serca - 439 tys. W sumie 7 rejestrów prowadzonych w SCCS zawiera dane o ponad 6 mln hospitalizacji dotyczących ponad 2,5 mln pacjentów.

Rozpoczęta w 2016 roku współpraca z NFZ pozwoliła na utworzenie Śląskiej Bazy Sercowo-Naczyniowej. To kolejny krok w powstawaniu dużych baz danych w SCCS. Baza zawiera dane 763 tys. pacjentów - dotyczy ponad 4,4 mln hospitalizacji, ponad 5,5 mln pobytów na różnych oddziałach, 89 tys. wizyt ambulatoryjnych (w tym w POZ), 138,4 mln wykonanych procedur. To ponad 6 mld jednostek informacji.

Dysponując tak szerokimi danymi, w SCCS badano m.in. wpływ zanieczyszczeń na ryzyko zgonu oraz częstość występowania zdarzeń sercowo-naczyniowych. Było to możliwe dzięki połączeniu informacji na temat stanu powietrza oraz warunków atmosferycznych z zachorowalnością. Udowodniono wyraźną korelację. Podobnie dzięki analizie danych (m.in. skorelowanie dat i zdarzeń) udowodniono związek dużych wydarzeń sportowych z występowaniem niepożądanych zdarzeń sercowo-naczyniowych.

Tak pracuje analizator

Dla analizy tak dużych baz danych konieczne jest specjalne oprogramowanie, odpowiednia moc obliczeniowa. - Najistotniejsze jest jednak utworzenia zespołu "medyczno-informatycznego". Z jednej strony są potrzebni lekarze, którzy będą mieli wiedzę z zakresu informatyki, z drugiej strony - informatycy, którzy przyswoją część wiedzy medycznej, choćby część pojęć medycznych, ułatwiając tym samym dialog w takim zespole. Bez tego większość tych analiz nie będzie możliwa - podkreślił Daniel Cieśla.

W 2013 roku w SCCS pracowano nad projektem "Bezpieczny i inteligentny szpital". Projekt zakładał stworzenie narzędzi, które miały pomóc lekarzowi w pracy z pacjentem. - Częścią tego projektu było stworzenie kalkulatora. Zakładaliśmy zbudowanie hurtowni danych, która by zbierała informacje z wielu miejsc i nałożenie na to systemu typu business intelligence, który pozwoliłby nam analizować te dane - mówił Cieśla.

Wyjaśniał: - Gdy w 2016 roku utworzyliśmy Śląską Bazę Sercowo-Naczyniową, powstała konieczność jeszcze bardziej zaawansowanego podejścia przy analizowaniu wielkich baz danych. W 2017 r. w SCCS opracowaliśmy samodzielnie pierwszy prototyp naszego rozwiązania.

Obecnie w SCCS stosowany jest Health Calculator. - Pozwala w celach analiz wyszukać pacjentów z podobną historią choroby, pracuje na realnych pacjentach, tzn. leczonych w naszej jednostce, a nie wyliczonych matematycznie. Możliwa jest analiza trendów czasowych, prognozowanie zdarzeń niepożądanych i wyników leczenia - wyjaśniał Cieśla.

Podczas prezentacji ekspert przedstawił przykładowe zastosowanie analizatora pracującego w SCCS w oparciu o zintegrowane bazy danych dotyczących zawału serca, pochodzących z rejestrów. Dzięki funkcjonalnościom narzędzia można szybko prześledzić losy chorych przyjmowanych bez zaburzeń hemodynamicznych, przyjętych między np. 2. a 4. godziną od wystąpienia bólu i powyżej tego czasu. Wyraźnie widać, jak zmieniają się rokowania. Powyżej 12 godzin częstość zdarzeń niepożądanych jest największa.

Teraz integracja danych

- Przez kilka lat próbowaliśmy zainteresować partnerów, opisując im słownie, o co nam chodzi i był z tym wielki problem. Gdy w końcu stworzyliśmy nasz prototyp, nagle okazało się, że osoby, które widzą obraz z analizatora, zaczęły nas doskonale rozumieć i uznały, że jest to świetne rozwiązanie - przyznaje Daniel Cieśla.

Dodał: - Poszukując partnera technologicznego dla wdrożenia wspomnianego rozwiązania, zwróciliśmy się do firmy Asseco, której system informatyczny jest w naszym szpitalu, co ułatwia integrację systemów. W ramach współpracy realizujemy rozwiązanie Health Calculator, które doprowadzi do bezpośredniej integracji ze zbiorami danych systemu AMMS, tzn. pozwoli na pobieranie danych bezpośrednio z systemu szpitalnego. Udostępni dedykowane analizy również bezpośrednio wywoływane z systemu szpitalnego z poziomu systemu klinicznego AMMS. Dodatkowo ma uwzględniać dane populacyjne statystyczne (dane uśrednione z dużej populacji pacjentów kardiologicznych) w celu wykorzystania tych informacji w analizach dotyczących rokowań pacjentów.

Podaj imię Wpisz komentarz
Dodając komentarz, oświadczasz, że akceptujesz regulamin forum