Analiza przebiegów wypadków przy pracy metodą drzew klasyfikacyjnych CRT (Classification and Regression Trees)

 

   Analiza danych dotyczących wypadków przy pracy z zastosowaniem metody drzew klasyfikacyjnych umożliwia zidentyfikowanie najczęściej występujących przebiegów wypadków przy pracy, do których dochodzi wśród p racowników maksymalnie podobnych ze względu na jakąś cechę, np. wiek.

  Metoda drzew klasyfikacyjnych należy do eksploracyjnych metod analizy danych. Stanowi specyficzną odmianę analizy skupień, która dzieli obserwacje w zbiorze danych ze względu na liczbową (regresja) lub nominalną (klasyfikacja) wartość wybranej zmiennej. Podział obserwacji odbywa się na podstawie zidentyfikowanego zbioru logicznych warunków podziału (reguły klasyfikacji), typu „jeżeli poprzednik -> to następnik”, prowadzących do zaklasyfikowania obiektów. Wynikiem analizy jest model statystyczny (drzewo klasyfikacyjne), który opisuje podział zmiennych, według zidentyfikowanych reguł, na grupy o różnej wartości zmiennej zależnej.

   Przeprowadzone w CIOP-PIB analizy danych dotyczących wypadków przy pracy, zarejestrowanych przez GUS, wykazały, że do tego typu danych szczególnie dobrze sprawdza się analiza drzew klasyfikacyjnych modułem CRT (Classification and Regression Trees), ze względu na przejrzystość wyników i ich relatywną łatwość interpretacji.

   Przykładem skutecznego wykorzystania metody drzew decyzyjnych CRT, do analizy danych dotyczących wypadków przy pracy, może być analiza porównawcza przebiegów najczęściej występujących wypadków przy pracy wśród pracowników w wieku poniżej 31 lat oraz 50 lat i więcej. Taką analizę przeprowadzono w CIOP-PIB, dla danych zarejestrowanych przez GUS w latach 2005-2014.

   Przeprowadzone analizy wykazały, że model drzewa klasyfikacyjnego, zbudowany na podstawie wszystkich zmiennych opisujących przebieg wypadku przy pracy jest zbyt rozbudowany, co uniemożliwia jego interpretację (tzw. „problem przeuczenia modelu”). Analizy eksploracyjne testujące kolejne ograniczenia nakładane na analizowany zbiór danych wykazały, że najskuteczniejsze jest ograniczenie danych dotyczących przebiegów wypadków przy pracy do:

  • wydarzenia będące odchyleniem od stanu normalnego,
  • czynnika materialnego będącego źródłem urazu,
  • wydarzenia powodującego uraz,
  • rodzaju urazu.

Obliczony według powyższych kryteriów model drzewa klasyfikacyjnego zawiera 37 węzłów i jest wystarczająco dobrze dopasowany do danych – ogólne ryzyko błędnej klasyfikacji w oparciu o model wynosi 37%. Obliczony model skuteczniej klasyfikuje wypadki młodszych poszkodowanych (74% poprawnych), niż starszych (49% poprawnych).

   Analiza wyników opracowanego modelu wykazała, że najczęściej występujące wypadki przy pracy poszkodowanych w wieku do 30 lat i powyżej 49 lat różnią się ze względu na swój przebieg (rys. 1).

   Według obliczonego modelu wśród pracowników w wieku 50+, znacznie częściej niż wśród pracowników -30, do wypadków przy pracy dochodziło w wyniku poślizgnięć, potknięć lub upadków, podczas poruszania się lub przebywania na różnych powierzchniach, którymi najczęściej były proste podłogi znajdujące wewnątrz budynków (elementy budynków i konstrukcje na poziomie gruntu), rzadziej ziemia, śnieg i lód (elementy środowiska naturalnego), różnego rodzaju wyposażenie biura lub szynowe albo pływające pojazdy transportowe. Tego typu wypadki, wśród starszych pracowników, częściej powodowały bardziej poważne urazy, takie jak: złamania kości, liczne urazy, urazy wewnętrzne lub wstrząs. Natomiast do wypadków przy pracy, które powodowały lżejsze urazy, takie jak rany i powierzchowne urazy, wśród pracowników w wieku 50+ najczęściej dochodziło w wyniku poślizgnięć, potknięć lub upadków, które skutkowały uderzeniem w nieruchomy obiekt.


   Obliczony model drzew decyzyjnych wykazał, że wśród pracowników do 30 roku życia częściej, niż wśród pracowników 50+, do wypadków przy pracy dochodziło podczas używania narzędzi, maszyn i urządzeń oraz różnego rodzaju materiałów, przedmiotów, wyrobów i części stosowanych podczas ich obsługi. W tego typu wypadkach przy pracy dominowały osoby młode, szczególnie jeżeli do wypadków dochodziło w wyniku uwięzienia lub zmiażdżenia albo kontaktu z ostrym, szorstkim, lub chropowatym przedmiotem. Jedynym wyjątkiem są tego typu wypadki przy pracy, do których doszło w wyniku poślizgnięcia, potknięcia się lub upadku osoby, wtedy nieco częściej poszkodowani byli pracownicy w wieku 50+ (rys. 1).

 

Uproszczony model klasyfikacji CRT

Rys. 1. Uproszczony model klasyfikacji CRT przebiegów wypadków przy pracy wśród poszkodowanych w wieku 30 lat i mniej i 50 lat i więcej   

opracowane na podstawie danych GUS z lat 2005-2014