Analiza skupień metodą grupowania dwustopniowego

 

  Analiza skupień jest narzędziem statystycznej analizy danych, które służy do identyfikacji naturalnie występujących w zbiorze danych grup obserwacji, które są podobne do siebie pod względem określonych cech. Metoda ta zastosowana wobec danych dotyczących wypadków przy pracy pozwala na identyfikację grup wypadków przy pracy o podobnych okolicznościach powstania wypadku. Zidentyfikowane w wyniku analizy skupień grupy wypadków przy pracy są scharakteryzowane za pomocą kilku zmiennych jednocześnie, co pozwala na bardziej precyzyjne wyznaczenie rodzajów prac, w których najczęściej dochodzi do wypadków, w porównaniu do, powszechnie stosowanej, klasyfikacji stworzonej w oparciu o tylko jedną zmienną (np. przynależność do danego rodzaju gospodarki).

  Grupowanie dwustopniowe (Two Step Cluster) jest jedną z metod analizy skupień. Metoda ta wyróżnia się wśród tradycyjnych metod grupowania kilkoma cechami, które czynią ją odpowiednią do analizowania danych zarejestrowanych za pomocą formularza statystycznej karty wypadku:

  • automatycznie określa optymalną liczbę skupień, dzięki czemu jest odpowiednia do eksploracyjnego analizowania zbiorów danych, wobec których nie istnieją ugruntowane teorie wyjaśniające zachodzące pomiędzy zmiennymi zależności;
  • zastosowany w tej metodzie algorytm, przez utworzenie drzewa cech skupień podsumowującego rekordy, umożliwia analizę dużych baz danych;
  • obsługuje zmienne ilościowe, a także zmienne wielokrotnienominalne, z których składa się znaczna część danych zarejestrowanych za pomocą formularza statystycznej karty wypadku.

  Analizę skupień przeprowadzono wobec danych dotyczących wypadków przy pracy, zarejestrowanych przez GUS w latach 2005-2014 (w sumie 929 826 wypadków przy pracy, z których do analizy zostało włączonych 750 622). Analiza miała charakter eksploracyjny, tak aby jak najlepiej odtworzyć naturalną strukturę zbioru danych. Oznacza to, że nie przyjęto żadnych teorii i hipotez wskazujących na podstawie których zmiennych najlepiej pogrupować wypadki przy pracy. Zamiast tego, testowano kolejne segmentacje danych utworzone na podstawie różnych kombinacji zmiennych wejściowych, które następnie oceniano pod względem dopasowania do danych, na podstawie miary współczynnika Silhouette, oraz ich wartości interpretacyjnej (zróżnicowania, wielkości i liczby zidentyfikowanych grup oraz użyteczności interpretacyjnej predyktorów).

  Ostatecznie wybrano segmentacje utworzoną na podstawie pięciu zmiennych:

  • czynność wykonywana przez poszkodowanego w chwili wypadku (podgrupa),
  • miejsce powstania wypadku,
  • liczba pracujących,
  • wiek poszkodowanego,
  • płeć poszkodowanego.

  W wyniku analizy, uwzględniającej powyższe kryteria, zidentyfikowano trzy grupy wypadków przy pracy (Tablica 1), które różnią się od siebie wyraźnie ze względu na wiek i płeć poszkodowanego, średnią liczbę pracujących w przedsiębiorstwie oraz najczęstsze miejsce powstawania wypadków przy pracy oraz nieco mniej wyraźnie, ze względu na czynność wykonywaną przez poszkodowanego w chwili wypadku (rys. 2). Grupy te w dużym uproszczeniu można określić jako:

Grupa 1: niemal wyłącznie kobiety, które zostały poszkodowane w wypadkach podczas wykonywania prac biurowych i usługowych.  W tej grupie najczęściej do wypadków przy pracy dochodziło w biurach, placówkach naukowych, szkołach i zakładach usługowych oraz placówkach ochrony zdrowia (rys. 1). W porównaniu do pozostałych grup, wypadki z tej grupy miały miejsce w przedsiębiorstwach o największej średniej liczbie pracujących oraz wśród najstarszych poszkodowanych. W grupie tej zidentyfikowano niemal wyłącznie lekkie wypadki przy pracy (tablica 2);

Grupa 2: mężczyźni, którzy ulegają wypadkom przy pracy podczas kierowania, jazdy i obsługi pojazdów transportowych, samochodów osobowych oraz maszyn i urządzeń z własnym napędem. Najczęściej do wypadków przy pracy w tej grupie dochodzi w miejscach i środkach komunikacji publicznej (rys. 1), ale również na terenie budowy, w kamieniołomach lub kopalniach odkrywkowych, jak i w miejscach uprawy i hodowli oraz w lasach. Zatem w grupie tej znajdują się  zarówno poszkodowani w wypadkach przy pracy kierowcy pojazdów transportowych, jak rolnicy i leśnicy oraz osoby pracujące na budowie, którzy obsługują ruchome maszyny i urządzenia z własnym napędem. W grupie tej zidentyfikowano największą liczbę śmiertelnych wypadków przy pracy oraz wysoką liczbę wypadków ciężkich (tablica 2);

Grupa 3: mężczyźni, którzy ulegają wypadkom przy pracy podczas wykonywania czynności charakterystycznych dla przetwórstwa przemysłowego, niemal wyłącznie w miejscach produkcji przemysłowej (rys. 1), przede wszystkim podczas takich czynności jak: obsługa maszyn (podawania lub odbierania materiałów, uruchamianie/zatrzymywanie maszyn) oraz prace narzędziami (rys. 2). W porównaniu do pozostałych grup, w tej grupie zidentyfikowano wypadki, które miały miejsce w przedsiębiorstwach o najmniejsza średniej liczbie pracujących w przedsiębiorstwie oraz wśród najmłodszych poszkodowanych. W grupie tej zidentyfikowano największą liczbę wypadków ogółem oraz ciężkich wypadków przy pracy (tablica 2).

 

Tablica 1. Podsumowanie grup wyłonionych w segmentacji metodą grupowania dwustopniowego (dla danych dotyczących wypadków przy pracy z lat 2005-2014)

opracowane na podstawie danych GUS

 

 

Miejsce powstania wypadku przy pracy w zidentyfikowanych grupach segmentacji

Rys. 1. Miejsce powstania wypadku przy pracy w zidentyfikowanych grupach segmentacji

opracowane na podstawie danych GUS z lat 2005-2014

 

    Zidentyfikowane grupy w mniej jednoznaczny sposób różnią się między sobą ze względu na czynność wykonywaną przez poszkodowanego w chwili wypadku. W każdej zidentyfikowanej grupie segmentacji wypadki przy pracy najczęściej miały miejsce podczas „chodzenia, biegania, wchodzenia na, schodzenia z itp.” (rys. 2). Najczęściej jednak do tego typu zdarzeń dochodzi w najmniej licznej z wyróżnionych grup (grupa 1: kobiety - praca biurowa i usługowa), gdzie wypadki te stanowią prawie 34% wszystkich zdarzeń (w grupie 2=27%, w grupie 3=14%). W grupie tej często również dochodzi do wypadków podczas innych czynności związanych z przemieszczaniem się: „wstawania, siadania”, „wchodzenia do/wychodzenia z” i „innych, niewymienionych czynności w grupie poruszanie się”.

   Przeciwieństwem grupy 1 jest grupa 3 (największa z wyróżnionych, gromadząca wypadki charakterystyczne dla przetwórstwie przemysłowym). W grupie tej poszkodowani najrzadziej ze wszystkich zidentyfikowanych grup ulegali wypadkom podczas „chodzenie, biegania, wchodzenia na, schodzenia z itp.” (chociaż wciąż jest to najczęściej występująca czynność przed wypadkiem). W tej grupie natomiast najczęściej do wypadków przy pracy dochodziło podczas czynności charakterystycznych dla przetwórstwa przemysłowego: wszelkich czynności związanych z obsługą maszyn, z wyłączeniem kierowania nimi (rys. 2).

   Poszkodowani przyporządkowani do grupy 2 częściej niż w grupie 3 ulegali wypadkom podczas „chodzenia, biegania, wchodzenia na, schodzenia z itp.”, chociaż nie tak często jak w grupie 1 (rys. 2). Jednak to, co wyróżnia poszkodowanych skupionych w tej grupie, to że najczęściej ulegali wypadkom podczas kierowania środkami transportu i jazdy nimi w roli pasażera oraz obsługi maszyn i urządzeń ruchomych z własnym napędem. Do wypadków przy pracy w tej grupie często dochodziło również podczas innych czynności związanych z używaniem pojazdów i maszyn ruchomych jak: „wchodzenie do/wychodzenie z”, „przenoszenie” oraz stosunkowo rzadko „skakanie, podskakiwanie” oraz „obecność”.

 

Czynność wykonywana przez poszkodowanego w chwili wypadku

Rys. 2. Czynność wykonywana przez poszkodowanego w chwili wypadku

opracowane na podstawie danych GUS z lat 2005-2014

 

  Zidentyfikowane grupy segmentacji okazały się być dobrze sprofilowane pod względem liczby i skutków wypadków. Przeprowadzona analiza skupień skuteczniej identyfikuje rodzaje prac najbardziej zagrożone powstawaniem wypadków przy pracy o różnej ciężkości, w porównaniu do identyfikacji w oparciu o jedną zmienną, na przykład liczbę lub wskaźnik częstości w rodzajach gospodarki. Oczywiście wyróżnione profile grup należy traktować jedynie jako uproszczony opis (typy idealne), który w rzeczywistości jest bardziej skomplikowany.

 

Tablica 2. Wyłonione w wyniku segmentacji metodą grupowania dwustopniowego grupy wypadków przy pracy, ze względu na skutki wypadków

  Numer skupienia w dwustopniowym grupowaniu Bez podziału na grupy
3 2 1
Etykieta mężczyźni – przetwórstwo przemysłowe mężczyźni – kierowanie i obsługa pojazdów kobiety – praca
biurowa
Udział wypadków śmiertelnych w poszczególnych skupieniach 0,2% 1,1% 0,1% 0,5%
Udział wypadków ciężkich w poszczególnych skupieniach 1,0% 1,2% 0,3% 1,0%
Średnia liczba dni niezdolności do pracy 41,22 47,36 35,86 42,17
Średnia liczba osób poszkodowanych w wypadku przy pracy 1,04 1,08 1,01 1,04
Śmiertelne wypadki przy pracy 20% 75% 11%  
Ciężkie wypadki przy pracy 45% 44% 11%
Wypadki przy pracy ogółem 39% 31% 30%