Eszkola

Kategoryzacja pytań otwartych


Gdy w naszym badaniu zbieramy dane, które mają charakter otwarty i które chcemy przeanalizować metodami statystycznymi muszą być poddane kategoryzacji udzielanych odpowiedzi. Jeżeli chcemy dla takiego pytania, gdzie odpowiedzi nie są usystematyzowane, z góry narzucone przeprowadzić wnioskowanie statystyczne należy pozliczać kategorię udzielanych odpowiedzi. Kategoryzacja właśnie na tym polega, na przydzieleniu pojawiających się odpowiedzi do pewnych kategorii odpowiedzi (ogólniejszych grup odpowiedzi).

Przykład: Badacz zadał badanym osobom pytanie w ankiecie: co zrobiłby Pan/Pani, gdyby dostał Pan/Pani od nieznajomej osoby 1000zł? Pojawiły się między innymi takie odpowiedzi jak:

"kupiłbym rower"
"założyłbym lokatę bankową"
"oddałbym mu z powrotem"
"oddałbym komuś potrzebującemu"
"kupiłbym lodówkę"
"zaprosiłbym całą rodzinę na kolację a resztę zaoszczędziłbym na cięższe czasy"
"nie wziąłbym"
.... oczywiście to tylko część pojawiających się odpowiedzi, ale będą wystarczające do przedstawienia przykładu.

Na początku, należy "przyjrzeć" się odpowiedziom (jeżeli nie wszystkim to części z nich) w celu zaobserwowania pojawiających się odpowiedzi podobnych semantycznie, np:

"kupiłbym rower" i "kupiłbym lodówkę" zaliczylibyśmy do kategorii: 1. "Zakup czegoś"
"nie wziąłbym" oraz "oddałbym mu z powrotem" zaliczylibyśmy do kategorii: 2. "Nie przyjęcie pieniędzy"
odpowiedź "oddałbym komuś potrzebującemu" nie warto byłoby zaliczyć do 2. kategorii, ponieważ semantycznie jest to inna odpowiedź. W tamtym przypadku osoba nie chce przyjąć pieniędzy, w tym przyjmuje, ale chce komuś oddać.. znaczenie inne, zatem możemy stworzyć nową kategorię 3. Oddanie innym osobom
"założyłbym lokatę bankową"  - nowa kategoria 4. oszczędzanie
ciekawa sytuacja pojawia nam się w odpowiedzi "zaprosiłbym całą rodzinę na kolację a resztę zaoszczędziłbym na cięższe czasy"... analizując nasze kategorie mamy w tej odpowiedzi połączenie kategorii nr 1. zakup czegoś oraz 4. oszczędzanie. Zatem zaznaczamy odpowiedź i tu i tu.

Należy pamiętać, że z pytań otwartych przeważnie (w zdecydowanej większości przypadków) tworzone są wielokrotne odpowiedzi. Jak pokazano powyżej pojawiające się odpowiedzi są przydzielane do bardziej ogólnych kategorii, w których są podobne znaczeniowo odpowiedzi.

Kategoryzacja może odbywać się również stopniowo, mianowicie po wstępnym przydzieleniu odpowiedzi do kategorii robimy ponowną kategoryzację (choć lepiej byłoby napisać kompilację) powstałych kategorii odpowiedzi w bardziej ogólne kategorie. Taki zabieg ma na celu ograniczenie liczby pojawiających się kategorii w celu lepszej analizy danych. Oczywiście uogólnianie kategorii powoduje stratę pewnej części informacji, jednakże dla lepszego wnioskowania statystycznego można taki zabieg przeprowadzić. 

Kategoryzacja to dość czasochłonny proces, niekiedy w badaniach celowo pomijany. Zadanie danego pytania otwartego może nie mieć na celu systematycznej analizy danych lecz chęć poznania pojawiających się odpowiedzi, odpowiedzi nietypowych, oryginalnych, zaskakujących, bądź po prostu kontrolnych - sprawdzenie poprawnego zrozumienia definicji. W takich przypadkach kategoryzacja nie jest wykonywana. 

Przy kategoryzacji należy również pamiętać, aby nie "odsiać" oryginalnych odpowiedzi, nie mogących się zaliczyć do żadnej z kategorii. Jeżeli mają one jakiś sens merytoryczny warto je przeanalizować oddzielnie jako odpowiedzi oryginalne.

W wyniku kategoryzacji pytania otwartego otrzymujemy liczbę wskazań badanych osób na daną kategorię odpowiedzi co ma postać zmiennej gotowej do analizy statystycznej.


Kategoryzacja pytań otwartych Wasze opinie

4+8 =