„mgFoto Magazyn” 1/2021 (10)

Page 33

Przewidywanie skupienia wzroku przy użyciu metod komputerowych Tomasz Hachaj*1

Zastosowanie nowoczesnych technologii komputerowych stało się codziennością w pracy fotografów, grafików i marketingowców. Postępy w technologii komputerowej oraz badaniach naukowych znacząco poprawiają komfort oraz wydajność naszych działań. W dalszym ciągu jednak niewiadomą pozostaje to, w jaki sposób nasza praca zostanie oceniona przez odbiorcę, czyli widza. Na co on zwróci uwagę? Które elementy kompozycji zatrzymają jego spojrzenie na dłużej, a po których jedynie „przemknie” wzrokiem? Wieloletnie doświadczenie w branży pozwala na ocenę i bardziej lub mniej trafne przewidzenie tych reakcji. Tym niemniej warto mieć narzędzie, które pozwoliłoby na spojrzenie na nasze dzieło z perspektywy przeciętnego widza. Tu z pomocą mogą przyjść najnowsze osiągnięcia, łączące wyniki analizy eye tacking oraz sztucznej inteligencji, w szczególności uczenia maszynowego. W artykule tym chciałbym przybliżyć zasady działania algorytmów, pozwalających na przewidywanie, na jakich elementach grafiki rastrowej i na jak długo skupia się wzrok obserwatora. Omówię tu podstawowe aspekty tych metod tak, aby sami mogli Państwo ocenić ich cechy pozytywne i ograniczenia, a co za tym idzie — ocenić przydatność w branży. Każde z poruszanych w artykule zagadnień jest bardzo szerokie i posiada wiele in*   Dr hab. inż. Tomasz Hachaj jest Zastępcą Dyrektora ds. Naukowych i Organizacyjnych oraz Kierownikiem Katedry w Instytucie Informatyki Uniwersytetu Pedagogicznego w Krakowie. 1

teresujących zastosowań. Skupimy się jednak tylko na tych, które są istotne z punktu widzenia przewidywania skupienia wzroku. Pomimo tego, że artykuł ten jest pracą popularnonaukową, znajdują się w nim odnośniki do zbiorów danych oraz artykułów naukowych, które w sposób ścisły opisują zaprezentowane tu metody. Zapewne pierwsze, co przychodzi nam do głowy, kiedy myślimy o ilościowej analizie procesu obserwacji, jest technologia eye tracking. Pozwala ona na rejestrowanie ruchu gałek ocznych przy pomocy kamer o wysokiej częstotliwości akwizycji obrazu, przekraczającej nawet 1000Hz. Metoda ta pozwala nie tylko na bardzo dokładną analizę, na jakich obiektach skupia się wzrok obserwatora (są to tak zwane fiksacje) ale również na wykrycie stanów przejściowych, w których wzrok przenosi się pomiędzy obiektami (sakady). Istnieje wiele sposobów wizualizacji wyników badań metodą eye tracking, wśród nich znajdują się mapy ciepła (heat maps). Mapy ciepła są grafikami rastrowymi o takiej samej rozdzielczości, jak analizowane obrazy. Najczęściej są to obrazy monochromatyczne, w których jasność piksela proporcjonalna jest do czasu, który obserwator spędził obserwując konkretny fragment analizowanego zdjęcia. Aby ułatwić wizualny odbiór tych map są one zazwyczaj nakładane na analizowane zdjęcie i kolorowane. Kolejnym istotnym elementem jest metoda komputerowa, pozwalająca na wykorzystanie obserwacji eye tacking do wyciągnięcia pewnych ogólnych i nieoczywistych wniosków dotyczących tego, jakie elementy zdjęcia i w jakiej konfiguracji mogą szczególnie przykuwać uwagę obserwatora. Do przeprowadzenia takich obliczeń używa się obecnie głębokich sieci neuronowych. Głębokie sieci neuronowe to algorytmy komputerowe, które składają się z pewnej liczby warstw. Warstwy te wykonują operacje na sygnale wejściowym, przekształcając go do założonej wcześniej postaci wyjścio[33]


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.