Uproszczonym odbiciem naszej rzeczywistości są gry i zabawy. Oczywiście ze zdecydowanie mniejszą ilością zmiennych i jasnymi regułami. Nie znaczy to jednak, że strategie i taktyki stosowane w grach nie mają nic wspólnego z modelami przetwarzania danych, które projektujemy w ramach Data Science. Robot Waldo, który z odpowiednim oprogramowaniem analizuje obraz i wskazuje swoją mechaniczną dłonią położenie Wally’ego jest na to doskonałym przykładem.
Wally – nasz sympatyczny bohater posłuży nam tylko jako przykład obiektu, który chcemy wyszukać. Nie wyrządził nam szkód, lecz tylko bawi się z nami w chowanego. Mimo charakterystycznego wyglądu, potrafi się wtopić w tłum tak, byśmy nie mogli go dostrzec.
Zaczynamy zatem poszukiwania. Najpierw rzućmy okiem na całość obrazu. Pierwszą nasza konkluzją może być to, że Pan W. nie istnieje, skoro go nie widzimy. My jednak pogodzimy się z brakiem spostrzegawczości i przejdziemy do konstruktywnych wniosków. Podsumowanie naszych danych nie wskazuje na obecność poszukiwanego, zaś perspektywa „lotu ptaka” nie dała nam wskazówek.
Spróbujmy zatem wyostrzyć wzrok i popatrzeć w kilka punktów „kontrolnych” na obrazie. Uzbrojeni w lupę szybko spoglądamy w kluczowe obszary na rysunku. Weźmiemy też do puli badanych punktów jeszcze kilka miejsc przypadkowych[w naszym przekonaniu są one losowe]. Możemy na to zadanie poświęcić chwilę, bowiem spodziewamy się sukcesu. Mamy zatem „ramy”, wewnątrz których na pewno znajduje się poszukiwany.
Po kilku chwilach stwierdzimy, że jednak Go tam nie ma. Wally był sprytniejszy? Czyżby rysunek zawierał błąd, a może powinniśmy udać się do okulisty? Tymi pytaniami odsuwamy od siebie cel: znaleźć Wally’ego.
Po refleksjach nad postawionymi wyżej pytaniami wracamy do zadania ponownie. Teraz „systemowo”. Spokojnie i po kolei przeanalizujemy całość, centymetr po centymetrze. Jeszcze tylko ustalimy, od którego rogu obrazu zacząć? Lewy górny? Ale jeśli Wally skrył się przy prawym, a co gorsza- dolnym rogu, to czeka nas masa pracy.
W końcu znaleźliśmy Wally’ego. Teraz już dobrze widoczny, w oczywistym miejscu. Nawet pozdrawia nas machaniem ręką. Sukces. Możemy sobie pogratulować. Jedna z tysięcy plansz z popularną zabawą nie stanowi już dla nas wyzwania. Tym razem mieliśmy wyjątkowo łatwo, gdyż wiedzieliśmy, kogo szukamy. A jak rozwiązać pozostałe szarady?
Jak przeanalizować repozytoria pełne danych? Czy odpowiednią strategią jest przeszukiwania danych wiersz po wierszu, tabela po tabeli? Czy może losowanie próbek badawczych byłoby lepszym rozwiązaniem, gdybyśmy tylko uwzględnili…
Osiągnęliśmy postawiony cel, bowiem kontynuowaliśmy nasze poszukiwania, mimo braku rezultatów.
Ważne też jest to, że w ramach różnych strategii poszukiwania skończyliśmy. Procesy miały swój START i END. Negatywny skutek wyszukiwania był dla nas ważną informacją i bodźcem do zmiany metody. Na samym początku sprecyzowaliśmy, na jakie cechy obiektu będziemy zwracać szczególną uwagę.
Przed nami do przeanalizowania tysiące obrazów z Wally’im oraz tabel z danymi.
Nie pozostaje mi zatem nic innego, niż życzyć nam wszystkim wytrwałości i sukcesów w identyfikacji!