carar napisał(a):
Witam serdecznie!
Bardzo się cieszę, że problem błędów wreszcie zyskał zainteresowanie. Gdy o tym pisałm (str 47) nikt nie włączył się do dyskusji. Pewnie dlatego, że pisałem o specyficznych błędach, (ilościowych) stosunkowo łatwych do eliminacji. Obecna dyskusja (nieco za gorąca) dotyczy błędów jakościowych, stanowiących o jakości wpisów. Są one niestety trudniejsze do wychwycenia ale i na nie wydumałem metodę. W tym miejscu znów prośba do prowadzącego projekt i ogolnie informatyków by przedstawili swoją opinię na temat możliwości wdrożenia i ewentualne techniczne uwagi.
Pomysł mam taki.
Każda osoba uwidacznia się w aktach archiwów kilka razy (akt urodzenia, małżeństwa, zgonu, itp) czyli niezbędny warunek do kontroli, nanliczbowość danych, jest spełniony. Przy każdym wpisie podajemy również szereg danych (imię, nazwisko, data, rodziców, itd...) Drodzy informatycy, czy moglibyście zbudować taki system, który wykrywałby na podstawie szeregu danych w poszczególnych wpisach relacje między nimi? Na przykładzie wyjaśnię o co chodzi. Załóżmy, że dana osoba ma trzy akty w archiwach (urodzenia, małżeństwa, i zgonu). W jednym z nich wpisano złe nazwisko, w drugim błędny wiek osoby, trzeci jest poprawny.
akt urod. z roku 1800, Adam Demet, wiek 0 lat
akt małż. z roku 1820, Adam Nowak, wiek 30 lat
akt zgon. z roku 1860, Adam Nowak, wiek 60 lat
Na podstawie tuch danych można wyszukiwarkę tak skonfigurować że wyświetli rekord z błędnym nazwiskiem pry wcześniejszym zbudowaniu relacji między tymi trzema aktami.
Podana powużej metoda jest niczym innym jak automatyzacją tego co robię podczas poszukiwań obecnie. Przy tej metodzie nie ma znaczenia kto popełnił błąd urzędnik, proboszcz, czy indeksujący, bo jest on wypierany przez poprawne wpisy ze skojarzonych wcześniej rekordów. Jest jedna wada tego systemu, by działał skutecznie indeksacja musi być bardzo zaawansowana a najlepiej w pełni zakończona by system mógł czerpać z odpowiedniej ilości danych.
Mam nadzieję, że tym razem ktoś się ustosunkuje. Pozdrawiam. Artur
Nie wydaje mi się, aby ten pomysł wypalił z kilku dość prostych powodów. Primo - istnieje możliwość, że w parafii/obwodzie USC żyją minimum dwie osoby o tym samym imieniu i nazwisku - dzieje się tak w sytuacjach, kiedy imię ojca jest takie same lub po prostu w wyniku zwykłego zbiegu okoliczności - w takim przypadku system może się gubić. Secundo - nie zgodzę się ze sformułowaniem, że "przy każdym wpisie podajemy szereg danych (imię, nazwisko, data, rodziców, itd...)" - rozumiem, że chodzi tu o to, że w każdej metryce (ur., małż., zgon) mielibyśmy wpisywać takie dane. Ale co mamy zrobić, kiedy w zdecydowanej większości przypadków aktów małżeństw i zgonów nazwiska rodziców nie są podawane w ogóle z różnych powodów, takich jak niezapamiętanie imion, przybycie osoby z daleka itd. (chyba nierzadkim widokiem w aktach zgonów pruskich USC jest zapis "Eltern umbekannt"). Tertio - system ten sprawdziłby się tylko i wyłącznie w sytuacji, kiedy dana osoba nie opuszczała nigdy swojego miejsca zamieszkania i mielibyśmy pewność, że nie było drugiej osoby o tym samym imieniu i nazwisku oraz we wszystkich rodzajach metryk pojawiały się te wszystkie dane, o których wspomniałeś. To jest tylko pobożne życzenie, aby we wszystkich dokumentach pojawiały się wszelkie interesujące nas informacje...
Dodam też coś od siebie jako indeksującego. Zawsze swoją robotę staram się wykonać tak dobrze, na ile pozwalają mi moje możliwości odczytania różnych krojów pisma. Nieraz, gdy zdarzały mi się wątpliwości, swoje domysły podpierałem indeksami wykonanymi wcześniej przeze mnie bądź też innych indeksujących lub korzystałem z informacji na PP. Oczywiście nie był to głos decydujący, bo indeks musi być możliwie jak najbardziej zgodny z zapisem w jednostce, ale stanowił on cenną wskazówkę.