Wielkopolskie Towarzystwo Genealogiczne GNIAZDO

Forum dyskusyjne WTG GNIAZDO
Teraz jest 22 gru 2024, 17:37

Strefa czasowa: UTC + 1




Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 5 ] 
Autor Wiadomość
PostNapisane: 03 gru 2024, 14:22 
Offline

Dołączył(a): 16 lis 2008, 22:24
Posty: 279
Witam serdecznie;

robię pewne tłumaczenie i mam pytanie a raczej szukam pomocy.
Czy jest jakiś program do edytowania tekstów, który robiłby SPIS wszystkich wyrazów z danego teksu oraz np. podawał liczbę występowania. Oczywiście tekst może mieć 100 stron w WORD, ale podam przykład. Mam takie zdanie:

und namhaften Christoph Marquart und Martin Marquart

Spis
Martin 1
namhaften 1
Christoph 1
Marquart 2
und 2

Jakim programem mogę to osiągnąć? Dzieki z góry.

_________________
pozdrawiam
http://akrantz.pl/


Góra
 Zobacz profil  
 
PostNapisane: 03 gru 2024, 15:55 
Offline

Dołączył(a): 28 lis 2006, 20:58
Posty: 137
Lokalizacja: Gniezno
Witam,
Tak na szybko zapytałem ChatGPT - oto odpowiedź
Aby zliczyć częstotliwość występowania wyrazów w tekście, można użyć różnych programów i narzędzi. Oto kilka popularnych opcji:

### 1. **Python (z biblioteką `collections`)**
Python to jedno z najczęściej używanych narzędzi do analizy tekstów. Można użyć wbudowanej biblioteki `collections` oraz innych narzędzi do przetwarzania tekstu, np. `nltk` lub `spacy`.

Przykładowy kod w Pythonie:
```python
from collections import Counter
import re

# Wczytanie tekstu
text = "To jest przykład tekstu, w którym zliczamy wystąpienie wyrazów."

# Uproszczenie tekstu: zamiana na małe litery, usunięcie znaków interpunkcyjnych
words = re.findall(r'\b\w+\b', text.lower())

# Zliczanie częstotliwości wyrazów
word_count = Counter(words)

# Wyświetlanie wyników
print(word_count)
```

### 2. **R (z pakietem `tm` lub `tidytext`)**
W R również istnieją pakiety do analizy tekstu. `tm` lub `tidytext` umożliwiają łatwe zliczanie wyrazów.

Przykładowy kod w R:
```R
library(tidytext)
library(dplyr)

text <- "To jest przykład tekstu, w którym zliczamy wystąpienie wyrazów."

# Przekształcenie tekstu na dataframe
words <- tibble(text = text) %>%
unnest_tokens(word, text)

# Zliczanie wystąpień słów
word_count <- words %>%
count(word, sort = TRUE)

print(word_count)
```

### 3. **Microsoft Excel**
Można również użyć Excela, w którym wystarczy wkleić tekst, a potem użyć funkcji `LICZ.JEŻELI` lub narzędzi takich jak Power Query, aby zliczyć częstotliwość wystąpień poszczególnych słów.

### 4. **Narzędzia online**
Istnieją również narzędzia online, które pozwalają na łatwe zliczanie częstotliwości słów w tekstach, np.:
- [WordCounter](https://wordcounter.net/)
- [Textalyser](https://textalyser.net/)

### 5. **Programy do analizy tekstu (np. AntConc)**
AntConc to narzędzie do analizy tekstów, które umożliwia zliczanie częstotliwości słów, fraz, a także przeprowadzanie analizy korpusów tekstowych.

https://www.laurenceanthony.net/software/antconc/

pozdrawiam
Sławomir Łubiński


Góra
 Zobacz profil  
 
PostNapisane: 03 gru 2024, 21:43 
Offline
Avatar użytkownika

Dołączył(a): 22 kwi 2009, 20:13
Posty: 1077
Lokalizacja: Poznań
Spróbuj z NoteTab w darmowej wersji.

https://www.notetab.com/download-now
NoteTab Light (Freeware)

Ctrl+F9 (Tools->Text Statistics->Word frequency)

_________________
pozdrawiam, Tomek
Odoliński , Odaliński, Oduliński - jeżeli spotkasz się z tymi nazwiskami gdziekolwiek napisz do mnie koniecznie...


Góra
 Zobacz profil  
 
PostNapisane: 04 gru 2024, 11:12 
Offline
Avatar użytkownika

Dołączył(a): 17 lut 2022, 12:33
Posty: 8
Lokalizacja: Wlkp
RJ TextEd
Jest wersja portable w pakiecie LiberKey.
https://www.liberkey.com/en/


Góra
 Zobacz profil  
 
PostNapisane: 04 gru 2024, 12:34 
Offline

Dołączył(a): 16 lis 2008, 22:24
Posty: 279
dzień dobry,
bardzo dziękuję za wszytskie propozycje.
ponieważ wówczas nie miałem tyle czasu, teraz śpieszę napisać w czym rzecz.

W zeszłym tygodniu byłem w Szczecinie w archium panstwowym i sfotografowałem w końcu księgę, którą już zawsze chciałem "obrobić". Chodzi o Schlopper Schoeffenbuch 1588-1641.
Księga ma ponad 500 kartek czyli ponad 1000 stron. Napisana gotykiem. Z tego co wiem nawet w literaturze przedwojennej nikt tego nie tłumaczył. Ona ma także dalsze części na kolejne lata.
Chciałbym ją przełożyć na hochdeutsch, ale nie jest łatwo.
Jeżeli chodzi o kontekst historyczny tej księgi to jest to prawdziwy skarb dla wszytskich którzy interesują się Netzekreis i niemieckimi osadnikami przybyłymi z Neumark i Pommern. Są to dokłądnie te nazwiska, które widzimy w Schulzendoerfer w Netzekreis no i później w Hollaenderdoerfer w Grosspolen, później w Mittelpolen. Bogaty zbiór tych nazwisk znajduje się w Quellen zur Geschichte der zweiten deutschen Ostsiedlung im westlichen Netzegau. Jest tam też Człopa ale tylko pierwszych parę latek.

Wracajać do źródła .... jest to zbiór kontraktów i umów miedzy mieszkańcami. Piękna rzecz. Ale występuje dużo słów których pisowania jest mocno zniekształcona i właśnie takie zestawienie dałoby mi pogląd jaka pisowania danego słowa występuje najcześciej. Może pomoże mi to w rozszyfrowaniu tych słów. Bardzo trudne do tłumaczenia są rzeczy z gospodarstwa domowego, przyrządy, odzież i inne takie.

Bardzo dziękuje za wszelkie propozycje co do SPISU.

_________________
pozdrawiam
http://akrantz.pl/


Góra
 Zobacz profil  
 
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 5 ] 

Strefa czasowa: UTC + 1


Kto przegląda forum

Użytkownicy przeglądający ten dział: Brak zidentyfikowanych użytkowników i 16 gości


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów

Szukaj:
Skocz do:  
POWERED_BY
Przyjazne użytkownikom polskie wsparcie phpBB3 - phpBB3.PL