Wymiana doświadczeń pomiędzy genealogami, dyskusje ogólne na tematy genealogiczne i historyczne, dane dotyczące parafii, archiwów, ciekawych stron, itd
Odpowiedz

Jakiego użyć programu?

03 gru 2024, 14:22

Witam serdecznie;

robię pewne tłumaczenie i mam pytanie a raczej szukam pomocy.
Czy jest jakiś program do edytowania tekstów, który robiłby SPIS wszystkich wyrazów z danego teksu oraz np. podawał liczbę występowania. Oczywiście tekst może mieć 100 stron w WORD, ale podam przykład. Mam takie zdanie:

und namhaften Christoph Marquart und Martin Marquart

Spis
Martin 1
namhaften 1
Christoph 1
Marquart 2
und 2

Jakim programem mogę to osiągnąć? Dzieki z góry.

Re: Jakiego użyć programu?

03 gru 2024, 15:55

Witam,
Tak na szybko zapytałem ChatGPT - oto odpowiedź
Aby zliczyć częstotliwość występowania wyrazów w tekście, można użyć różnych programów i narzędzi. Oto kilka popularnych opcji:

### 1. **Python (z biblioteką `collections`)**
Python to jedno z najczęściej używanych narzędzi do analizy tekstów. Można użyć wbudowanej biblioteki `collections` oraz innych narzędzi do przetwarzania tekstu, np. `nltk` lub `spacy`.

Przykładowy kod w Pythonie:
```python
from collections import Counter
import re

# Wczytanie tekstu
text = "To jest przykład tekstu, w którym zliczamy wystąpienie wyrazów."

# Uproszczenie tekstu: zamiana na małe litery, usunięcie znaków interpunkcyjnych
words = re.findall(r'\b\w+\b', text.lower())

# Zliczanie częstotliwości wyrazów
word_count = Counter(words)

# Wyświetlanie wyników
print(word_count)
```

### 2. **R (z pakietem `tm` lub `tidytext`)**
W R również istnieją pakiety do analizy tekstu. `tm` lub `tidytext` umożliwiają łatwe zliczanie wyrazów.

Przykładowy kod w R:
```R
library(tidytext)
library(dplyr)

text <- "To jest przykład tekstu, w którym zliczamy wystąpienie wyrazów."

# Przekształcenie tekstu na dataframe
words <- tibble(text = text) %>%
unnest_tokens(word, text)

# Zliczanie wystąpień słów
word_count <- words %>%
count(word, sort = TRUE)

print(word_count)
```

### 3. **Microsoft Excel**
Można również użyć Excela, w którym wystarczy wkleić tekst, a potem użyć funkcji `LICZ.JEŻELI` lub narzędzi takich jak Power Query, aby zliczyć częstotliwość wystąpień poszczególnych słów.

### 4. **Narzędzia online**
Istnieją również narzędzia online, które pozwalają na łatwe zliczanie częstotliwości słów w tekstach, np.:
- [WordCounter](https://wordcounter.net/)
- [Textalyser](https://textalyser.net/)

### 5. **Programy do analizy tekstu (np. AntConc)**
AntConc to narzędzie do analizy tekstów, które umożliwia zliczanie częstotliwości słów, fraz, a także przeprowadzanie analizy korpusów tekstowych.

https://www.laurenceanthony.net/software/antconc/

pozdrawiam
Sławomir Łubiński

Re: Jakiego użyć programu?

03 gru 2024, 21:43

Spróbuj z NoteTab w darmowej wersji.

https://www.notetab.com/download-now
NoteTab Light (Freeware)

Ctrl+F9 (Tools->Text Statistics->Word frequency)

Re: Jakiego użyć programu?

04 gru 2024, 11:12

RJ TextEd
Jest wersja portable w pakiecie LiberKey.
https://www.liberkey.com/en/

Re: Jakiego użyć programu?

04 gru 2024, 12:34

dzień dobry,
bardzo dziękuję za wszytskie propozycje.
ponieważ wówczas nie miałem tyle czasu, teraz śpieszę napisać w czym rzecz.

W zeszłym tygodniu byłem w Szczecinie w archium panstwowym i sfotografowałem w końcu księgę, którą już zawsze chciałem "obrobić". Chodzi o Schlopper Schoeffenbuch 1588-1641.
Księga ma ponad 500 kartek czyli ponad 1000 stron. Napisana gotykiem. Z tego co wiem nawet w literaturze przedwojennej nikt tego nie tłumaczył. Ona ma także dalsze części na kolejne lata.
Chciałbym ją przełożyć na hochdeutsch, ale nie jest łatwo.
Jeżeli chodzi o kontekst historyczny tej księgi to jest to prawdziwy skarb dla wszytskich którzy interesują się Netzekreis i niemieckimi osadnikami przybyłymi z Neumark i Pommern. Są to dokłądnie te nazwiska, które widzimy w Schulzendoerfer w Netzekreis no i później w Hollaenderdoerfer w Grosspolen, później w Mittelpolen. Bogaty zbiór tych nazwisk znajduje się w Quellen zur Geschichte der zweiten deutschen Ostsiedlung im westlichen Netzegau. Jest tam też Człopa ale tylko pierwszych parę latek.

Wracajać do źródła .... jest to zbiór kontraktów i umów miedzy mieszkańcami. Piękna rzecz. Ale występuje dużo słów których pisowania jest mocno zniekształcona i właśnie takie zestawienie dałoby mi pogląd jaka pisowania danego słowa występuje najcześciej. Może pomoże mi to w rozszyfrowaniu tych słów. Bardzo trudne do tłumaczenia są rzeczy z gospodarstwa domowego, przyrządy, odzież i inne takie.

Bardzo dziękuje za wszelkie propozycje co do SPISU.
Odpowiedz