Herzlich Willkommen, lieber Gast!
  Sie befinden sich hier:

  Forum » Allgemeines (OffTopic) » Frequenzliste

Forum | Hilfe | Team | Links | Impressum | > Suche < | Mitglieder | Registrieren | Einloggen
  Quicklinks: MSDN-Online || STL || clib Reference Grundlagen || Literatur || E-Books || Zubehör || > F.A.Q. < || Downloads   

Autor Thread - Seiten: > 1 <
000
19.05.2008, 17:49 Uhr
Pler
Einer von Vielen
(Operator)


Hallo Leute!

Ich suche hier schon ne ganze Weile, kann aber nichts finden.
Sieht fast so aus, als muesst ich das selbst schreiben, aber vorher wollte ich hier noch mal fragen.

Ich brauchte folgendes.
Eine Frequenzliste von Woertern (Woerter waeren echt gut. Zur Not auch Wortformen).
Semantisch wervolle und trotzdem hochfrequente Woerter muesste ich wahrscheinlich dann mehr oder weniger selbst raussuchen.
Danach brauche ich zu den gewaehlten Woertern noch den Kontext. (ca. 50 Wortformen links und rechts.)
Das Problem mit den Woertern ist, dass ich dazu ja ein Lexikon braeuchte.
Aus diesen Woertern will ich dann Schluesselworter (Regulaere Ausdruecke oder so) bilden um damit wiederrum nach aehnlichen Texten zu suchen.

Die Texte sind uebrigens in einer Datenbank. Aber ich kann die natuerlich auch da rausholen und in Textdateien speichern.

Alle Tips zu Programmen, Links und sonstige Hinweise sind willkommen. :-)

Danke.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
001
19.05.2008, 21:22 Uhr
Hans
Library Walker
(Operator)


Hi,

das klingt irgendwie nach Computerlinguistik, was Du da vor hast. - Also einfach mal den Begriff in die Suchmaschiene Deines Vertrauens eintippen, und sehen was sie ausspuckt.
Evtl. hilft auch das Stichwort "statistische Textanalyse" weiter, denn damit ermittelt man ja, wie oft Wörter in Texten vorkommen. Ach ja, Kryptoanalyse passt da auch noch, denn Substitutions-chiffren (wie z.B. rot13) werden damit geknackt.

Hans
--
Man muss nicht alles wissen, aber man sollte wissen, wo es steht. Zum Beispiel hier: Nachdenkseiten oder Infoportal Globalisierung.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
002
20.05.2008, 02:29 Uhr
Pler
Einer von Vielen
(Operator)


Der Begriff Computerlinguistik sagt mir was.
(Ich studiere das ;-) )

Ich habe eben nach etwas fertigem gesucht.
Zum Beispiel hier gibts sowas: www.dwds.de
Das macht schon halbwegs sowas. Aber erstens nur online und vor allem zweitens nur auf den bekannten Daten.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
003
20.05.2008, 17:58 Uhr
Hans
Library Walker
(Operator)


Hi,

Zitat von Pler:
Der Begriff Computerlinguistik sagt mir was.
(Ich studiere das ;-) )

Toll!


Zitat von Pler:
Ich habe eben nach etwas fertigem gesucht.


Vielleicht hat Eure Bib ja das hier:

(Bei Amazon)

Bin mir jetzt zwar nicht Sicher, ob Dir das wirklich weiter hilft, weil es schon 'ne Weile her ist, seit ich das bei uns mal ausgeliehen hatte. Auf der zugehörigen CD ist jedenfalls ein Programm zur Textananalyse drauf. Ansonsten fällt mir dazu nur noch ein, mit statistischen Analsyetools auf die Texte los zu gehen...

Hans
--
Man muss nicht alles wissen, aber man sollte wissen, wo es steht. Zum Beispiel hier: Nachdenkseiten oder Infoportal Globalisierung.

Dieser Post wurde am 20.05.2008 um 18:00 Uhr von Hans editiert.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
004
21.05.2008, 07:49 Uhr
Bruder Leif
dances with systems
(Operator)


Markov-Ketten? In "The Practice of Programming" (Kernighan, Pike) ist eine Referenzimplementierung in C, C++, Java, Perl und Awk, vielleicht gibts den Schinken in der Bibliothek...
--
Mit 40 Fieber sitzt man nicht mehr vor dem PC.
Man liegt im Bett.
Mit dem Notebook.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
005
21.05.2008, 15:19 Uhr
Pler
Einer von Vielen
(Operator)


Danke erstmal fuer die Antworten.
Das Problem ist aber weniger die Programmierung (falls ich selbst machen muss), als vielmehr das Lexikon.
Fuers Deutsche haetten wir an der Uni sogar was. Ich brauchs aber fuers Englische. Das Englische ist aber eh nicht so flektierend. Deshalb versuch ich es erst mal mit der guten alten Methode nur die Wortstaemme zu finden.
Nebenbei werd ich aber trotzdem mal weiter Ausschau halten. Und wenn ich mal ne Bibl. finde, werd ich auch mal in die Buecher schaun.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
Seiten: > 1 <     [ Allgemeines (OffTopic) ]  


ThWBoard 2.73 FloSoft-Edition
© by Paul Baecher & Felix Gonschorek (www.thwboard.de)

Anpassungen des Forums
© by Flo-Soft (www.flo-soft.de)

Sie sind Besucher: