Herzlich Willkommen, lieber Gast!
  Sie befinden sich hier:

  Forum » Allgemeines (OffTopic) » Schwierige Wörter filtern

Forum | Hilfe | Team | Links | Impressum | > Suche < | Mitglieder | Registrieren | Einloggen
  Quicklinks: MSDN-Online || STL || clib Reference Grundlagen || Literatur || E-Books || Zubehör || > F.A.Q. < || Downloads   

Autor Thread - Seiten: > 1 <
000
03.02.2007, 15:11 Uhr
Reyx
IT-fetischistischer Wurstsalat mit rostigem Berghorn
(Operator)


Hi!

Ich habe hier einen recht umfangreichen Text produziert, welcher auf einem imho sprachlich etwas "gehobenerem" Level steht. Nun wollte ich für den in Fachfremdwörtern nicht ganz so gebildeten Leser ein Vokabelverzeichnis einfügen.

Gibt es eine Möglichkeit, schwierigere, unüblichere bzw. Fach- und Fremdwörter aus einem Text (atm MS-Word Format, ist aber variabel) heraus zu filtern? Ich habe nämlich eigentlich im Moment nicht die Zeit, die rund 400 Seiten selbst noch einmal durchzulesen um etwaige Kandidaten für's Vokabelverzeichnis heraus zu filtern ...

Oder ist das wirklich das, was mir blüht?
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
001
03.02.2007, 15:32 Uhr
Pler
Einer von Vielen
(Operator)


Hm. Dazu bräuchtest du ja auf jeden Fall ein erst mal ein Fachwörterbuch.
Und da gibts glaub ich nichts freies.

Und dann können die ja auch noch flektiert auftreten. Dann reicht ein normales Wörterbuch schon gar nicht mehr aus...

Ich glaube da gibts nichts sinnvolles, lasse mich aber gern eines Besseren belehren..

Dieser Post wurde am 03.02.2007 um 15:34 Uhr von Pler editiert.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
002
03.02.2007, 16:09 Uhr
Reyx
IT-fetischistischer Wurstsalat mit rostigem Berghorn
(Operator)


Naja, ein sehr gutes Wörterbuch habe ich; das Problem ist nur, dass es bei solche Begriffen nicht aneckt.

Ich könnte natürlich auch ein "schlechtes" Wörterbuch nehmen ... Aber das spuckt mir dann auch tausend andere Sachen aus.

Vlt. wäre ein heuristisches Verfahren sinvoll? Ein kleines Skript schreiben, das mir alle Wörter mit typischen Fremdwortsemantiken ausfiltert (also auf th, y, á, é, os, us, o.ä. anspricht)?
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
003
03.02.2007, 16:22 Uhr
Pler
Einer von Vielen
(Operator)


Stell ich mir auch kompliziert vor. Und es gibt ja auch "eingedeutschte" Fremdwörter. Deutsche Fachwörter kannste damit eh nicht mehr erkennen.

Hatten wir hier nicht einen fertigstudierten Computerlinguisten? Leif Bruder?
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
004
03.02.2007, 16:49 Uhr
Bruder Leif
dances with systems
(Operator)


Hat mich jemand gerufen? *g* Ich würde einfach den Text per Zwischenablage in eine reine Textdatei speichern, dann ein kurzes Skript drüberlaufen lassen, das den Text in einzelne Wörter aufteilt und Dubletten rausfiltert. Dann entweder manuell drübergehen (langsam, aber akkurat und immerhin keine 400 Seiten mehr), oder mit einer rein deutschen Wortliste abgleichen...Heuristik wäre die dritte Möglichkeit, aber bis Du da alle Regeln beisammen hast, bist Du manuell schneller...
--
Mit 40 Fieber sitzt man nicht mehr vor dem PC.
Man liegt im Bett.
Mit dem Notebook.

Dieser Post wurde am 03.02.2007 um 17:03 Uhr von Bruder Leif editiert.
 
Profil || Private Message || Suche Download || Zitatantwort || Editieren || Löschen || IP
Seiten: > 1 <     [ Allgemeines (OffTopic) ]  


ThWBoard 2.73 FloSoft-Edition
© by Paul Baecher & Felix Gonschorek (www.thwboard.de)

Anpassungen des Forums
© by Flo-Soft (www.flo-soft.de)

Sie sind Besucher: