AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Prob. mit Regulären Ausdrücke

Ein Thema von jfheins · begonnen am 15. Feb 2007 · letzter Beitrag vom 17. Feb 2007
Antwort Antwort
Benutzerbild von jfheins
jfheins

Registriert seit: 10. Jun 2004
Ort: Garching (TUM)
4.579 Beiträge
 
#1

Prob. mit Regulären Ausdrücke

  Alt 15. Feb 2007, 13:13
Hallo zusammen

Erstmal: Die Frage ist über Java, aber ich habe keine Wahl, was die Sprache betrifft

Das Problem: Ich habe einige Objekte in einer Datei, und will diese einlesen. Die Dateistruktur ist beliebig, aber sie soll menschenlesbar sein. Ich habe mir ungefär folgendes format ausgedacht:
Code:
new TAppointment{
   Title="Beispieltitel";
   Priority=3;
   Description="Dies ist eine Beschreibung ...\nMit zwei Zeilen!";
   Date=new TDate{
      Day=4;
      Month=2;
      Year=2007;
      Time=new TTime{
         Hour=17;
         Minute=5;
      };
   };
};

new TWeekly{
   Title="Noch ein Item";
   Priority=7;
   Description="Schon wieder Beschreiben,\naber diesmal ...\nüber drei Zeilen !";

   StartDate=new TDate{
      Day=4;
      Month=2;
      Year=2007;
      Time=null;
   };

   EndDate=new TDate{
      Day=4;
      Month=2;
      Year=2007;
      Time=null;
   };

   DayOfWeek=3;
   Time=new TTime{
      Hour=13;
      Minute=15;
   };
};
Es gibt also Items (erste Ordnung, Klassen wie TAppointment oder TWeekly) und entsprechende Properties Childobjekte.

Nun will ich die Datei parsen ... erstmal wird an allen Zeilenumbrüchen getrennt, und dann getrimmt. Dann kommt folgender Code:
Code:
                if (token.matches("^(new T)")) // new Item-Object to read
                {
                    System.out.println("neues objekt: " + token.substring(4));
                }
                else if (token.matches("^(.+=new T)")) // Child-Object
                {
                    System.out.println("kind: ");
                }
                else if (token.matches("^(.+=\".+\";)")) // String-Property to read
                {
                    System.out.println("str-property: " + token);
                }
                else if (token.matches("^(.+=.+;)")) // Other Property to read
                {
                    System.out.println("property: " + token);
                }
                else // Control-Chars
                {
                    System.out.println("was anderes: " + token);
                }
Token ist ein Teil des Texts, also immer eine Zeile.

Ausgabe, die mir Rätsel aufgibt, ist folgende:#
Zitat:
was anderes: new TAppointment{
str-property: Title="Beispieltitel";
property: Priority=3;
str-property: Description="Dies ist eine Beschreibung ...\nMit zwei Zeilen!";
was anderes: Date=new TDate{
property: Day=4;
property: Month=2;
property: Year=2007;
was anderes: Time=new TTime{
property: Hour=17;
property: Minute=5;
was anderes: };
was anderes: };
was anderes: };
was anderes: new TWeekly{
str-property: Title="Noch ein Item";
property: Priority=7;
str-property: Description="Schon wieder Beschreiben,\naber diesmal ...\nüber drei Zeilen !";
was anderes: StartDate=new TDate{
property: Day=4;
property: Month=2;
property: Year=2007;
property: Time=null;
was anderes: };
was anderes: EndDate=new TDate{
property: Day=4;
property: Month=2;
property: Year=2007;
property: Time=null;
was anderes: };
property: DayOfWeek=3;
was anderes: Time=new TTime{
property: Hour=13;
property: Minute=15;
was anderes: };
was anderes: };
Wie zu sehen, erkennt er nur Properties. Hauptobjekte und Childobjekte werden nicht erkannt.

Wie kann ich ihm auf die Sprünge helfen?

Kann ich die Regexen noch verbessern?

(Das ist nur die Exportfunktion, das eigentliche Speichern wird anders sein ...)

MfG, Julius.
  Mit Zitat antworten Zitat
Benutzerbild von jfheins
jfheins

Registriert seit: 10. Jun 2004
Ort: Garching (TUM)
4.579 Beiträge
 
#2

Re: Prob. mit Regulären Ausdrücke

  Alt 16. Feb 2007, 16:53
Keiner eine Ahnung?
  Mit Zitat antworten Zitat
Benutzerbild von chaosben
chaosben

Registriert seit: 27. Apr 2005
Ort: Görlitz
1.358 Beiträge
 
Delphi XE2 Professional
 
#3

Re: Prob. mit Regulären Ausdrücke

  Alt 16. Feb 2007, 22:31
Hi!

Ich habe einen ganz anderen Vorschlag für dich. Ein menschen-lesbares Format ist u.a. XML. Da kannst du das, was du da als Beispiel geschrieben hast, wunderbar abbilden. Und Java sollte eigentlich einen XML-Parser intus haben.
Benjamin Schwarze
If I have seen further it is by standing on the shoulders of Giants. (Isaac Newton)
  Mit Zitat antworten Zitat
Benutzerbild von yankee
yankee

Registriert seit: 10. Mär 2004
1.134 Beiträge
 
Lazarus
 
#4

Re: Prob. mit Regulären Ausdrücke

  Alt 16. Feb 2007, 23:44
xml halte ich für sowas simples für Overkill...
Da würde ich dir zu JSON raten. Das ist simpel, schnell, du kannst alles dadrin abbilden, was du brauchst und es gibt genügend libs um mit JSON umzugehen (einfach mal auf www.json.org ganz runterscrollen. Da sind gleich 9 Links zu json-Parsern ).

Wenn du lieber mit deinem eigenem Format weitermachen willst, dann musst du mir das Problem nochmal genauer erklären... Eigentlich sehe ich in deinem log auch die Unterobjekte...
Letzter Tipp: Drogen. Machen zwar nicht glücklich, geben einem aber wenigstens das Gefühl glücklich zu sein.

Have a lot of fun!
  Mit Zitat antworten Zitat
Benutzerbild von jfheins
jfheins

Registriert seit: 10. Jun 2004
Ort: Garching (TUM)
4.579 Beiträge
 
#5

Re: Prob. mit Regulären Ausdrücke

  Alt 17. Feb 2007, 10:20
Also ich möchte gerne mit meinen Format weitermachen ...

Grund ist der, dass ich das selber Parsen muss, also keinen vollautomatischen Parser verwenden

Also kann ich die Struktur der Datei beliebig verändern so, dass das Parsen einfach wird, aber parsen muss ich es schon.

Das Problem ist doch, dass die (Unter-)objekte zwar auftauchen, aber als "was anderes" - also werden sie erst im letzten else-Zweig erkannt, aber sie sollen schon vorher mithilfe des regulären Ausdrucks erkannt werden. Und dieser trifft offensichtlich nicht zu
Code:
was anderes: Time=new TTime{
was anderes: new TWeekly{
  Mit Zitat antworten Zitat
Benutzerbild von yankee
yankee

Registriert seit: 10. Mär 2004
1.134 Beiträge
 
Lazarus
 
#6

Re: Prob. mit Regulären Ausdrücke

  Alt 17. Feb 2007, 11:40
Nun... ich würde dir trotzdem emphelen deine Parsingstrategie zu ändern. Denn deine Methode mit den Regexen dürfte verdammt langsam sein und du kommst schnell an die Grenzen der Möglichkeiten...
Ich habe mal einen ini-Dateiparser in Java geschrieben. Den kann ich dir gerne geben, wenn du ein paar Anregungen brauchst.
Dein Parser müsste allerdinsg rekursiv aufgebaut sein, da es unbegrentzt viele Unterobejket gibt (ist doch so, oder?). Mein ini-File Parser kommt ohne Rekursion aus .

Wenn du trotzdem unbedingt bei deiner Parsemethode bleiben willst:
Ich denke mal du erwartest, dass diese Bedingung anspringt:
token.matches("^(.+=new T)"))
Mach's mal so:
token.matches("^(.+=new T).*")
das sollte funktionieren. Jetzt frag' mich aber nicht, warum matches nicht anspringt, wenn das Ende des Strings nicht mitmatcht. Das sollte meines Erachtens nur dann passieren, wenn ein $ am Ende ist..
Also wenn jemand eine Antwort drauf hat.
Und dies ist für sowas manchmal ganz praktisch:
http://www.fileformat.info/tool/regex.htm
Letzter Tipp: Drogen. Machen zwar nicht glücklich, geben einem aber wenigstens das Gefühl glücklich zu sein.

Have a lot of fun!
  Mit Zitat antworten Zitat
Benutzerbild von jfheins
jfheins

Registriert seit: 10. Jun 2004
Ort: Garching (TUM)
4.579 Beiträge
 
#7

Re: Prob. mit Regulären Ausdrücke

  Alt 17. Feb 2007, 12:52
Also das Parsen sollte ungefähr so verlaufen, dass erstmal alles entsprechend kategorisiert wird, durch die regexen, und in einer hirachischen Struktur untergebracht wird. Dann wird für jedes Haupt-Objekt dieser Struktur die "Read"-Methode mit einer AttayList<TItem> aufgerufen, die dann ein Objekt des richtigen typs erstellt, es in die ArrayList reintut, und sich dann dem Objekt übergibt, damit das Objekt dann seine privaten Felder füllen kann. Das ist dann rekursiv, und das ist auch gut so Geschwindigkeit spielt keine Rolle ... ist eh in java

(Klingt vll. ein wenig kompliziert ... ist es vielleicht auch ^^)

Edit:

Tasache, mit den .* hinten dran geht es wunderbar ...

1. Cool, Danke

2. Warum zum Teufel geht es ohne nicht? Doofes Java
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 14:14 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz