AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Prob. mit Regulären Ausdrücke

Ein Thema von jfheins · begonnen am 15. Feb 2007 · letzter Beitrag vom 17. Feb 2007
 
Benutzerbild von jfheins
jfheins

Registriert seit: 10. Jun 2004
Ort: Garching (TUM)
4.579 Beiträge
 
#1

Prob. mit Regulären Ausdrücke

  Alt 15. Feb 2007, 12:13
Hallo zusammen

Erstmal: Die Frage ist über Java, aber ich habe keine Wahl, was die Sprache betrifft

Das Problem: Ich habe einige Objekte in einer Datei, und will diese einlesen. Die Dateistruktur ist beliebig, aber sie soll menschenlesbar sein. Ich habe mir ungefär folgendes format ausgedacht:
Code:
new TAppointment{
   Title="Beispieltitel";
   Priority=3;
   Description="Dies ist eine Beschreibung ...\nMit zwei Zeilen!";
   Date=new TDate{
      Day=4;
      Month=2;
      Year=2007;
      Time=new TTime{
         Hour=17;
         Minute=5;
      };
   };
};

new TWeekly{
   Title="Noch ein Item";
   Priority=7;
   Description="Schon wieder Beschreiben,\naber diesmal ...\nüber drei Zeilen !";

   StartDate=new TDate{
      Day=4;
      Month=2;
      Year=2007;
      Time=null;
   };

   EndDate=new TDate{
      Day=4;
      Month=2;
      Year=2007;
      Time=null;
   };

   DayOfWeek=3;
   Time=new TTime{
      Hour=13;
      Minute=15;
   };
};
Es gibt also Items (erste Ordnung, Klassen wie TAppointment oder TWeekly) und entsprechende Properties Childobjekte.

Nun will ich die Datei parsen ... erstmal wird an allen Zeilenumbrüchen getrennt, und dann getrimmt. Dann kommt folgender Code:
Code:
                if (token.matches("^(new T)")) // new Item-Object to read
                {
                    System.out.println("neues objekt: " + token.substring(4));
                }
                else if (token.matches("^(.+=new T)")) // Child-Object
                {
                    System.out.println("kind: ");
                }
                else if (token.matches("^(.+=\".+\";)")) // String-Property to read
                {
                    System.out.println("str-property: " + token);
                }
                else if (token.matches("^(.+=.+;)")) // Other Property to read
                {
                    System.out.println("property: " + token);
                }
                else // Control-Chars
                {
                    System.out.println("was anderes: " + token);
                }
Token ist ein Teil des Texts, also immer eine Zeile.

Ausgabe, die mir Rätsel aufgibt, ist folgende:#
Zitat:
was anderes: new TAppointment{
str-property: Title="Beispieltitel";
property: Priority=3;
str-property: Description="Dies ist eine Beschreibung ...\nMit zwei Zeilen!";
was anderes: Date=new TDate{
property: Day=4;
property: Month=2;
property: Year=2007;
was anderes: Time=new TTime{
property: Hour=17;
property: Minute=5;
was anderes: };
was anderes: };
was anderes: };
was anderes: new TWeekly{
str-property: Title="Noch ein Item";
property: Priority=7;
str-property: Description="Schon wieder Beschreiben,\naber diesmal ...\nüber drei Zeilen !";
was anderes: StartDate=new TDate{
property: Day=4;
property: Month=2;
property: Year=2007;
property: Time=null;
was anderes: };
was anderes: EndDate=new TDate{
property: Day=4;
property: Month=2;
property: Year=2007;
property: Time=null;
was anderes: };
property: DayOfWeek=3;
was anderes: Time=new TTime{
property: Hour=13;
property: Minute=15;
was anderes: };
was anderes: };
Wie zu sehen, erkennt er nur Properties. Hauptobjekte und Childobjekte werden nicht erkannt.

Wie kann ich ihm auf die Sprünge helfen?

Kann ich die Regexen noch verbessern?

(Das ist nur die Exportfunktion, das eigentliche Speichern wird anders sein ...)

MfG, Julius.
  Mit Zitat antworten Zitat
 


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 23:28 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz