AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren

Parser: Operatoren

Ein Thema von blablab · begonnen am 13. Apr 2012 · letzter Beitrag vom 16. Apr 2012
Antwort Antwort
Seite 1 von 2  1 2   
Medium

Registriert seit: 23. Jan 2008
3.688 Beiträge
 
Delphi 2007 Enterprise
 
#1

AW: Parser: Operatoren

  Alt 13. Apr 2012, 09:37
Bei Pascal z.B. betrifft dies den '.' (wie in 7.1) und '..' (wie in [1..2]).
Beim rekursiven parsen in einen Grammatikbaum (Term von aussen nach innen) weiss der Parser, dass er eine eckige Klammer betreten hat wenn er deren Inhalt weiter zerlegt, und kann entsprechend andere Regeln anwenden, die in diesem Fall z.B. das Look-Ahead unnötig machen (keine Floats in Mengen zulässig).
Die gleiche Vorgehensweise erlaubt auch das Behandeln von "-". Nehme ich den Term "2--X" finde ich zuerst das erste "-", und gehe in die Rekursion mit "2" und "-X" als Restterme. Schalte ich meinem Tokenizer ein einfaches if TermString[1] = '-then TermString := '0'+TermString; vor, kann ich das Vorzeichen wie ein ganz normales Minus behandeln.
"When one person suffers from a delusion, it is called insanity. When a million people suffer from a delusion, it is called religion." (Richard Dawkins)
  Mit Zitat antworten Zitat
Bjoerk

Registriert seit: 28. Feb 2011
Ort: Mannheim
1.384 Beiträge
 
Delphi 10.4 Sydney
 
#2

AW: Parser: Operatoren

  Alt 13. Apr 2012, 15:34
Bei der Division funzt das allerdings nicht: 2/-3 <> 2/0-3

Wenn du als Grundlage den Parser von Joachim Mohr benutzt, da habe ich das seinerzeit eingearbeitet.
  Mit Zitat antworten Zitat
Medium

Registriert seit: 23. Jan 2008
3.688 Beiträge
 
Delphi 2007 Enterprise
 
#3

AW: Parser: Operatoren

  Alt 13. Apr 2012, 15:56
Doch das geht prima, weil man den "/" eher erkennt als das "-" (Punktrechnung vor Strichrechnung).

So in etwa:
Delphi-Quellcode:
function Parse(s: String): TParseTreeNode;
begin
  if s[1] = '-then s := '0'+s;
  if FindToken('*', s) then
    result := TParseTreeNode.Create(opMul, Parse(PartBeforeToken('*', s)), Parse(PartAfterToken('*', s)))
  else
  if FindToken('/', s) then
    result := TParseTreeNode.Create(opDiv, Parse(PartBeforeToken('*', s)), Parse(PartAfterToken('*', s)))
  else
  if FindToken('+', s) then
    result := TParseTreeNode.Create(opAdd, Parse(PartBeforeToken('*', s)), Parse(PartAfterToken('*', s)))
  else
  if FindToken('-', s) then
    result := TParseTreeNode.Create(opSub, Parse(PartBeforeToken('*', s)), Parse(PartAfterToken('*', s)))
  else
  begin
    try
      result := TParseTreeNode.Create(opConst, StrToFloat(s));
    except
      raise Exception.Create('Grammar Error');
    end;
  end;
end;
Alles was oben im if-then-else-Wurm Steht bindet stärker.

Was die Bools angeht, so habe ich die bei mir nicht separat implementiert, sondern nutze ganz normale Zahlenwerte (0 und 1), womit die Operatoren in den selben Ablauf passen. Verliert etwas Typsicherheit, klappt aber wie ne eins.
"When one person suffers from a delusion, it is called insanity. When a million people suffer from a delusion, it is called religion." (Richard Dawkins)

Geändert von Medium (13. Apr 2012 um 15:59 Uhr)
  Mit Zitat antworten Zitat
Namenloser

Registriert seit: 7. Jun 2006
Ort: Karlsruhe
3.724 Beiträge
 
FreePascal / Lazarus
 
#4

AW: Parser: Operatoren

  Alt 13. Apr 2012, 16:30
Hmm, aber dein Parser sucht „aktiv“ nach Tokens mithilfe von Pos() bzw. einer ähnlichen Funktion, oder? Normalerweise baut man Parser doch als State-Machine auf – dachte ich zumindest (ich habe es jedenfalls immer so gemacht – bin aber auch (noch) kein Informatiker). Wenn man mit einer State-Machine arbeitet, arbeitet man sich ja zeichenweise durch den String, d.h. man kennt an sich ja nur das aktuelle Zeichen und den Zustand des Automaten, weiß aber nicht, was danach kommt (das wäre sonst ein Look-Ahead). [edit]D.h. man kann nicht einfach den ersten Punkt-Operator (*, /) suchen und mitten in den String rein springen und ihn zerteilen Quatsch, aber:[/edit] (und sobald Klammern vorkommen, müsste der Ansatz eigentlich auch versagen).

Aber im Falle des Minus ist der Fall doch eigentlich klar:
  1. Das Minus ist ein Operator, wenn davor ein Bezeichner oder eine Zahl steht.
  2. Das Minus ist ein Vorzeichen, wenn davor ein Operator oder eine Klammer steht.
  3. Mehrere aufeinanderfolgende Vorzeichen werden zu einem einzigen Vorzeichen verschmolzen (je nachdem ob gerade oder ungerade Anzahl).
Zumindest sind diese Regeln bei Parsern so üblich... in der Mathematik ist es ja normalerweise nicht erlaubt, dass Operatoren oder mehrere Vorzeichen aufeinander folgen...

Bei Fakultät und Subfakultät müsste es so ähnlich sein.

Solche Regeln muss man eben finden/festlegen.

Auch wie die interne Klammerung aussieht (um dein Beispiel zu nehmen „(((1 A) A) A 1) oder (1 A (A (A 1)))“) ist von vornherein festgelegt – darum muss sich dein Parser also gar nicht kümmern. Ist deine Sprache linksassoziativ, gilt „(((1 A) A) A 1)“, ist sie rechtsassoziativ, gilt „(1 A (A (A 1)))“.

Geändert von Namenloser (13. Apr 2012 um 16:36 Uhr)
  Mit Zitat antworten Zitat
Bjoerk

Registriert seit: 28. Feb 2011
Ort: Mannheim
1.384 Beiträge
 
Delphi 10.4 Sydney
 
#5

AW: Parser: Operatoren

  Alt 13. Apr 2012, 16:51
Doch das geht prima, weil man den "/" eher erkennt als das "-" (Punktrechnung vor Strichrechnung).
Vorausgesetzt, du macht die Klammern zuerst. Bei (2+3)/(4+5) muß der Parser zuerst die Additionen durchführen.
  Mit Zitat antworten Zitat
Medium

Registriert seit: 23. Jan 2008
3.688 Beiträge
 
Delphi 2007 Enterprise
 
#6

AW: Parser: Operatoren

  Alt 13. Apr 2012, 23:20
Ja, er sucht mittels Pos(), also aktiv. Zudem gibt mir mein FindToken() den ersten Operator zurück, der nicht in Klammern steht, jap. Wird kein OP ausserhalb von Klammern gefunden, fällt meine If-Then-Wurst in einen Zweig if (s[1] = '(') and (s[High(s)] = ')') then result := Parse(copy(s, 2, Length(s)-2)); durch.

Ich hab mit der Technik jetzt ziemlich alle trivialen Dinge abgedeckt: "Normale" Operatoren (^,*,/,+,-), Funktionen mit 1-3 Parametern (sin(), cos(), ...), logische Operatoren (and, or, not, ...) sowie das Vorzeichenminus, Klammerung und Operatorenrang wie in der Mathematik üblich, wobei ich logischen Operatoren noch Vorrang vor diesen gewähre. (Dort ist sogar der ternäre Operator in Form eines IfThen() dabei.)
Unäre Operatoren wären leicht umzusetzen, wenn diese Zeichen dann von Variablen- und Konstantenbezeichnern als Bestandteil ausgeschlossen würden - fände man einen solchen, wird alles bis zum nächsten Operator als Argument aufgefasst, oder via Klammerung eindeutig gemacht. Ähnlich ließe sich mit unären Postfix-Operatoren verfahren, nur eben in die andere Richtung.

Dass dieses Vorgehen nicht unbedingt einem reinen sprachtheoretischen Lexer entspricht stimmt, jedoch ist es schlank, übersichtlich, recht intuitiv und wartbar (auch nach 6-7 Jahren noch, ich hab nämlich die Boolschen OPs erst letzte Woche nachgerüstst, auf einem Stand, den ich zuletzt 2006 gesehen habe glaube ich). Schmankerl sind registrierbare Konstanten und Variablen, letztere als Pointer auf eine Delphi-Variable, so dass sie zur Laufzeit geändert werden können, ohne den String neu parsen zu müssen. Zudem werden alle konstanten Teile des Baumes vorab gelöst und als Konstanten-Blatt eingefügt, so dass diese in dem Fall auch nicht immer wieder erneut aufgelöst werden müssen. Ergo: Das Teil ist sogar richtig flott, gerade bei wiederholter Ausführung der gleichen Formel mit unterschiedlichen Variableninhalten.

Für eine allgemeine, formale Grammatik mag das ggf. nicht taugen. Für logische und mathematische Terme war mir das bisher der angenehmste und universellste Ansatz, der zudem zu einer günstigen Datenstruktur führt.
"When one person suffers from a delusion, it is called insanity. When a million people suffer from a delusion, it is called religion." (Richard Dawkins)
  Mit Zitat antworten Zitat
Furtbichler
(Gast)

n/a Beiträge
 
#7

AW: Parser: Operatoren

  Alt 14. Apr 2012, 08:32
Bei Pascal z.B. betrifft dies den '.' (wie in 7.1) und '..' (wie in [1..2]).
Beim rekursiven parsen in einen Grammatikbaum (Term von aussen nach innen) weiss der Parser, dass er eine eckige Klammer betreten
Na ja. Widerspricht ja nicht dem, was ich geschrieben habe. Du kannst '..' als zwei Zeichen des Alphabets für die Programmiersprache Delphi ansehen, oder als ein Zeichen, entsprechend '(*', '*)' etc. Ich habe das immer als ein Zeichen interpretiert. Aber Scanner und Tokenizer arbeiten so. Z.B. bei C#:

a) int i=j++-++x; // geht
b) int i=j+++++x; // geht nicht

Bei A liefert der Tokenizer: id(int) id(i) symbol(assignment) id(j) symbol(plusplus) symbol(minus) symbol(plusplus) id(x)
Bei B liefert der Tokenizer: id(int) id(i) symbol(assignment) id(j) symbol(plusplus) symbol(plusplus) symbol(plus) id(x)

Würde der Parser das erkennen, wären beide Zeilen kompilierbar. Aber nur die erste Zeile funzt, eben weil der Scanner so blöd ist, und im Fall B die ersten zwei Plus-Paare erkennt. Probier's mal aus.

Hmm, aber dein Parser sucht ...
Ein Parser sicht nicht, ein Parser erkennt nur. Algorithmisch gesehen liefert ein Parser die Antwort auf die Frage: 'Ist diese Zeichenkette ein Satz aus der Grammatik G?'. Den Vorgang des Erkennens kann man nutzen, um einen Syntaxbaum aufzuspannen, über den dann das Compilat erzeugt wird. Algorithmisch gesehen wird jedoch nur ein Satz der Sprache 'A' (Delphi) in einen Satz der Sprache 'B' (Assembler) überführt. Das der Maschinencode semantisch äquivalent zum Quellcode ist, ist Glücksache.
Zitat:
Aber im Falle des Minus ist der Fall doch eigentlich klar:
...
Zumindest sind diese Regeln bei Parsern so üblich...
Diese 'Regeln' ergeben sich implizit über die Grammatik. Für deine letzte Regel ist aber der Tokenizer zuständig;
Zitat:
in der Mathematik ist es ja normalerweise nicht erlaubt, dass Operatoren oder mehrere Vorzeichen aufeinander folgen...
Nein, was ist denn daran nicht erlaubt? "a = 1+-+-+-+-+-2;
Zitat:
Bei Fakultät und Subfakultät müsste es so ähnlich sein.
Das ergibt sich aus deiner Grammatik.
  Mit Zitat antworten Zitat
idefix2

Registriert seit: 17. Mär 2010
Ort: Wien
1.027 Beiträge
 
RAD-Studio 2009 Pro
 
#8

AW: Parser: Operatoren

  Alt 14. Apr 2012, 09:17
Zitat:
Nein, was ist denn daran nicht erlaubt? "a = 1+-+-+-+-+-2;
Was ist bitte daran erlaubt?


Zitat:
Das der Maschinencode semantisch äquivalent zum Quellcode ist, ist Glücksache.
Programmieren ist doch generell Glückssache

Geändert von idefix2 (14. Apr 2012 um 11:22 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von Memnarch
Memnarch

Registriert seit: 24. Sep 2010
737 Beiträge
 
#9

AW: Parser: Operatoren

  Alt 16. Apr 2012, 10:30
In meinem Compiler habe ich rekursives parsen eingebaut. Undzwar wie folgt:

(von oberer zu unterer schicht, niedrigstes level bindet am stärksten):

releation := expression (relop Expression)
expression := Term (+- Term)*
term := factor (*/ Factor)*
factor := Var|Constant|Function call| '(' relation ')'

wenn ich bei Factor vor meinem wert ein '-' finde, weiß ich es ist ein vorzeichen. Die funktionen liefern übrigens bei mir einen Datentyp zurück. So kann ich ich typensicherheit verfolgen


edit @idefix: ich glaib dieses operator gewurschtel ist von delphi erlaubt, finde ich perönlich nicht so schön
Da man Trunc nicht auf einen Integer anwenden kann, muss dieser zuerst in eine Float kopiert werden
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.361 Beiträge
 
Delphi 12 Athens
 
#10

AW: Parser: Operatoren

  Alt 16. Apr 2012, 10:54
edit @idefix: ich glaib dieses operator gewurschtel ist von delphi erlaubt, finde ich perönlich nicht so schön
Meinst du das 1+-+-+-+-+-2 ?

Wenn man klammern setzt, dann läßt sich erkennen, daß es damit eigentlich keine Probleme geben sollte.
1+(-(+(-(+(-(+(-(+(-2)))))))))



Man könnte aber auch einfach die Plus/Minus zählen und entsprechend handeln.
So mach ich das in meinem Billigparser.

Das erste Plus Der erste Operator ist die Rechenoperator
und die +/- danach sind das Vorzeichen.
* alle Plus (Vorzeichen) werden stur ignoriert (da eh ohne Wirkung)
* die Minus werden gezählt ... bei einer ungeraden Anzahl ist es ein "-" und bei einer geraden Anzahl ein ignorierbares "+".

1+(-+-+-+-+-2) ergibt dann ein 1+(-- -- -2) , also 1+(-2)
Ein Therapeut entspricht 1024 Gigapeut.

Geändert von himitsu (16. Apr 2012 um 11:03 Uhr)
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 1 von 2  1 2   

Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Ansicht

Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 15:04 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz