AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Multimedia Delphi Gaußsches Weichzeichen
Thema durchsuchen
Ansicht
Themen-Optionen

Gaußsches Weichzeichen

Ein Thema von Neutral General · begonnen am 6. Mai 2010 · letzter Beitrag vom 7. Mai 2010
Antwort Antwort
Benutzerbild von Neutral General
Neutral General

Registriert seit: 16. Jan 2004
Ort: Bendorf
5.219 Beiträge
 
Delphi 10.2 Tokyo Professional
 
#1

Gaußsches Weichzeichen

  Alt 6. Mai 2010, 15:16
Hallo,

Hab jetzt gestern mal den Gaußschen Algorithmus implementiert. Das funktioniert soweit auch schon ganz gut. Ich bin nur etwas verwirrt, bzw. habe evtl. noch ein kleines Verständnisproblem.

Habe eine 5x5 Matrix genutzt (Sigma = 1). Das Ergebnis ist jetzt das gleiche wie in Photoshop wenn ich "Gaussian Blur" verwende mit dem Radius von 1 Pixel. Aber warum 1 Pixel? Bei einer 5x5 Matrix ist jeder Pixel doch von 2 "Reihen" Pixel umgeben (=> Radius = 2 ?!)

xxxxx
xxxxx
xxoxx
xxxxx
xxxxx

Oder verstehe ich da was falsch?

Dann die andere Sache... Gibt das Sigma die (ich nenne es mal) "Intensität" der Verteilung an?

Gruß
Neutral General
Michael
"Programmers talk about software development on weekends, vacations, and over meals not because they lack imagination,
but because their imagination reveals worlds that others cannot see."
  Mit Zitat antworten Zitat
Medium

Registriert seit: 23. Jan 2008
3.686 Beiträge
 
Delphi 2007 Enterprise
 
#2

Re: Gaußsches Weichzeichen

  Alt 6. Mai 2010, 15:39
Da müssen wir ein klein wenig in die Statistik reisen, denn dort ist die Guaß'sche Glockenkurve beheimatet. Das Dingen mit der Gauß-Kurve ist, dass sie bei 0 ihr Maximum hat, und nach -/+ in X-Richtung abfällt - sie wird aber nie Y=0. Daher müsste der Kernel genau genommen unendlich groß sein! Da das aber nicht wirklich praktikabel ist, und man sich gerade bei diskreten Werten den sehr kleinen Beitrag weit entfernter Werte schenken kann, ohne dass man es wirklich sieht, legt man den Kernelradius oft auf Sigma*3, womit 99,73% des Gesamtbeitrages abgedeckt sind. Das ist für fast alle Anwendungen genau genug.

Jetzt das Sigma. Das ist schon schwieriger, da es den statistischen Begriff der Standardabweichung beschreibt, und mit "Radius" im Hinterkopf schwer erklärbar ist. Der Wikipedia Artikel schafft da evtl. etwas Klarheit.

Dein Kernelradius von 2 könnte daher kommen, dass bei r=Sigma*2 auch schon >95% abgedeckt sind, was idR auch schon gut genug ist.

Und noch eine Kleinigkeit: Hast du in deinem Kernel alle Werte gleichen Pixelabstandes identisch (was deine Färbung suggeriert)? Wenn ja, ist das auch wieder nur eine grobe Näherung. Der Gauß-Kernel ist eigentlich radial, und entspricht der Zweidimensionalen Normalverteilung.
"When one person suffers from a delusion, it is called insanity. When a million people suffer from a delusion, it is called religion." (Richard Dawkins)
  Mit Zitat antworten Zitat
Benutzerbild von Neutral General
Neutral General

Registriert seit: 16. Jan 2004
Ort: Bendorf
5.219 Beiträge
 
Delphi 10.2 Tokyo Professional
 
#3

Re: Gaußsches Weichzeichen

  Alt 6. Mai 2010, 16:07
Hi,

Danke schonmal für die Antwort

Ich werde hier mal mein aktualisiertes Verständnis von der Sache niederschreiben und es wäre nett, wenn du mir dann sagen könntest, ob ich der Sache schon näher gekommen bin^^. Nachdem ich ein bisschen mit einem 3D-Funktionsplotter rumexperimentiert habe bin ich zu folgender (hoffentlich richtigen) Erkenntnis gekommen:

Das Sigma gibt, wie du sagtest, die Standardabweichung an. Praktisch also die "Streuung" der Werte. Streuung ist ein guter Begriff glaube ich. Ich dachte gerade an Egoshooter... Wenn man dort mit verschiedenen Waffen auf 1 Punkt zielt, dann streuen die auch unterschiedlich stark. D.h. sogesehen hätte eine Pistole eine geringe Standardabweichung (ein kleines Sigma) und ein großes Maschienengewehr hat demnach eine sehr große Streuung, also eine große Standardabweichung (ein großes Sigma).
Der grad der Streuung (also die Standardabweichung) ist in diesem konkreten Fall quasi der Blur-Radius.

Die Kernelgröße hat also erstmal nichts mit dem Radius selbst zu tun, sondern ist quasi nur eine Art "Fenster", was vergrößert werden muss, wenn die Standardabweichung steigt, damit die größere Streuung noch erfasst werden kann (also in die Berechnung einfließen kann).

D.h. der Kernel könnte theoretisch unendlich groß sein. Wenn Sigma klein ist, dann ist der Blur-Radius ebenso gering. Abgesehen davon, dass der Kernel theoretisch unendlich groß sein müsste, weil die Gaußfunktion sich zwar 0 annährt aber nie 0 wird. D.h. man hat nie ein 100%ig genaues Weichzeichnen. Was aber auch nicht tragisch ist

Hab ich das so richtig verstanden?
Michael
"Programmers talk about software development on weekends, vacations, and over meals not because they lack imagination,
but because their imagination reveals worlds that others cannot see."
  Mit Zitat antworten Zitat
Medium

Registriert seit: 23. Jan 2008
3.686 Beiträge
 
Delphi 2007 Enterprise
 
#4

Re: Gaußsches Weichzeichen

  Alt 6. Mai 2010, 16:39
Klingt so weit alles gut (Auf die Idee, das mit Waffengewalt zu erklären, wäre ich jetzt spontan nicht gekommen )
"When one person suffers from a delusion, it is called insanity. When a million people suffer from a delusion, it is called religion." (Richard Dawkins)
  Mit Zitat antworten Zitat
Benutzerbild von Neutral General
Neutral General

Registriert seit: 16. Jan 2004
Ort: Bendorf
5.219 Beiträge
 
Delphi 10.2 Tokyo Professional
 
#5

Re: Gaußsches Weichzeichen

  Alt 6. Mai 2010, 16:46
Zitat von Medium:
Klingt so weit alles gut
Super Hätte nicht gedacht, dass ich das so schnell verstehe als ich deinen Beitrag das 1. mal gelesen hatte.

Zitat von Medium:
Auf die Idee, das mit Waffengewalt zu erklären, wäre ich jetzt spontan nicht gekommen
Bin da auch nur irgendwie während dem Schreiben meines Beitrags drauf gekommen
Michael
"Programmers talk about software development on weekends, vacations, and over meals not because they lack imagination,
but because their imagination reveals worlds that others cannot see."
  Mit Zitat antworten Zitat
Benutzerbild von Neutral General
Neutral General

Registriert seit: 16. Jan 2004
Ort: Bendorf
5.219 Beiträge
 
Delphi 10.2 Tokyo Professional
 
#6

Re: Gaußsches Weichzeichen

  Alt 7. Mai 2010, 09:42
Hallo,

Habe gestern noch ein bisschen rumprogrammiert und bin an ein Problem geraten. Für Sigma > 1 werden die Werte in der Matrix sehr schnell zu klein, bzw. extrem. Ich benutze schon den Datentyp Extended, aber bei Werten in der Gegend von 10^30 bis 10^-80 ist das trotzdem sone Sache und das Ergebnis sieht dann etwas.. nunja.. es sieht nach Rundungsfehlern und Ungenauigkeit aus.

Vielleicht stehe ich grad nur aufm Schlauch, aber ich weiß grad nicht wie ich dieses Problem umgehen kann
Michael
"Programmers talk about software development on weekends, vacations, and over meals not because they lack imagination,
but because their imagination reveals worlds that others cannot see."
  Mit Zitat antworten Zitat
Medium

Registriert seit: 23. Jan 2008
3.686 Beiträge
 
Delphi 2007 Enterprise
 
#7

Re: Gaußsches Weichzeichen

  Alt 7. Mai 2010, 12:00
Ich vermute da einen Fehler in deiner Berechnung. Bei wachsendem Sigma flacht die Glockenkurve ab, d.h. weiter von 0 entfernten X-Werten sollte ein größerer Y-Wert zugeteilt werden als bei kleineren Sigmas. Bei Sigma>1 spätestens darf niemals ein Wert > 1 für ein Element raus kommen. Der Sinn des ganzen ist ja, dass das Integral unter der gesamten Kurve 1 ist, was ja kleinere Y-Werte bedeutet, je größer die Streuung ist. (Weniger Kugeln treffen die Wand auf gleich bleibender Fläche )

Wenn nach aussen zu kleine Werte auftreten, ist das ein Zeichen für einen zu großen Kernel.

Üblicherweise bewegen sich die einzelnen Werte im Kernel so grob zwischen 0,05 und 0,4. Wirklich sehr grob, da ja stark vom Sigma abhängig, aber das ist in etwa die Größenordnung. Keinesfalls 10^30, und schon garnicht 10^-80

Edit: Hier mal ein Gauss aus einem aktuellen Projekt. Ist nun zwar ein HLSL-Shader, aber die Mathematik bleibt ja gleich.
Code:
void ps_Gauss3_Y(in v2p IN, out p2f OUT)
{
   IN.tex.xy += rcpXY*0.5;
   float k = 0.39894228; // = 1 / (phi*sqrt(2*PI)); phi=1 (radius=3)
   
   OUT.color.agb = (float3)0;
   
   OUT.color.r =
      tex2D(sBase, IN.tex.xy-SY*3).r * k * exp(-4.5) +
      tex2D(sBase, IN.tex.xy-SY*2).r * k * exp(-2.0) +
      tex2D(sBase, IN.tex.xy-SY*1).r * k * exp(-0.5) +
      tex2D(sBase, IN.tex.xy    ).r * k            +
      tex2D(sBase, IN.tex.xy+SY*1).r * k * exp(-0.5) +
      tex2D(sBase, IN.tex.xy+SY*2).r * k * exp(-2.0) +
      tex2D(sBase, IN.tex.xy+SY*3).r * k * exp(-4.5);
}

void ps_Gauss3_X(in v2p IN, out p2f OUT)
{
   IN.tex.xy += rcpXY*0.5;
   float k = 0.39894228; // = 1 / (phi*sqrt(2*PI)); phi=1 (radius=3)
   
   OUT.color.agb = (float3)0;
   
   OUT.color.r =
      tex2D(sBase, IN.tex.xy-SX*3).r * k * exp(-4.5) +
      tex2D(sBase, IN.tex.xy-SX*2).r * k * exp(-2.0) +
      tex2D(sBase, IN.tex.xy-SX*1).r * k * exp(-0.5) +
      tex2D(sBase, IN.tex.xy    ).r * k            +
      tex2D(sBase, IN.tex.xy+SX*1).r * k * exp(-0.5) +
      tex2D(sBase, IN.tex.xy+SX*2).r * k * exp(-2.0) +
      tex2D(sBase, IN.tex.xy+SX*3).r * k * exp(-4.5);
}
Das ist nun auch noch etwas optimiert, da es in zwei Passes läuft. Erst wird das Bild in Y-Richtung "gegausst", dann in X-Richtung. Spart nen Haufen Zeit. Zudem ist hier Sigma=1 fix (und heisst komischerweise phi, oops). Die Formel für einen Pass wäre hier also:
Pixel[x, y] = Summe(n=-3; n<4; Pixel[x, y+n] * 1/(phi * sqrt(2*PI)) * exp(-(0.5*n²/phi)))
Das ganze läuft dann über komplett x und y (das ganze Bild), und dann der ganze Spaß auf dem Ergebnis davon noch ein mal, aber diesmal mit:
Pixel[x, y] = Summe(n=-3; n<4; Pixel[x+n, y] * 1/(phi * sqrt(2*PI)) * exp(-(0.5*n²/phi)))
"When one person suffers from a delusion, it is called insanity. When a million people suffer from a delusion, it is called religion." (Richard Dawkins)
  Mit Zitat antworten Zitat
Benutzerbild von Neutral General
Neutral General

Registriert seit: 16. Jan 2004
Ort: Bendorf
5.219 Beiträge
 
Delphi 10.2 Tokyo Professional
 
#8

Re: Gaußsches Weichzeichen

  Alt 7. Mai 2010, 13:40
Ich bin gerade nicht zu Hause und kann mich jetzt nicht so sehr damit beschäftigen aber kann es sein, dass du eine etwas andere Formel hast?

Ich habe die aus Wikipedia: http://upload.wikimedia.org/math/5/b...08057e1cac.png

Deine Formel sieht da ja etwas anders aus (Mal abgesehn davon, dass du 2x 1 Dimension berechnest und nicht 1x 2D, aber das Prinzip ist ja das gleiche):

Zitat:
1/(phi * sqrt(2*PI)) * exp(-(0.5*n²/phi)))
(du quadrierst Sigma (phi) nie und die Wurzel im Nenner des Faktors von e ist anders gesetzt)
Michael
"Programmers talk about software development on weekends, vacations, and over meals not because they lack imagination,
but because their imagination reveals worlds that others cannot see."
  Mit Zitat antworten Zitat
Medium

Registriert seit: 23. Jan 2008
3.686 Beiträge
 
Delphi 2007 Enterprise
 
#9

Re: Gaußsches Weichzeichen

  Alt 7. Mai 2010, 14:30
Die Quadrierung kann sehr gut aus der Umwandlung in eine 2D Funktion stammen, die Wurzel mutet da schon etwas anders an, kann aber auch sein - grad nicht den Drive das genau nachzustellen .

Aber ich würde so oder so empfehlen die 2-Pass Variante zu nehmen, da du dann nicht w*h*n², sondern nur noch 2*(w*h*n) Berechnungen anstellen musst (n=Kantenlänge des Kernels). Bei einem Bild der Größe 800x600 und einem 5x5 Kernel wären das 12.000.000 zu 4.800.000 (-60%), bei 7x7 schon 23.520.000 zu 6.720.000 (-71%) an Rechenaufwand.

Und ich weiss, dass mein Ergebnis richtig ist mit der 1D-Formel, auch bei anderen Sigmas (Ich meine mich dunkel dran erinnern zu können, mit der 2D-Formel ausser Wikipedia auch schon mal Probleme gehabt zu haben, was aber durch die Splittung in 2 Pässe gegessen war, und keiner Lösung mehr bedurfte.)
"When one person suffers from a delusion, it is called insanity. When a million people suffer from a delusion, it is called religion." (Richard Dawkins)
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 01:44 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz