Extremwert
In der Mathematik ist ein Extremwert (oder Extremum; Plural: Extrema) der Oberbegriff für ein lokales beziehungsweise globales Maximum oder Minimum. Ein lokales Maximum ist der Wert der Funktion an einer Stelle x{displaystyle x}, in deren Umgebung die Funktion keine größeren Werte annimmt. Die zugehörige Stelle x{displaystyle x} wird lokaler Maximierer/Minimierer oder Extremstelle (Maximalstelle/Minimalstelle) genannt, die Kombination aus Stelle und Wert Extrempunkt.
Ein globales Maximum wird auch absolutes Maximum genannt, für ein lokales Maximum wird auch der Begriff relatives Maximum gebraucht. Lokale und globale Minima sind analog definiert.
Die Lösung einer Extremwertaufgabe, für eine einfache Darstellung siehe Kurvendiskussion, nennt man die extremale Lösung.
Inhaltsverzeichnis
1 Eindimensionaler Fall
1.1 Formale Definition
1.2 Existenz von Extrema
1.3 Bestimmung von Extremstellen differenzierbarer Funktionen
1.3.1 Notwendiges Kriterium
1.3.2 Hinreichende Kriterien
1.4 Beispiele
1.5 Anwendungsbeispiel
2 Mehrdimensionaler Fall
3 Unendlichdimensionaler Fall
3.1 Definition
3.2 Existenz, Eindeutigkeit und Geometrie von Extrema
3.2.1 Existenz
3.2.2 Eindeutigkeit
3.2.3 Geometrie
4 Andere Extremwerte
4.1 Diskrete Optimierung
4.2 Variationsrechnung
5 Siehe auch
6 Weblinks
7 Einzelnachweise
Eindimensionaler Fall |
Formale Definition |
Es sei U⊆R{displaystyle Usubseteq mathbb {R} } eine Teilmenge der reellen Zahlen (z. B. ein Intervall) und f:U→R{displaystyle fcolon Uto mathbb {R} } eine Funktion.
f{displaystyle f} hat an der Stelle x0∈U{displaystyle x_{0}in U}
- ein lokales Minimum, wenn es ein Intervall I=(a,b){displaystyle I=(a,b)} gibt, das x0{displaystyle x_{0}} enthält, so dass f(x0)≤f(x){displaystyle f(x_{0})leq f(x)} für alle x∈I∩U{displaystyle xin Icap U} gilt;
- ein globales Minimum, wenn f(x0)≤f(x){displaystyle f(x_{0})leq f(x)} für alle x∈U{displaystyle xin U} gilt;
- ein lokales Maximum, wenn es ein Intervall I=(a,b){displaystyle I=(a,b)} gibt, das x0{displaystyle x_{0}} enthält, so dass f(x0)≥f(x){displaystyle f(x_{0})geq f(x)} für alle x∈I∩U{displaystyle xin Icap U} gilt;
- ein globales Maximum, wenn f(x0)≥f(x){displaystyle f(x_{0})geq f(x)} für alle x∈U{displaystyle xin U} gilt.
Besitzt die Funktion an der Stelle x0{displaystyle x_{0}} ein Maximum, so nennt man den Punkt (x0,f(x0)){displaystyle (x_{0},f(x_{0}))} Hochpunkt, hat sie dort ein Minimum, so heißt der Punkt Tiefpunkt. Liegt entweder ein Hoch- oder ein Tiefpunkt vor, so spricht man von einem Extrempunkt.
Existenz von Extrema |
Ist f:[a,b]→R{displaystyle fcolon [a,b]to mathbb {R} } eine stetige Funktion und [a,b]{displaystyle [a,b]} eine kompakte Menge, so nimmt f{displaystyle f} auf [a,b]{displaystyle [a,b]} sein globales Maximum und sein globales Minimum an. Diese können auch in den Randpunkten a{displaystyle a} oder b{displaystyle b} angenommen werden.
Diese Aussage folgt aus dem Satz von Heine-Borel, wird aber oft auch nach K. Weierstraß oder B. Bolzano benannt oder als Satz vom Maximum und Minimum bezeichnet.
Bestimmung von Extremstellen differenzierbarer Funktionen |
Es sei U⊆R{displaystyle Usubseteq mathbb {R} } offen, und f:U→R{displaystyle fcolon Uto mathbb {R} } eine differenzierbare Funktion.
Notwendiges Kriterium |
Hat f{displaystyle f} an einer Stelle x0∈U{displaystyle x_{0}in U} ein lokales Extremum und ist dort differenzierbar, so ist dort die erste Ableitung gleich null:
f′(x0)=0{displaystyle f'(x_{0})=0,}.
Hinreichende Kriterien |
- Ist f{displaystyle f} zweimal differenzierbar, und gilt neben f′(x0)=0{displaystyle f'(x_{0})=0,} auch f″(x0)≠0{displaystyle f''(x_{0})neq 0,}, so hat f{displaystyle f} an der Stelle x0{displaystyle x_{0}} ein lokales Extremum. Ist f′(x0)=0{displaystyle f'(x_{0})=0,} und f″(x0)>0{displaystyle f''(x_{0})>0,}, handelt es sich dabei um ein lokales Minimum, für f″(x0)<0{displaystyle f''(x_{0})<0,} dagegen um ein lokales Maximum.
- Allgemeiner dagegen und mittels Entwicklung von f{displaystyle f} gemäß der Taylor-Formel[1] herleitbar gilt: Ist f{displaystyle f} n-mal ableitbar und dabei
- f′(x0)=f″(x0)=…=f(n−1)(x0)=0∧f(n)(x0)≠0,{displaystyle f'(x_{0})=f''(x_{0})=ldots =f^{(n-1)}(x_{0})=0,wedge f^{(n)}(x_{0})neq 0,}
- so folgt daraus:
- (1) Ist n{displaystyle n} gerade sowie f(n)(x0)<0{displaystyle f^{(n)}(x_{0})<0} (bzw. f(n)(x0)>0{displaystyle f^{(n)}(x_{0})>0}), so hat f{displaystyle f} damit bei x0{displaystyle x_{0}} ein relatives Maximum (bzw. Minimum).
- (2) Ist n{displaystyle n} hingegen ungerade, so hat f{displaystyle f} bei x0{displaystyle x_{0}} kein lokales Extremum (des Funktionswerts, sondern eines des Anstiegs, also eine Wendestelle).
- Oder ganz allgemein formuliert: Ist die erste von Null verschiedene Ableitung f(n){displaystyle f^{(n)}} der Funktion f{displaystyle f} an der Stelle x0{displaystyle x_{0}}, an der f′(x0)=0{displaystyle f'(x_{0})=0} ist, eine Ableitung gerader Ordnung, so besitzt f{displaystyle f} damit an dieser Stelle einen Extrempunkt, wobei eine von Null verschiedene Ableitung f(n)>0{displaystyle f^{(n)}>0} für ein Minimum, eine Ableitung f(n)<0{displaystyle f^{(n)}<0} dagegen für ein Maximum steht. (Man vergleiche hierzu Funktionen der Form: f(x)=xn{displaystyle f(x)=x^{n}}, n∈N{displaystyle nin mathbb {N} }.)
- Hat die erste Ableitung bei x0{displaystyle x_{0}} einen Vorzeichenwechsel, so liegt ein Extremum vor. Bei einem Vorzeichenwechsel von Plus nach Minus handelt es sich um ein Maximum, bei einem Vorzeichenwechsel von Minus nach Plus um ein Minimum.
- Für stetige Funktionen auf Intervallen gilt: Zwischen zwei lokalen Minima einer Funktion liegt stets ein lokales Maximum, und zwischen zwei lokalen Maxima liegt stets ein lokales Minimum.
- Für differenzierbare Funktionen auf Intervallen gilt: Gibt es zwei Stellen a,b{displaystyle a,b} mit a<x0<b{displaystyle a<x_{0}<b}, so dass die erste Ableitung im Intervall (a,b){displaystyle (a,b)} nur die Nullstelle x0{displaystyle x_{0}} hat, und ist f(a)>f(x0){displaystyle f(a)>f(x_{0})} sowie f(b)>f(x0){displaystyle f(b)>f(x_{0})}, so hat f{displaystyle f} bei x0{displaystyle x_{0}} ein lokales Minimum. Gilt die analoge Bedingung mit f(a)<f(x0){displaystyle f(a)<f(x_{0})} und f(b)<f(x0){displaystyle f(b)<f(x_{0})}, so hat f{displaystyle f} bei x0{displaystyle x_{0}} ein lokales Maximum.
Es gibt allerdings auch Funktionen, bei denen keines der og. Kriterien weiterhilft (s. u.).
Beispiele |
f(x)=x2+3.{displaystyle f(x)=x^{2}+3.} Die erste Ableitung f′(x)=2x{displaystyle f'(x)=2x} hat nur bei x0=0{displaystyle x_{0}=0} eine Nullstelle. Die zweite Ableitung f″(x)=2{displaystyle f''(x)=2} ist dort positiv, also nimmt f{displaystyle f} bei 0 ein lokales Minimum an, nämlich f(0)=3{displaystyle f(0)=3}.
f(x)=x4+3.{displaystyle f(x)=x^{4}+3.} Die erste Ableitung f′(x)=4x3{displaystyle f'(x)=4x^{3}} hat nur bei x0=0{displaystyle x_{0}=0} eine Nullstelle. Die zweite Ableitung f″(x)=12x2{displaystyle f''(x)=12x^{2}} ist dort ebenfalls 0. Man kann nun auf verschiedene Arten fortfahren:
- Auch die dritte Ableitung f‴(x)=24x{displaystyle f'''(x)=24x} ist dort 0. Die vierte Ableitung hingegen ist mit f(4)(x)=24{displaystyle f^{(4)}(x)=24} die erste höhere Ableitung, die nicht 0 ist. Da diese Ableitung einen positiven Wert hat und gerade ist, gilt nach (1), dass die Funktion dort ein lokales Minimum besitzt.
- Die erste Ableitung hat bei 0 einen Vorzeichenwechsel von Minus nach Plus, also hat f{displaystyle f} bei x0=0{displaystyle x_{0}=0} ein lokales Minimum.
- Es ist f(−1)=f(1)=4>3=f(0){displaystyle f(-1)=f(1)=4>3=f(0)}, also hat f{displaystyle f} im Intervall (−1,1){displaystyle (-1,1)} ein lokales Minimum. Da die erste Ableitung in diesem Intervall nur die Nullstelle x0=0{displaystyle x_{0}=0} hat, muss das lokale Minimum dort angenommen werden.
- Die Funktion, die durch f(x)=e−1/x2sin21x2{displaystyle f(x)=mathrm {e} ^{-1/x^{2}}sin ^{2}{frac {1}{x^{2}}}} für x≠0{displaystyle xneq 0} und durch f(0)=0{displaystyle f(0)=0} definiert ist, hat die folgenden Eigenschaften:
- Sie hat bei x=0{displaystyle x=0} ein globales Minimum.
- Sie ist beliebig oft differenzierbar.
- Alle Ableitungen bei x=0{displaystyle x=0} sind gleich 0.
- Die erste Ableitung hat keinen Vorzeichenwechsel bei 0.
- Auch die anderen beiden oben genannten Kriterien sind nicht anwendbar.
Anwendungsbeispiel |
In der Praxis können Extremwert-Berechnungen zur Berechnung von größt- oder kleinstmöglichen Vorgaben verwendet werden, wie das folgende Beispiel zeigt (siehe auch Optimierungsproblem):
- Wie muss eine rechteckige Fläche aussehen, die bei einem bestimmten Umfang eine maximale Fläche hat?
Lösungsweg:
Der Umfang U{displaystyle U} ist konstant, die Fläche A{displaystyle A} soll maximiert werden, a{displaystyle a} ist die Länge und b{displaystyle b} die Breite:
- 1)U=2(a+b)⇒b=U2−a{displaystyle 1)qquad U=2(a+b)Rightarrow b={frac {U}{2}}-a}
- 2)A=a⋅b{displaystyle 2)qquad A=acdot b}
1) in 2) einsetzen und umformen
- A(a)=−a2+12Ua{displaystyle A(a)=-a^{2}+{frac {1}{2}}Ua}
Ableitungsfunktionen bilden
- A′(a)=−2a+12U{displaystyle A'(a)=-2a+{frac {1}{2}}U}
A″(a)=−2⇒{displaystyle A''(a)=-2qquad Rightarrow } Hochpunkt der Funktion
Es gibt nur ein lokales Maximum, das in dem vorliegenden Beispiel (ohne Nachweis) zugleich auch das globale Maximum ist, da die zweite Ableitung unabhängig von der Variablen immer kleiner als Null ist.
Um einen Extremwert zu finden, muss die erste Ableitung gleich Null gesetzt werden (da diese die Steigung der ursprünglichen Funktion beschreibt und diese Steigung bei Extremwerten Null ist. Ist die zweite Ableitung der Funktion ungleich Null, so liegt ein Minimum oder Maximum vor).
- A′(a)=−2a+12U=0⇒{displaystyle A'(a)=-2a+{frac {1}{2}}U=0Rightarrow }
- a=14U ⇒ U=4a{displaystyle a={frac {1}{4}}U Rightarrow U=4a}
Einsetzen in 1)
- 4a=2(a+b) ⇒ a=b{displaystyle 4a=2(a+b) Rightarrow a=b}
Es folgt daraus, dass der größtmögliche Flächeninhalt eines Rechtecks bei vorgegebenen Umfang dann zu erzielen ist, wenn beide Seitenlängen gleich sind (was einem Quadrat entspricht).
Umgekehrt lässt sich aber auch sagen, dass ein Rechteck mit vorgegebenem Flächeninhalt den geringsten Umfang aufweist, wenn sich
- a:b=1:1{displaystyle a:b=1:1}
verhalten – also bei einem Quadrat.
Mehrdimensionaler Fall |
Es sei U⊆Rn{displaystyle Usubseteq mathbb {R} ^{n}} und f:U→R{displaystyle fcolon Uto mathbb {R} } eine Funktion. Weiterhin sei x{displaystyle x} ein innerer Punkt von U{displaystyle U}. Ein lokales Minimum/Maximum in x{displaystyle x} ist dann gegeben, wenn eine Umgebung um x{displaystyle x} existiert, in welcher kein Punkt einen kleineren bzw. größeren Funktionswert annimmt.
Analog zum eindimensionalen Fall ist das Verschwinden des Gradienten
- Df(x)=gradf(x){displaystyle Df(x)=operatorname {grad} f(x)}
eine notwendige Bedingung dafür, dass f{displaystyle f} im Punkt x{displaystyle x} ein Extremum annimmt. Hinreichend ist in diesem Fall die Definitheit der Hesse-Matrix D2f(x){displaystyle D^{2}f(x)}: ist sie positiv definit, liegt ein lokales Minimum vor; ist sie negativ definit, handelt es sich um ein lokales Maximum; ist sie indefinit, liegt kein Extrempunkt, sondern ein Sattelpunkt vor. Wenn sie nur semidefinit ist, ist keine Entscheidung anhand der Hesse-Matrix möglich.
Unendlichdimensionaler Fall |
Definition |
Der Begriff des Maximums und des Minimums überträgt sich direkt auf den unendlichdimensionalen Fall. Ist X{displaystyle X} ein Vektorraum und D⊂X{displaystyle Dsubset X} eine Teilmenge dieses Vektorraumes sowie f:D→R{displaystyle fcolon Dto mathbb {R} } ein Funktional. Dann hat f{displaystyle f} an der Stelle x~∈D{displaystyle {tilde {x}}in D}
- ein (globales) Minimum, wenn f(x~)≤f(x){displaystyle f({tilde {x}})leq f(x)} für alle x∈D{displaystyle xin D}
- ein (globales) Maximum, wenn f(x~)≥f(x){displaystyle f({tilde {x}})geq f(x)} für alle x∈D{displaystyle xin D}
Der Zusatz „globales“ wird meist weggelassen, wenn aus dem Zusammenhang klar ist, was gemeint ist. Ist X{displaystyle X} zusätzlich mit einer Topologie versehen, also ein topologischer Raum, dann hat f{displaystyle f} an der Stelle x~∈D{displaystyle {tilde {x}}in D}
- ein lokales Minimum, wenn es eine Umgebung U{displaystyle U} von x~{displaystyle {tilde {x}}} gibt, so dass f(x~)≤f(x){displaystyle f({tilde {x}})leq f(x)} für alle x∈U∩D{displaystyle xin Ucap D} gilt.
- ein lokales Maximum, wenn es eine Umgebung U{displaystyle U} von x~{displaystyle {tilde {x}}} gibt, so dass f(x~)≥f(x){displaystyle f({tilde {x}})geq f(x)} für alle x∈U∩D{displaystyle xin Ucap D} gilt.
Ein Punkt heißt ein (lokales) Extremum, wenn er ein (lokales) Minimum oder ein (lokales) Maximum ist. Jedes globale Minimum (Maximum) ist ein lokales Minimum (Maximum).
Existenz, Eindeutigkeit und Geometrie von Extrema |
Existenz |
Entsprechend den Existenzaussagen für reelle Funktionen gibt es auch Aussagen für die Existenz von Extremalstellen von Funktionalen. Ist X{displaystyle X} ein normierter Raum, so gilt:
- Ein schwach unterhalbstetiges Funktional auf einer schwach folgenkompakten Menge nimmt dort ihr Minimum an.
Da diese Version für die Anwendung und Überprüfung oft unpraktisch ist, schwächt man dies ab zu der Aussage, dass jedes stetige quasikonvexe Funktional auf einer beschränkten, konvexen und abgeschlossenen Teilmenge eines reflexiven Banachraums ein Minimum annimmt. Diese Aussage gilt auch für alle konvexen Funktionale, da diese immer quasikonvex sind. Im Endlichdimensionalen kann auf die Konvexität der Teilmenge verzichtet werden.
Eindeutigkeit |
Unter gewissen Umständen sind die Optimalpunkte sogar eindeutig bestimmt. Dazu gehört zum Beispiel die strikte Konvexität.
Geometrie |
Schränkt man sich auf gewisse Klassen von Funktionalen ein, so kann man Aussagen über die Geometrie der Menge der Extremalpunkte treffen.
- Ist das Funktional quasikonvex auf einer konvexen Menge, so ist die Menge der Minima konvex.
- Ist das Funktional quasikonkav auf einer konvexen Menge, so ist die Menge der Maxima konvex.
- Ist das Funktional konvex auf einer konvexen Menge, so ist jedes lokale Minimum ein globales Minimum.
- Ist das Funktional konkav auf einer konvexen Menge, so ist jedes lokale Maximum ein globales Maximum.
Andere Extremwerte |
Diskrete Optimierung |
Bei diskreten Optimierungsproblemen ist der oben definierte Begriff des lokalen Extremums nicht geeignet, da in jedem Punkt ein lokales Extremum in diesem Sinne vorliegt. Für Extrema einer Funktion f:D→R{displaystyle fcolon Dto mathbb {R} } wird daher ein anderer Umgebungsbegriff verwendet: Man benutzt eine Nachbarschaftsfunktion N{displaystyle N}, die jedem Punkt die Menge seiner Nachbarn zuordnet,
- N:D→P(D);{displaystyle Ncolon Dto {mathcal {P}}(D);}
dabei steht P(D){displaystyle {mathcal {P}}(D)} für die Potenzmenge von D{displaystyle D}.
f{displaystyle f} hat dann ein lokales Maximum in einem Punkt x0∈D{displaystyle x_{0}in D}, wenn f(x)≤f(x0){displaystyle f(x)leq f(x_{0})} für alle Nachbarn x∈N(x0){displaystyle xin N(x_{0})} gilt. Lokale Minima sind analog definiert.
Variationsrechnung |
Extremwerte von Funktionen, deren Argumente selbst Funktionen sind, z. B. die Kontur eines Regentropfens mit minimalem Luftwiderstand, sind Gegenstand der Variationsrechnung.
Siehe auch |
- Optimum
- arg max
- Maximumprinzip
Weblinks |
Wiktionary: Extremwert – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen
- Extremwerte (erklärt für Schüler)
Einzelnachweise |
↑ W. Gellert, H. Küstner, M. Hellwich, H. Kästner: Kleine Enzyklopädie Mathematik. Leipzig 1970, S. 433–434.