Blame

e63e3e Štěpán Zapadlo 2026-03-28 10:17:16
Fix display math
1
# Nutné a postačující podmínky optimality
2
3
<div style="visibility:hidden;height:0;overflow:hidden;margin:0;padding:0">
4
5
```math
6
\newcommand{\LetThereBe}[2]{\newcommand{#1}{#2}} \newcommand{\letThereBe}[3]{\newcommand{#1}[#2]{#3}}
7
\letThereBe{\addTag}{2}{\cssId{#1-#2}{\tag{#2}}} \letThereBe{\addLabel}{2}{\cssId{#1-#2}{\text{#2}}} \letThereBe{\refTag}{2}{\href{###1-#2}{(\text{#2})}}
8
\letThereBe{\eqT}{1}{\addTag{eq}{#1}}\letThereBe{\secT}{1}{\addLabel{sec}{#1}}
9
\letThereBe{\eqRef}{1}{\refTag{eq}{#1}} \letThereBe{\secRef}{1}{\refTag{sec}{#1}}
10
\LetThereBe{\R}{\mathbb{R}} \LetThereBe{\N}{\mathbb{N}}
11
\letThereBe{\rcases}{1}{\left.\begin{align}#1\end{align}\right\}}
12
\letThereBe{\rcasesAt}{2}{\left.\begin{alignat}{#1}#2\end{alignat}\right\}}
13
\letThereBe{\lcases}{1}{\begin{cases}#1\end{cases}}
14
\letThereBe{\lcasesAt}{2}{\left\{\begin{alignat}{#1}#2\end{alignat}\right.}
15
\letThereBe{\scal}{2}{\langle #1, #2 \rangle} \letThereBe{\norm}{1}{\left\lVert #1 \right\rVert} \LetThereBe{\dist}{\rho}
16
\LetThereBe{\and}{\&}\letThereBe{\brackets}{1}{\left\{ #1 \right\}}
17
\letThereBe{\parc}{2}{\frac {\partial #1}{\partial #2}}
18
\letThereBe{\mtr}{1}{\begin{pmatrix}#1\end{pmatrix}}
19
\letThereBe{\bm}{1}{\boldsymbol{#1}} \letThereBe{\mcal}{1}{\mathcal{#1}}
20
\letThereBe{\vv}{1}{\mathbf{#1}}\letThereBe{\vvp}{1}{\pmb{#1}}
21
\LetThereBe{\ve}{\varepsilon} \LetThereBe{\l}{\lambda} \LetThereBe{\th}{\vartheta} \LetThereBe{\a}{\alpha}
22
\letThereBe{\conv}{1}{\mathrm{conv}\, #1} \letThereBe{\cone}{1}{\mathrm{cone}\, #1}
23
\letThereBe{\aff}{1}{\mathrm{aff}\, #1} \letThereBe{\lin}{1}{\mathrm{Lin}\, #1} \letThereBe{\span}{1}{\mathrm{span}\, #1}
24
\LetThereBe{\O}{\mathcal O}
25
\letThereBe{\ri}{1}{\mathrm{ri}\, #1} \letThereBe{\rd}{1}{\mathrm{r}\partial\, #1} \letThereBe{\interior}{1}{\mathrm{int}\, #1}
26
\LetThereBe{\proj}{\Pi} \letThereBe{\epi}{1}{\mathrm{epi}\, #1}
27
\letThereBe{\grad}{1}{\mathrm{grad}\, #1} \letThereBe{\gradT}{1}{\mathrm{grad}^T #1} \letThereBe{\gradx}{1}{\mathrm{grad}_x #1} \letThereBe{\hess}{1}{\nabla^2\, #1} \letThereBe{\hessx}{1}{\nabla^2_x #1}
28
\letThereBe{\subdif}{1}{\partial #1} \letThereBe{\co}{1}{\mathrm{co}\, #1}
29
\letThereBe{\iter}{1}{^{[#1]}} \LetThereBe{\str}{^*}
30
\LetThereBe{\spv}{\mcal V} \LetThereBe{\civ}{\mcal U}
31
\letThereBe{\set}{1}{\left\{ #1 \right\}}
32
```
33
34
</div>
35
36
### Obecný úvod
37
**Úlohou matematického programování** nazveme
38
39
```math
40
f(x) \to \min, \quad x \in X \eqT{4.1}
41
```
42
43
kde **přípustná množina** $X$ je zadána systém rovností a nerovností
44
45
```math
46
X := \set{x \in P \subseteq \R^n \mid g_i(x) \leq 0, \, g_j(x) = 0, \, i = 1, \dots, k, \, j = k+1, \dots, m} \eqT{4.2}
47
```
48
49
> Zde je důležité podotknout, že vždy chceme nerovnostní omezení **pouze tvaru** $\bm{g_i(x) \leq 0}$
50
51
> Je dobré si zapatovat, že
52
> - $m$ - **počet omezení**
53
> - $k$ - **počet nerovností** (tzn. $g_1, \dots, g_k$ jsou **nerovnosti**, zbytek rovnosti)
54
Omezení zakomponovaná v $P$ se nazývají **přímá**, naopak omezení ve formě $g_l$ se nazývají **funkcionální**. Dále definujme
55
- **množinu přípustných vektorů**
56
```math
57
\spv(x^*, X) := \set{h \in \lin X \mid \exists \, \a_0 > 0 : x^*+ th \in X \text{ pro } \forall t \in (0, \a_0)}
58
```
59
- je to **kužel**
60
- **množinu spádových vektorů** (**kužel zlepšujících vektorů**)
61
```math
62
\civ(x^*, f) := \set{h \in \lin X \mid \exists \, \a_0 > 0 : x^*+ th \in D(f) \, \and \, f(x^*+ th) < f(x^*) \text{ pro } \forall t \in (0, \a_0)}
63
```
ab9e13 Štěpán Zapadlo 2026-03-28 10:48:18
Change to local image
64
![Přípustné a zlepšující vektory](./image-1774694872279.png)
e63e3e Štěpán Zapadlo 2026-03-28 10:17:16
Fix display math
65
66
##### **Lemma** $\secT{4.1.1}$
67
Nechť $X \subseteq \R$ a $f: X \to \R$ jsou dány. Je-li bod $x^*\in X$ lokálním řešením úlohy $\eqRef{4.1}$, potom
68
69
```math
70
\spv (x^*, X) \cap \civ (x^*, f) = \emptyset
71
```
72
73
##### **Definice** $\secT{4.1.2}$ (Stacionární bod)
74
Nechť množina $X \subseteq \R^n$ je **konvexní** a funkce $f: X \to \R$ je **diferencovatelná** na (*nějaké otevřené množině obsahující*) $X$. Řekneme, že bod $x^*\in X$ je **stacionárním bodem** úlohy $\eqRef{4.1}$ (*nebo také **stacionárním bodem funkce*** $f$ *na množině* $X$), jestliže
75
76
```math
77
\scal {\grad f(x^*)} {x - x^*} \geq 0 \eqT{4.1.2},
78
```
79
80
pro každé $x \in X$.
81
82
> Výraz v $\eqRef{4.1.2}$ je **směrová derivace** $x^*$ do libovolného bodu v $X$ - v těchto směrech musí být $f$ **neklesající**
83
Pro $X = \R^n$ je podmínka $\eqRef{4.1.2}$ splněna **pouze** v případě $\grad f(x^*) = 0$
84
Dále ukažme, že **stacionární bod** ve smyslu Definice $\secRef{4.1.2}$ má vlastnosti, které od něj očekáváme.
85
86
##### **Věta** $\secT{4.1.3}$ (Vlastnosti stacionárního bodu)
87
Nechť $f: X \to \R$ je **diferencovatelná** na (*nějaké otevřené množině obsahující **konvexní** množinu*) $X \subseteq \R^n$.
88
1. Je-li $x^*\in X$ **lokálním extrémem** funkce $f$ na $X$ (tj. *lokálním* řešením úlohy $\eqRef{4.1}$), pak $x^*$ je **stacionárním bodem** funkce $f$ na $X$
89
2. Naopak, je-li $f$ (*ostře*) **konvexní** na $X$ a $x^*\in X$ je **stacionárním bodem** $f$ na $X$, pak $x^*$ je (*jediným*) řešením úlohy $\eqRef{4.1}$, tj. (*jediným*) **globálním minimem** $f$ na $X$.
90
91
---
92
93
Pokud avšak $f$ **není konvexní**, potřebujeme o rozhodnutí "*extrémnosti*" stacionárního bodu další nástroje
94
95
##### Nutná podmínka pro $\eqRef{4.1}$
96
Je-li $x^*\in X$ **lokálním minimem** funkce $f: X \to \R, \, f \in C^2$, na **konvexní** množině $X \subseteq \R^n$, pak
97
98
```math
99
(x - x^*)^T \hess f(x^*)(x - x^*) \geq 0
100
```
101
102
pro všechna $x \in X$ taková, že $\gradT f(x^*)(x - x^*) = 0$, tj. pro vektory $(x - x^*)\in \ker\gradT f(x^*)$
103
104
##### Postačující podmínka pro $\eqRef{4.1}$
105
Bod $x^*$ je **lokálním minimem** funkce $f: X \to \R, f \in C^2$, na **konvexní** množině $X \subseteq \R^n$, jestliže
106
107
```math
108
\gradT f(x^*) (x - x^*) \geq 0, \, \forall x \in X,
109
```
110
111
(tj. je to **stacionární bod** ve smyslu Definice $\secRef{4.1.2}$), množina $X$ je **polyedr** a platí
112
113
```math
114
(x - x^*)^T \hess f(x^*) (x - x^*) > 0
115
```
116
117
pro všechna $x \in X$ taková, že $x \neq x^*$ a $(x - x^*) \in \ker \gradT f(x^*)$
118
119
> Je-li $X$ **polyedr**, pak je $\spv (x^*, X)$ **uzavřená**
120
121
### Nutné a postačující podmínky optimality
122
Uvažujme přidruženou **Lagrangeovu funkci** $L: P \times \R \times \R^m \to \R$ k úloze $\eqRef{4.1} \, \and \, \eqRef{4.2}$ definovanou jako
123
124
```math
125
L(x, y_0, y) := y_0 f(x) + \sum_{i = 1}^m y_i g_i(x), \eqT{4.1.2}
126
```
127
128
přičemž v případě $y_0 = 1$ bude $L(x, 1, y) := L(x,y)$. Navíc čísla $y_0, \dots, y_m$ nazyváme **Lagrangeovými multiplikátory**.
129
130
> Omezení nazveme **aktivní**, pokud se realizuje jako **rovnost**
131
Dále ještě zaveďme následující
132
133
```math
134
Q := \set{y = (y_1, \dots, y_m)^T \mid y_1, \dots, y_k \geq 0}
135
```
136
137
a dvě další množiny:
138
- **Množinu aktivních omezení** v bodě $x\str$
139
```math
140
I(x\str) := \set{i \in \set{1, \dots, k} \mid g_i(x\str) = 0}, \quad x\str \in X
141
```
142
143
- **Množinu indexů** všech funkcí, které se v bodě $x\str$ realizují jako rovnost
144
```math
145
S(x\str) := I(x\str) \cup \set{k+1, \dots, m}, \quad x\str \in X
146
```
147
148
##### **Věta** $\secT{4.2.1}$ (Lagrangeův princip)
149
Nechť množina $P \subseteq \R^n$ je **konvexní**, funkce $f, g_1, \dots, g_k : P \to \R$ jsou **diferencovatelné** v bodě $x^*\in X$ a $g_{k+1}, \dots, g_m$ jsou **spojitě diferencovatelné** na nějakém okolí bodu $x^*$. Je-li bod $x^*\in X$ **lokálním řešením** úlohy $\eqRef{4.1} \, \and \, \eqRef{4.2}$, pak existují **Lagrangeovy multiplikátory** $y_0\str > 0$ a $y\str \in Q$ takové, že **ne všechna** $y_0\str, \dots, y_m\str$ jsou **nulová** a platí
150
151
```math
152
\scal {\gradx L(x\str, y_0\str, y\str)} {x - x\str} \geq 0 \quad \forall x \in P \eqT{4.2.3}
153
```
154
155
```math
156
y_i\str g_i(x\str) = 0, \quad i = 1, \dots, m \eqT{4.2.4}
157
```
158
159
---
160
161
Podmínka $\eqRef{4.2.3}$ znamená, že $x\str$ musí být **stacionárním bodem** funkce $L(x, y_0\str, y\str)$ (*podmínka stacionarity*). Dále podmínka $\eqRef{4.2.4}$ se nazývá **podmínka komplementarity** a požadavek $y_1\str, \dots, y_k\str > 0$ jako **podmínka duality**.
162
163
> Jistě $y_0\str, y_1\str, \dots, y_k\str \geq 0$, $y_{k+1}\str, \dots, y_m\str \in \R \iff y_0\str > 0$ a $y\str \in Q$
164
Jelikož situace s $y_0\str = 0$ je problematická, existují podmínky na zaručení $y_0\str \neq 0$, což je ekvivalentní s $y_0\str = 1$. Tyto podmínky se nazývají **podmínky kvalifikovaného omezení**:
165
- **Regulárnost bodu** $x\str$, tj, bod $x\str$ je **regulární**, pokud jsou $\grad g_i(x\str)$ pro $i \in S(x\str)$ **lineárně nezávislé** (tj. *gradienty aktivních omezení jsou LNZ*)
166
- **afinní omezení** - funkce $g_1, \dots, g_m$ jsou **afinní**
167
- **Slaterova podmínka** - $g_1, \dots, g_k$ jsou **konvexní**, $g_{k+1}, \dots, g_m$ jsou **afinní**, **konstantní** vektory $\grad g_i$ jsou **lineárně nezávislé** pro $i \in \set{k+1, \dots, m}$ a existuje $\bar x \in P$ takové, že $g_i(\bar x) < 0$ pro $i \in \set{1, \dots, k}$ a $g_j(\bar x) = 0$ pro $j \in \set{k+1, \dots, m}$
168
169
##### **Důsledek** $\secT{4.2.2}$
170
Nechť $P \subseteq \R^n$ je **konvexní** množina, funkce $f, g_1, \dots, g_m$ jsou **diferencovatelné** na (*nějaké otevřené množině obsahující*) $P$ a pro $x\str \in X$ existují multiplikátory $y\str \in Q$ takové, že platí $\eqRef{4.2.3}$ & $\eqRef{4.2.4}$ s $y_0\str = 1$. Nechť je dále splněn (*alespoň*) jeden z následujících předpokladů:
171
1. funkce $L(x, y\str)$ je **konvexní** na množině $P$
172
2. úloha $\eqRef{4.1}$ & $\eqRef{4.2}$ je úlohou **konvexního programování**, tj. na **konvexní** množině $P$ jsou funkce $f, g_1, \dots, g_k$ **konvexní** a $g_{k+1}, \dots, g_m$ **afinní**
173
Pak bod $x\str$ je **globálním řešením** úlohy $\eqRef{4.1}$ & $\eqRef{4.2}$.
174
175
> Teoreticky stačí pouze *kvazikonvexní* $g_1, \dots, g_k$
176
177
##### **Věta** $\secT{4.2.3}$ (Karushova-Kuhnova-Tuckerova v diferenciálním tvaru)
178
Nechť $P \subseteq \R^n$ je **konvexní** množina, funkce $f, g_1, \dots, g_k$ **konvexní** a **diferencovatelné** na (*nějaké otevřené množině obsahující*) $P$, funkce $g_{k+1}, \dots, g_m$ **afinní** na $P$ a nechť platí (*alespoň*) jedna z následujících podmínek:
179
1. **(LNZ)** množina $P$ je **otevřená**, vektory $\grad g_i(x), i \in S(x)$ jsou **lineárně nezávislé** pro každé $x \in X$.
180
2. **(Slaterova)** funkcionální omezení jsou pouze tvaru **nerovností**, tj. $k = m$, a **existuje** bod $\bar x \in P$ takový, že $g_i(\bar x) < 0$ pro $i \in \set{1, \dots, k}$
181
3. **(lineární)** množina $P$ je **polyedr** a funkce $g_1, \dots, g_k$ jsou **afinní**
182
Pak $x\str$ je řešením úlohy $\eqRef{4.1}$ & $\eqRef{4.2}$ právě tehdy, když existuje $y\str \in Q$ takové, že platí $\eqRef{4.2.3}$ & $\eqRef{4.2.4}$ s $y_0\str = 1$.
183
184
##### **Věta** $\secT{4.2.4}$
185
Nechť funkce $f, g_1, \dots, g_m$ jsou **dvakrát spojitě** diferencovatelné v bodě $x\str$ a $x\str \in \interior P$ je takový, že **existují** multiplikátory $y\str \in Q$ splňující $\eqRef{4.2.3}$ & $\eqRef{4.2.4}$ s $y_0\str = 1$ a současně $y_i\str > 0$ pro $i \in I(x\str)$ (tzv. **podmínka ostré komplementarity**), tj.
186
187
```math
188
\gradx L(x\str, y\str) = 0,
189
```
190
191
```math
192
g_i(x\str) \leq 0 \text{ pro } i \in \set{1, \dots, k}, \qquad g_i(x\str) = 0 \text{ pro } i \in \set{k+1, \dots, m},
193
```
194
195
```math
196
y_i\str > 0 \text{ pro } i \in I(x\str), \qquad y_i\str = 0 \text{ pro } i \in \set{1, \dots, k} \setminus I(x\str),
197
```
198
199
```math
200
y_i\str \in \R \text{ pro } i \in \set{k+1, \dots, m}
201
```
202
203
Jestliže
204
205
```math
206
\hessx L(x\str, y\str) > 0 \text{ na } \ker (\gradT g_i(x\str))_{i \in S(x\str)},
207
```
208
209
tj. $h^T \hessx L(x\str, y\str) h > 0$ pro všechna $h \in \R^n \setminus \brackets{0}$ taková, že $\scal {\grad g_i(x\str)} h = 0$ pro $i \in S(x\str)$, pak bod $x\str$ je **ostré lokální minimum** funkce $f$ na množině $X$.