数学 の一トピックである変分法 における直接解法 (ちょくせつかいほう、英 : direct method )とは、与えられた汎函数 に対する最小点の存在の証明を構築するための一般的な手法である[1] 。1900年頃に、ザレンバとダフィット・ヒルベルト によって導入された。この手法は、函数解析学 とトポロジー の手法に依拠するものである。解の存在を証明するために用いられるのと同様に、直接解法は解を所望の精度で計算するために用いられることもある[2] 。
解法 変分法では、ある函数空間 V {\displaystyle V} と R ¯ = R ∪ { ∞ } {\displaystyle {\bar {\mathbb {R} }}=\mathbb {R} \cup \{\infty \}} に対する汎函数 J : V → R ¯ {\displaystyle J\colon V\to {\bar {\mathbb {R} }}} が扱われる。その主な興味は、そのような汎函数の最小点 (minimizer)、すなわち J ( v ) ≤ J ( u ) {\displaystyle J(v)\leq J(u)} が任意の u ∈ V に対して成り立つような函数 v ∈ V {\displaystyle v\in V} を見つけることである。
函数が最小点であるための必要条件を得る上での標準的な道具は、オイラー=ラグランジュ方程式 である。しかし、それらを満たす函数の中から最小点を見つける方法は、前もって最小点の存在が示されていない場合には誤った結論を導くこともある。
汎函数 J {\displaystyle J} が最小点を持つためには、下に有界である必要がある。すなわち
inf { J ( u ) ∣ u ∈ V } > − ∞ {\displaystyle \inf\{J(u)\mid u\in V\}>-\infty \,} が成立する必要がある。この条件は、最小点が存在することを示す上で十分ではないが、最小化列 (minimizing sequence)、すなわち J ( u n ) → inf { J ( u ) ∣ u ∈ V } {\displaystyle J(u_{n})\to \inf\{J(u)\mid u\in V\}} を満たす V {\displaystyle V} 内の列 ( u n ) {\displaystyle (u_{n})} の存在を示す。
直接解法は次の手順で行われる:
J {\displaystyle J} に対する最小化列 ( u n ) {\displaystyle (u_{n})} を取る。 ( u n ) {\displaystyle (u_{n})} には、 V {\displaystyle V} 上の位相 τ {\displaystyle \tau } に関して u 0 ∈ V {\displaystyle u_{0}\in V} に収束するある部分列 が存在することを示す。 J {\displaystyle J} は位相 τ {\displaystyle \tau } に関して列的に下半連続 であることを示す。このことが最小点の存在を示すことを確かめる上で、次のような列的に下半連続な函数の特徴付けを行う。
函数 J {\displaystyle J} が列的に下半連続であるとは、 lim inf n → ∞ J ( u n ) ≥ J ( u 0 ) {\displaystyle \liminf _{n\to \infty }J(u_{n})\geq J(u_{0})} が V {\displaystyle V} 内の任意の収束列 u n → u 0 {\displaystyle u_{n}\to u_{0}} に対して成り立つ ことを言う。 結論は次より成り立つ:
inf { J ( u ) ∣ u ∈ V } = lim n → ∞ J ( u n ) = lim k → ∞ J ( u n k ) ≥ J ( u 0 ) ≥ inf { J ( u ) ∣ u ∈ V } . {\displaystyle \inf\{J(u)\mid u\in V\}=\lim _{n\to \infty }J(u_{n})=\lim _{k\to \infty }J(u_{n_{k}})\geq J(u_{0})\geq \inf\{J(u)\mid u\in V\}.} これはすなわち、次を意味する。
J ( u 0 ) = inf { J ( u ) | u ∈ V } . {\displaystyle J(u_{0})=\inf\{J(u)|u\in V\}.}
詳細 バナッハ空間 直接解法はしばしば、可分 かつ回帰的 なバナッハ空間 W {\displaystyle W} の部分集合として空間 V {\displaystyle V} が与えられる場合に適用される。この場合、列的バナッハ=アラオグルの定理 は、 V {\displaystyle V} 内の任意の有界列 ( u n ) {\displaystyle (u_{n})} は、弱位相 に関して W {\displaystyle W} 内のある u 0 {\displaystyle u_{0}} に収束する部分列を持つ。 V {\displaystyle V} が W {\displaystyle W} 内において列的に閉で、したがって u 0 {\displaystyle u_{0}} が V {\displaystyle V} に属する場合は、直接解法は次を示すことによってある汎函数 J : V → R ¯ {\displaystyle J:V\to {\bar {\mathbb {R} }}} に対して適用される。
J {\displaystyle J} は下に有界 J {\displaystyle J} に対する任意の最小化列は有界 J {\displaystyle J} は弱列的下半連続、すなわち、任意の弱収束列 u n → u 0 {\displaystyle u_{n}\to u_{0}} に対して lim inf n → ∞ J ( u n ) ≥ J ( u 0 ) {\displaystyle \liminf _{n\to \infty }J(u_{n})\geq J(u_{0})} が成り立つ。この二番目は、通常 J {\displaystyle J} がある成長条件を許すことを示すことによって示される。その一例は次のようなものである。
J ( x ) ≥ α ‖ x ‖ q − β {\displaystyle J(x)\geq \alpha \lVert x\rVert ^{q}-\beta } for some α > 0 {\displaystyle \alpha >0} , q ≥ 1 {\displaystyle q\geq 1} and β ≥ 0 {\displaystyle \beta \geq 0} .この性質を持つ汎函数はしばしば強圧的(coercive)と呼ばれる。列的下半連続性は、直接解法を適用する上で通常最も難しい条件である。より一般の汎函数のクラスに対する定理は次節を参照されたい。
ソボレフ空間 変分法における典型的な汎函数は、次の形式の積分である。
J ( u ) = ∫ Ω F ( x , u ( x ) , ∇ u ( x ) ) d x {\displaystyle J(u)=\int _{\Omega }F(x,u(x),\nabla u(x))dx} ここで Ω {\displaystyle \Omega } は R n {\displaystyle \mathbb {R} ^{n}} の部分集合であり、 F {\displaystyle F} は Ω × R m × R m n {\displaystyle \Omega \times \mathbb {R} ^{m}\times \mathbb {R} ^{mn}} 上の実数値函数である。 J {\displaystyle J} の引数は微分可能な函数 u : Ω → R m {\displaystyle u:\Omega \to \mathbb {R} ^{m}} で、そのヤコビアン ∇ u ( x ) {\displaystyle \nabla u(x)} は m n {\displaystyle mn} -ベクトルと結び付けて考えられる。
オイラー=ラグランジェ方程式を導出する際の一般的なアプローチは、 Ω {\displaystyle \Omega } の境界が C 2 {\displaystyle C^{2}} であり、 J {\displaystyle J} の定義域が C 2 ( Ω , R m ) {\displaystyle C^{2}(\Omega ,\mathbb {R} ^{m})} であるとするものである。この空間は上限ノルム が備えられるときにバナッハ空間となるが、回帰的ではない。直接解法が適用される場合、汎函数は通常 p > 1 {\displaystyle p>1} であるようなソボレフ空間 W 1 , p ( Ω , R m ) {\displaystyle W^{1,p}(\Omega ,\mathbb {R} ^{m})} に対して定義される。そのような空間は回帰的なバナッハ空間である。このとき、 J {\displaystyle J} の式における u {\displaystyle u} の微分は、弱微分 として取られる。次節では、上述のタイプの汎函数の弱列的下半連続性に関する二つの定理を紹介する。
積分の列的下半連続性 変分法における多くの汎函数は次の形式を取る:
J ( u ) = ∫ Ω F ( x , u ( x ) , ∇ u ( x ) ) d x {\displaystyle J(u)=\int _{\Omega }F(x,u(x),\nabla u(x))dx} ここに Ω ⊆ R n {\displaystyle \Omega \subseteq \mathbb {R} ^{n}} は開である。したがって、 W 1 , p ( Ω , R m ) {\displaystyle W^{1,p}(\Omega ,\mathbb {R} ^{m})} 内において J {\displaystyle J} が弱列的下半連続となるような函数 F {\displaystyle F} の特徴付けが非常に重要となる。
一般に、次が成り立つ[3] 。
F {\displaystyle F} は次を満たす函数とする。 函数 ( y , p ) ↦ F ( x , y , p ) {\displaystyle (y,p)\mapsto F(x,y,p)} はほとんどすべての x ∈ Ω {\displaystyle x\in \Omega } に対して連続である; 函数 x ↦ F ( x , y , p ) {\displaystyle x\mapsto F(x,y,p)} はすべての ( y , p ) ∈ R m × R m n {\displaystyle (y,p)\in \mathbb {R} ^{m}\times \mathbb {R} ^{mn}} に対して可測 である; F ( x , y , p ) ≥ a ( x ) ⋅ p + b ( x ) {\displaystyle F(x,y,p)\geq a(x)\cdot p+b(x)} が、固定された a ∈ L q ( Ω , R m ) {\displaystyle a\in L^{q}(\Omega ,\mathbb {R} ^{m})} (但し 1 / q + 1 / p = 1 {\displaystyle 1/q+1/p=1} )、固定された b ∈ L 1 ( Ω ) {\displaystyle b\in L^{1}(\Omega )} 、ほとんどすべての x ∈ Ω {\displaystyle x\in \Omega } とすべての ( y , p ) ∈ R m × R m n {\displaystyle (y,p)\in \mathbb {R} ^{m}\times \mathbb {R} ^{mn}} に対して成り立つ(ここに a ( x ) ⋅ p {\displaystyle a(x)\cdot p} は、 R m n {\displaystyle \mathbb {R} ^{mn}} 内での a ( x ) {\displaystyle a(x)} と p {\displaystyle p} の内積を意味する )。次が成立する。函数 p ↦ F ( x , y , p ) {\displaystyle p\mapsto F(x,y,p)} がほとんどすべての x ∈ Ω {\displaystyle x\in \Omega } とすべての y ∈ R m {\displaystyle y\in \mathbb {R} ^{m}} に対して凸であるなら、 J {\displaystyle J} は列的に下半連続である。 n = 1 {\displaystyle n=1} あるいは m = 1 {\displaystyle m=1} のとき、逆のような次の定理が成立する[4] 。
F {\displaystyle F} は連続で、 | F ( x , y , p ) | ≤ a ( x , | y | , | p | ) {\displaystyle |F(x,y,p)|\leq a(x,|y|,|p|)} がすべての ( x , y , p ) {\displaystyle (x,y,p)} と、 y {\displaystyle y} と p {\displaystyle p} について増加で x {\displaystyle x} について局所可積分であるような固定された函数 a ( x , y , p ) {\displaystyle a(x,y,p)} に対して成立すると仮定する。このとき、 J {\displaystyle J} が列的に弱下半連続であるなら、任意の与えられた ( x , y ) ∈ Ω × R m {\displaystyle (x,y)\in \Omega \times \mathbb {R} ^{m}} に対して函数 p ↦ F ( x , y , p ) {\displaystyle p\mapsto F(x,y,p)} は凸となる。 結論として、 m = 1 {\displaystyle m=1} あるいは n = 1 {\displaystyle n=1} で、 F {\displaystyle F} について意義のある成長と有界性を仮定するとき、汎函数 J {\displaystyle J} が弱列的下半連続であるための必要十分条件は、函数 p ↦ F ( x , y , p ) {\displaystyle p\mapsto F(x,y,p)} が凸であることである。 n {\displaystyle n} と m {\displaystyle m} のいずれも 1 より大きいなら、凸性への必要性はより一般の凸性、すなわち多凸性 や準凸性へと弱めることが出来る[5] 。
注釈 ^ Dacorogna, pp. 1–43. ^ I. M. Gelfand, S. V. Fomin (1991). Calculus of Variations . Dover Publications. ISBN (978-0-486-41448-5 ) ^ Dacorogna, pp. 74–79. ^ Dacorogna, pp. 66–74. ^ Dacorogna, pp. 87–185.
参考文献 Dacorogna, Bernard (1989). Direct Methods in the Calculus of Variations . Springer-Verlag . (ISBN 0-387-50491-5 ) Fonseca, Irene; Giovanni Leoni (2007). Modern Methods in the Calculus of Variations: L p {\displaystyle L^{p}} Spaces . Springer . (ISBN 978-0-387-35784-3 ) Jindřich Nečas: Direct Methods in the Theory of Elliptic Equations . (Transl. from French original 1967 by A.Kufner and G.Tronel), Springer, 2012, (ISBN 978-3-642-10455-8 ). T. Roubíček (2000年). “Direct method for parabolic problems”. Adv. Math. Sci. Appl. 10 : pp. 57-65