泛函和变分:从最速降线谈起

泛函和变分:从最速降线谈起

处理最速降线等类似的问题,大家都喜欢直接对推导出来的极小化问题,直接代入欧拉-拉格朗日方程求解,我觉得这不易于对“变分”的理解,对于大家理论分析功底的增近,并无裨益。通过思考,我觉得直接从 Frechet 导数出发,进行变分推导得到更具化的欧拉-拉格朗日方程,是更为广泛的一种变分方法。本质上是一样的,只不过这个过程更容易推广。

简介

所谓的泛函,就是“函数的函数”,自变量本身就是函数的一个函数。找一个函数,使得某一个泛函最小,就是一个“能量”极小化的问题。可以用到变分方法。

  • 变分法在理论物理中非常重要:在拉格朗日力学中,以及在最小作用量原理在量子力学的应用中。
  • 变分法提供了有限元方法的数学基础,它是求解边界值问题的强力工具。它们也在材料学中研究材料平衡中大量使用。
  • 在纯数学中的例子有,黎曼在调和函数中使用狄力克雷原理。
  • 最优控制的理论是变分法的一个推广。

变分法是 17 世纪末发展起来的一门数学分支,是处理函数的数学领域,和处理数的函数的普通微积分相对。它最终寻求的是极值函数:它们使得泛函取得极大或极小值。

变分

微分是当自变量 x x x变化了一点点 d x \text{d}x dx而导致了函数 f ( x ) f(x) f(x)变化了多少。
变分是无限维空间上的微分,我们一般称之为Frechet 微分,其实就是微分在无限维空间的推广。Frechet 微分作用于泛函就叫变分。我们用 δ \delta δ 符号来替代微分中的 d。

Frechet 导数

Frechet 导数实变量函数在 Banach 空间中的推广,这个东西在做偏微分方程的时候,比如求能量极小,求欧拉-拉格朗日方程等方面,非常重要,任何做方程的,都应该熟练掌握。

Frechet 导数,就是一般导数的一个推广,可以简单地写为,对于需要极小化的函数 J ( ϕ ) J(\phi) J(ϕ) ∀ ψ \forall \psi ψ
< δ J δ ϕ , ψ > = lim ⁡ ϵ − > 0 J ( ϕ + ϵ ψ ) − J ( ϕ ) ϵ = d d ε J ( ϕ + ε ψ ) ∣ ε = 0 <\frac{\delta J}{\delta \phi},\psi> = \lim_{\epsilon->0}\frac{J(\phi+\epsilon\psi)-J(\phi)}{\epsilon}=\left.\frac{d}{d \varepsilon} J(\phi+\varepsilon \psi)\right|_{\varepsilon=0} <δϕδJ,ψ>=ϵ>0limϵJ(ϕ+ϵψ)J(ϕ)=dεdJ(ϕ+εψ)ε=0

Frechet 导数和一般的函数导数非常像,主要是这个对辅助函数 ψ \psi ψ 的任意很关键,是把积分号去掉,提取出恒等式的原因。

最速降线问题

最速降线问题,又称最短时间问题、最速落径问题,是探讨在重力作用而忽略摩擦力的情况下,一个质点在一点A以速率为零开始,沿某条曲线,去到一点不高于A的B,该以何种曲线行进才能令所需的时间最短。由经验可知,这条线越陡,速度就会越快,但是相应的路径就会变长,路径和速度之间必然存在一个平衡。

在这里插入图片描述

如图所示建立坐标系,水平方向的运动距离为 x x x,竖直方向的运动距离为 y y y,速度的大小用 v v v来表示。

由高中的重力势能和动能的转化关系, m g y = 1 / 2 m v 2 mgy=1/2mv^2 mgy=1/2mv2。可以得到,
v = 2 g y v = \sqrt{2gy} v=2gy

在微分几何中,一条参数化曲线 { x ( t ) , y ( t ) } \{x(t),y(t)\} {x(t),y(t)},它的弧长是可以表示为:
∫ t 0 t 1 x ′ ( t ) 2 + y ′ ( t ) 2 d t \int_{t_0}^{t_1}\sqrt{x'(t)^2+y'(t)^2}\text{d}t t0t1x(t)2+y(t)2 dt
这个公式不需要记,怎么理解呢,它表示曲线沿 x x x方向的变化率,和沿 y y y方向的变化率,利用“勾股定理进行组合,得到的就是沿切线方向的变化率,沿切线方向的变化率,再做个积分,肯定就是长度了。

那么,对于曲线 y ( x ) y(x) y(x),把 x x x 看成 t t t,仍用 x x x 表示,那么它的弧长就是
∫ a b 1 + y ′ ( x ) 2 d x \int_{a}^{b}\sqrt{1+y'(x)^2}\text{d}x ab1+y(x)2 dx
接下来,有的地方就会利用“微元”的思想,把弧长和速度相除作为时间进行积分,对于不理解“微元法”的人来说,就会显得很牵强。那么应该怎么解释呢?

把弧长的表达式换成弧长参数,有
∫ a b 1 + y ′ ( x ) 2 d x = ∫ s 0 s 1 1 d s \int_{a}^{b}\sqrt{1+y'(x)^2}\text{d}x= \int_{s_0}^{s_1}1\text{d}s ab1+y(x)2 dx=s0s11ds
也就是说,
d s = 1 + y ′ ( x ) 2 d x \text{d}s = \sqrt{1+y'(x)^2}\text{d}x ds=1+y(x)2 dx
这个是很容易理解的。那么,

v = d s d t = 1 + y ′ ( x ) 2 d x d t v=\frac{\text d s}{\text d t} = \sqrt{1+y'(x)^2}\frac{\text{d}x}{\text d t} v=dtds=1+y(x)2 dtdx

则有,
d t = 1 + y ′ ( x ) 2 v d x \text dt = \frac{\sqrt{1+y'(x)^2}}{v} \text dx dt=v1+y(x)2 dx

两边同时积分,可以得到从 a 到 b 的总时间,

J = ∫ a b 1 + y ′ ( x ) 2 2 g y d x : = ∫ a b F d x J = \int_{a}^{b} \frac{\sqrt{1+y'(x)^2}}{\sqrt{2gy}} \text dx:= \int_{a}^{b} F \text dx J=ab2gy 1+y(x)2 dx:=abFdx

变分求解最速降线

下面要做的就是选定 y y y ,使得 J J J 达到最小,这是经典的变分问题,我们使用变分方法。

< δ J δ y , z > = lim ⁡ ϵ − > 0 J ( y + ϵ z ) − J ( y ) ϵ = lim ⁡ ϵ − > 0 ∫ a b ∂ F ∂ y ϵ z + ∂ F ∂ y ′ ϵ z ′ + o ( ϵ ) ϵ = ∫ a b ∂ F ∂ y z + ∂ F ∂ y ′ z ′ = ∂ F ∂ y ′ z ∣ a b + ∫ a b ( ∂ F ∂ y + d d x ∂ F ∂ y ′ ) z = ∫ a b ( ∂ F ∂ y + d d x ∂ F ∂ y ′ ) z = 0 <\frac{\delta J}{\delta y},z> = \lim_{\epsilon->0}\frac{J(y+\epsilon z)-J(y)}{\epsilon}\\ =\lim_{\epsilon->0}\int_{a}^b \frac{\frac{\partial F}{\partial y}\epsilon z+\frac{\partial F}{\partial y'}\epsilon z'+o(\epsilon)}{\epsilon}\\ = \int_{a}^b \frac{\partial F}{\partial y}z+\frac{\partial F}{\partial y'}z'\\ ={\frac{\partial F}{\partial y'}z}|_a^{b}+\int_{a}^b (\frac{\partial F}{\partial y}+\frac{\text d}{\text dx}\frac{\partial F}{\partial y'})z\\ = \int_{a}^b (\frac{\partial F}{\partial y}+\frac{\text d}{\text dx}\frac{\partial F}{\partial y'})z = 0 <δyδJ,z>=ϵ>0limϵJ(y+ϵz)J(y)=ϵ>0limabϵyFϵz+yFϵz+o(ϵ)=abyFz+yFz=yFzab+ab(yF+dxdyF)z=ab(yF+dxdyF)z=0

第二个等号用了泰勒展开,因为积分不好相消,这种情况下,我们一般更倾向于用泰勒展开。这里的 y y y y ′ y' y都应该看成一个变量,类比一般的多元函数泰勒展开。

第四个等号用了分部积分,对第二项进行了处理,一般含辅助函数 z z z 的都可以进行分部积分处理掉。

第五个等式是因为, y + ϵ z y+\epsilon z y+ϵz 作为 y 的一个扰动,必须满足边界条件,即 ( y + ϵ z ) ( a ) = y ( a ) ( y + ϵ z ) ( b ) = y ( b ) (y+\epsilon z)(a) = y (a)\\ (y+\epsilon z)(b) = y (b) (y+ϵz)(a)=y(a)(y+ϵz)(b)=y(b)
这意味着 z ( a ) = z ( b ) = 0 z(a) = z(b) = 0 z(a)=z(b)=0。最后,由于 z z z 的任意性(端点固定不影响),我们有,
∂ F ∂ y + d d x ∂ F ∂ y ′ = 0 \frac{\partial F}{\partial y}+\frac{\text d}{\text dx}\frac{\partial F}{\partial y'} = 0 yF+dxdyF=0

这便是我们得到的欧拉-拉格朗日方程。由于 F F F 中不显含自变量,则,
d d x [ F − y ′ ∂ F ∂ y ′ ] = y ′ ∂ F ∂ y + y ′ ′ ∂ F ∂ y ′ − y ′ ′ ∂ F ∂ y ′ − y ′ d d x ( ∂ F ∂ y ′ ) = 0 \frac{d}{d x}\left[F-y^{\prime} \frac{\partial F}{\partial y^{\prime}}\right]=y^{\prime} \frac{\partial F}{\partial y}+y^{\prime \prime} \frac{\partial F}{\partial y^{\prime}}-y^{\prime \prime} \frac{\partial F}{\partial y^{\prime}}-y^{\prime} \frac{d}{d x}\left(\frac{\partial F}{\partial y^{\prime}}\right)=0 dxd[FyyF]=yyF+yyFyyFydxd(yF)=0
故而
F − y ′ ∂ F ∂ y ′ = C F-y^{\prime} \frac{\partial F}{\partial y^{\prime}}=C FyyF=C
F F F的表达式代入,并且化简,可以得到一个不显含 x x x 的一个 ODE,
y [ 1 + ( y ′ ) 2 ] = C y\left[1+\left(y^{\prime}\right)^{2}\right]=C y[1+(y)2]=C
这里的 C 是可以由边界条件得到。翻一翻常微分的课本,我们可以求解这个 ODE,得到:
{ x = a + r ( θ − sin ⁡ θ ) y = r ( 1 − cos ⁡ θ ) \left\{\begin{array}{l} x=a+r(\theta-\sin \theta) \\ y=r(1-\cos \theta) \end{array}\right. {x=a+r(θsinθ)y=r(1cosθ)

这里的 r > 0 r>0 r>0,表示摆线圆半径。这里的 r r r 等于多少呢?假设 a、b两点的坐标分别为—— a : ( a , 0 ) , b : ( b , y b ) a: (a,0),b:(b,y_b) a:(a,0)b:(b,yb)。那么,可以求得: θ 0 = 0 \theta_0 = 0 θ0=0 θ 1 \theta_1 θ1 r r r 可以根据求解方程组
{ b = a + r ( θ 1 − sin ⁡ θ 1 ) y b = r ( 1 − cos ⁡ θ 1 ) \left\{\begin{array}{l} b=a+r(\theta_1-\sin \theta_1) \\ y_b=r(1-\cos \theta_1) \end{array}\right. {b=a+r(θ1sinθ1)yb=r(1cosθ1)
得到。涉及到非线性方程的求根,解析的表达式并不好写。

最速降线的物理意义

最速降线到底是什么呢?它是个是摆线,即圆周上固定一点在圆滚动时的轨迹。当然,这里的摆线是上下颠倒的。如图所示。

在这里插入图片描述
在这里插入图片描述

已标记关键词 清除标记
©️2020 CSDN 皮肤主题: 点我我会动 设计师:上身试试 返回首页