[{"content":"自从AlphaFold横空出世，神经网络就在不断吸引生物学家的目光。不可否认，至少在结构解析的领域，这类方法已经依靠其无与伦比的生产力产生了深刻的影响，而这种影响正快速辐射到其他领域中：基于LLM的蛋白质分析工具、序列分析产品层出不穷；图神经网络则可以用于分析从各类生物系统中提取出的抽象图；各类组学、高通量数据分析也在积极整合各类神经网络；等等。然而，这些喷涌出的AI4Science工具直接导向了一个严肃的问题：它们到底在多大程度上帮助人类理解了生物系统本身？又在多大程度上缓解了人因无法理解系统而产生的焦虑？\n“理解生物系统”是一个艰巨的课题。生物学研究最重要的两个目标就是理解生物系统以及医学应用。长久以来无数的定性实验在医学应用上取得了巨大的成功，相对而言，在理解生物系统上的进展还极大程度上停留在积累细节的阶段。这种对比不仅源于传统生物学研究视角侧重于医学应用，还源于定性方法内在的对研究系统动力学的缺陷。换言之，仅仅依靠积累分子细节、解出互作网络本身是无法理解动态的生物系统背后的逻辑的。这种逻辑并不是狭义的网络逻辑（类比于电路逻辑），而是针对特定网络结构、在特定条件下的动力学的分析。只有这类分析能够帮助我们理解当下获得的静态的网络与生物系统的行为之间的关联，但无论是出于技术的限制，还是出于医学应用的视角，这类分析始终没有得到足够的重视。从这个角度来说，生物学带给医学的成功并不能说明人们理解了某个生物系统具体的运行逻辑，而往往只能得出如下结论：在生物学给出的定性的静态网络模型下，某个靶点在经过临床实验验证后取得了有效的成果。靶点与效果之间的对应关系是一个灰箱，因为这个系统的动力学性质还未被掌握。有时一些药的效果远超预期，而另一些则差强人意，或许正是由于对动力学性质分析的忽视。\n从原理上来说，当下的AI4science能在多大程度上帮助人类理解生命系统，实际是一个值得探讨的话题。神经网络的舒适区是在大量数据输入的基础上，“学习”数据内部隐含的关系，最后根据这些“隐含的关系”输出相应的结果。这些“关系”被保存在模型内部的参数中，很难被人类直观地理解，顶多只能通过一些扰动手段间接地理解参数的含义。细想来，这种可解释性的研究本质上和生物研究别无二致。基于这些特性，神经网络当然和“组学数据”、“高通量数据”、“数据挖掘”这些字眼密切相关，更需要这些数据需要有足够的信息和良好的质量。且不谈在实际研究过程中这些数据是否受到了良好的处理（包括数据清洗等），单论数据的性质而言，能否体现出系统的动力学信息呢？\n答案或许是否定的。在空间上收集大量的异质性数据的难度要远低于在时间上做这些操作的难度；换言之，空间分辨率的提升要易于时间分辨率的提升。这是生命体本身的性质决定的。虽然空间相关组学的研究困难重重，但是始终有杰出的结果不断推动这些领域的进展，尤其是空间代谢组学、空间转录组学等领域一直是研究的热门，这是因为我们已然拥有各种单细胞的技术，使得我们能够在100微米的尺度上得到可靠的结果。当然，亚细胞的组学始终是一个更困难的问题，现在能做到的基本只有邻近标记辅以质谱的方式，但是数据的可靠性还有待提升。可是对于时间序列就没有这么简单了。要获得高质量的时间序列组学数据，我们不仅没有足够可靠的时间对齐方法，而且有意义的时间序列数据往往需要达到亚细胞的层次、分钟级甚至秒级的量级——细胞的代谢网络节点上的浓度波动、mRNA的浓度变化……当时空精度达到这些量级的时候，生命体自带的噪声，加上数据获取过程中的各类人为因素 ，包括实验处理的手法、试剂厂商的选用等等系统误差会被放大到无法被忽视、也很难被平均的程度。那么，神经网络在面对这些粗糙的、杂乱的数据时，究竟学到什么了呢？它学到了系统真实的动力学信息，还是实验测量中的各种误差呢？我们不得而知。\n实际上，事情有时候或许比我们想象的要简单一些。对于一些核心的网络和通路，通过传统的物理学方法可以得到非常solid的结果，这些结果往往揭示了在哪些最小的给定条件下，系统就足以展现出某些特定的行为；或展示了还需要哪些条件（这些条件往往在实验中难以验证，因而是一种假设），系统才能展现出某些特定的行为。这些结果和假设并不一定正确，但是可以告诉我们在现有的系统中还缺少哪些至关重要的因素，同时还赋予我们提出疑问的方向。这些因素的发掘本身就是我们不断理解生物系统的过程——我们面对复杂的客观世界，总是要借助于建立一个可以理解的模型，这个模型可以说“正确”或“不正确”，或者说“好”与“不好”，但是如果没有模型，一切就无从谈起。这就是韦斯科夫所说的故事：“模型就是 奥地利的火车时刻表，奥地利的火车经常晚点，有人问列车员‘你们干嘛还要时刻表呢？’列车员回答道‘有了时刻表才知道火车的晚点啊。’”\n神经网络的手段又是如何呢？它吞下大量的数据，吐出一些结果，即使假设这个过程并不是garbage in, garbage out, 谁也不能精细、清楚地知道里面发生了什么，或是从中获得有效的直觉——如果能够清楚地理解神经网络这个复杂系统的细节，从研究手段的性质而言，我们应该也能够获得并理解生物系统的细节，又何须借助神经网络的媒介呢？诚然神经网络已然在工程上取得了优异的成果，我们不妨承认神经网络自己已经理解了某些人类未知的生物系统的运行逻辑和结构，那么人类呢？我们自己从神经网络的吞吐过程中学到了什么？答案或许是“一无所知”。\n实际上，这就是一种对生物科学的背叛。神经网络相较人类拥有巨大的存储和内存，这赋予了它无比强大的直觉，强大到无需依赖任何人类的知识架构。人们已然通过实践证明，给模型的loss function人为施加一些物理的约束反而会让神经网络的表现下降 。这意味着大模型不需要、也必定不学习人类所具备的知识体系——一个适配极其有限的存储和极小内存的生物体的体系。对于神经网络的工程和探测，本质上都是在触摸一个极其陌生、抽象的知识体系，人类要如何从这类陌生的体系中抽离出对目前已然是庞然大物的自然知识体系有益的知识呢？即使不是完全不可能，也必然是十分困难的，我想甚至困难于直接探索生物系统本身。\n面对神经网络，人类产生了太多的幻想和兴奋。AlphaFold无与伦比的表现让我们误以为已经理解了蛋白质序列-折叠-功能的生物学逻辑。这是错误的。我们实际上还是一无所知，只不过现在有了一个莫名其妙的工具而已。直到我们能够给出最小的能够通过序列给出功能的蛋白质设计原理集合，我们才能够宣称理解了蛋白质折叠的逻辑。现在我们有什么？能量最小化罢了——这就是我们粗浅的不求甚解。\n","permalink":"https://guoranguan.site/posts/quantiquali2/","summary":"AI4Science是一场盛宴，还是一个科学的陷阱？","title":"在何种意义下，AI4Science是对生命科学的背叛？"},{"content":"弱导数是由积分定义的，而积分体现了函数的宏观性质。这就暗示着对$f\\in W^{k,p}(\\Omega)$做单纯的零延拓很可能无法得到同样具有弱导数的函数。但是我们总希望能够保留其具有弱导数的性质，并且希望能够控制延拓出来的函数的模。这就是延拓定理的作用。如果能将函数延拓到整个空间上，那么就可以进行很多$\\mathbb{R}^{n}$上的积分变换操作，因此延拓是十分必要的。\n下面的例子提供了延拓定理最核心的内容：\nExample 1 对于上半平面的光滑函数，延拓十分简单明了。设$f\\in C^{\\infty}(\\mathbb{R}^{2+})\\Rightarrow f\\in W^{1}(\\mathbb{R}^{2+})$. 令$F(x,y) = \\left\\{ \\begin{aligned} \u0026 f(x,y),\u0026 y\\geq0 \\\\ \u0026 f(x,-y),\u0026 y\u003c0 \\\\ \\end{aligned} \\right.\\Rightarrow F\\in C^{\\infty}(\\mathbb{R}^{2}\\setminus\\{y=0\\})\\cap C(\\mathbb{R}^{2})$. 由泛函分析1 Example2, 有$F\\in W^{1}(\\mathbb{R}^{2})$. 对于$\\varphi\\in\\mathcal{D}(\\mathbb{R}^{2})$, 有： \\begin{align} \\int_{\\mathbb{R}^{2}}F(x,y)\\frac{\\partial \\varphi}{\\partial y} \u0026= \\int_{\\mathbb{R}^{2+}}F(x,y)\\frac{\\partial \\varphi}{\\partial y} + \\int_{\\mathbb{R}^{2-}}F(x,y)\\frac{\\partial \\varphi}{\\partial y} \\nonumber\\\\ \u0026= -\\int_{\\mathbb{R}^{2+}}\\frac{\\partial F(x,y)}{\\partial y}\\varphi - \\int_{\\mathbb{R}^{2-}}\\frac{\\partial F(x,y)}{\\partial y}\\varphi + \\int_{\\{y=0\\}}F(x,y)\\varphi - \\int_{\\{y=0\\}}F(x,y)\\varphi \\nonumber\\\\ \u0026= -\\int_{\\mathbb{R}^{2}\\setminus\\{y=0\\}}\\frac{\\partial F(x,y)}{\\partial y}\\varphi = -\\int_{\\mathbb{R}^{2}}\\frac{\\partial F(x,y)}{\\partial y}\\varphi\\nonumber \\end{align} 但是对于一般的$f\\in W^{1,p}(\\mathbb{R}^{2+})$, 我们手里唯一的工具只有定义，只能对$\\varphi\\in W^{1,p'}_{0}(\\mathbb{R}^{2+})$做分部积分。为此，我们需要一个函数将$\\varphi$“分割”成在$W^{1,p'}_{0}(\\mathbb{R}^{2+})$和$W^{1,p'}_{0}(\\mathbb{R}^{2-})$中的两个元素，做分部积分，然后再做一次对$\\varphi$的逼近，最终得到延拓后函数的弱导数。具体实现过程如下： \u003c?xml version='1.0' encoding='UTF-8'?\u003e 延拓函数$F$的构造完全相同。现在令$\\eta(x)$为如右图所示的折线函数，折点分别在$-2,\\ -1,\\ 1,\\ 2$, 最小值为$0$, 最大值为$1$. 令$\\eta_{r} = \\eta(\\frac{y}{r})$. 那么对于$\\forall \\varphi\\in\\mathcal{D}(\\mathbb{R}^{2})$, 由泛函分析2 Example4和Example5可知，$\\varphi\\eta_{r}$分别在$\\mathbb{R}^{2+}$和$\\mathbb{R}^{2-}$上分别满足Sobolev函数分部积分的要求。因此，令$I_{r} = \\int_{\\mathbb{R}^{2+}}F(x,y)\\frac{\\partial \\varphi\\eta_{r}}{\\partial y} + \\int_{\\mathbb{R}^{2-}}F(x,y)\\frac{\\partial \\varphi\\eta_{r}}{\\partial y}$, 就有： $$ I_{r} = -\\int_{\\mathbb{R}^{2+}}\\frac{\\partial f(x,y)}{\\partial y}\\varphi\\eta_{r} - \\int_{\\mathbb{R}^{2-}}\\frac{\\partial f(x,-y)}{\\partial y}\\varphi\\eta_{r} $$ 由控制收敛定理，有： $$ I_{r}\\to-\\int_{\\mathbb{R}^{2+}}\\frac{\\partial f(x,y)}{\\partial y}\\varphi - \\int_{\\mathbb{R}^{2-}}\\frac{\\partial f(x,-y)}{\\partial y}\\varphi,\\ r\\to0 $$ 与此同时，对$I_{r}$的直接计算可以得到： \\begin{align} I_{r} \u0026= \\int_{\\mathbb{R}^{2+}}f(x,y)\\frac{\\partial\\varphi}{\\partial y}\\eta_{r} + \\int_{\\mathbb{R}^{2+}}f(x,y)\\frac{\\partial\\eta_{r}}{\\partial y}\\varphi + \\int_{\\mathbb{R}^{2-}}f(x,-y)\\frac{\\partial\\varphi}{\\partial y}\\eta_{r} + \\int_{\\mathbb{R}^{2-}}f(x,-y)\\frac{\\partial\\eta_{r}}{\\partial y}\\varphi \\nonumber\\\\ \u0026= \\int_{\\mathbb{R}^{2+}}f(x,y)\\frac{\\partial\\varphi}{\\partial y}\\eta_{r} + \\int_{\\mathbb{R}^{2-}}f(x,-y)\\frac{\\partial\\varphi}{\\partial y}\\eta_{r} + \\frac{1}{r}\\int_{r}^{2r}\\int_{-R}^{R}f(x,y)\\varphi(x,y)\\mathrm{d}x\\mathrm{d}y - \\frac{1}{r}\\int_{r}^{2r}\\int_{-R}^{R}f(x,y)\\varphi(x,-y)\\mathrm{d}x\\mathrm{d}y \\nonumber \\end{align} 其中设$supp\\ \\varphi\\subset[-R,R]^{2}$. 因此有： $$ I_{r} = \\int_{\\mathbb{R}^{2+}}f(x,y)\\frac{\\partial\\varphi}{\\partial y}\\eta_{r} + \\int_{\\mathbb{R}^{2-}}f(x,-y)\\frac{\\partial\\varphi}{\\partial y}\\eta_{r} + \\int_{r}^{2r}\\int_{-R}^{R}f(x,y)\\frac{\\varphi(x,y)-\\varphi(x,-y)}{r}\\mathrm{d}x\\mathrm{d}y $$ 因为由微分中值定理，$\\left|\\frac{\\varphi(x,y)-\\varphi(x,-y)}{r}\\right|\\leq C\\left\\|\\frac{\\partial\\varphi}{\\partial y}\\right\\|_{L^{\\infty}}$, 其中$C$是一个常数，因此： $$ \\int_{r}^{2r}\\int_{-R}^{R}f(x,y)\\frac{\\varphi(x,y)-\\varphi(x,-y)}{r}\\mathrm{d}x\\mathrm{d}y\\to0,\\ r\\to0 $$ 所以再由控制收敛定理有： $$ I_{r}\\to \\int_{\\mathbb{R}^{2+}}f(x,y)\\frac{\\partial\\varphi}{\\partial y} + \\int_{\\mathbb{R}^{2-}}f(x,-y)\\frac{\\partial\\varphi}{\\partial y},\\ r\\to0 $$ 因此显然可以得到$F\\in W^{1}(\\mathbb{R}^{2}),\\ F|_{\\mathbb{R}^{2+}} = f$. 由$f\\in W^{1,p}(\\mathbb{R}^{2+})$, 可以得到$F\\in W^{1,p}(\\mathbb{R}^{2})$, 且$\\|F\\|_{W^{1,p}(\\mathbb{R}^{2})} \\leq 2\\|f\\|_{W^{1,p}(\\mathbb{R}^{2+})}$.\n至此我们就将上半平面的函数延拓到了整个平面，实现了我们保持弱导数和控制模范数的目标。\nRemark 在以上的讨论中，注意到$\\eta$对$x$的导数是$0$, 因此在讨论$x$方向上的弱导数时自动消除了对$\\eta$求导的过程。利用这个性质，显然可以将以上的讨论拓展到$\\mathbb{R}^{n+} = {(x^{1}, x^{2},\u0026hellip;, x^{n})\\in\\mathbb{R}^{n}: x^{n}\\geq0}$的情况。 \u003c?xml version='1.0' encoding='UTF-8'?\u003e 通过以上的例子，我们将利用单位分解定理证明：在$\\mathbb{R}^{n}$上的有界且边界光滑的区域$\\Omega$上的Sobolev函数可以被延拓到整片$\\mathbb{R}^{n}$上。所谓边界光滑，就是$\\exists\\delta_ {0}\\ s.t.$ 对$\\forall P\\in\\partial\\Omega,\\ r\u0026lt;\\delta_{0},\\ \\exists\\varphi_{P}:\\ \\bar\\Omega \\cap B_ {r}(P)\\longrightarrow{(x^{1},x^{2},\u0026hellip;,x^{n})\\in B^{n}_ {1}:x^{n}\\geq 0} = \\hat{B_ {1}}$是微分同胚。用这个微分同胚就可以将$\\Omega$边界上的延拓转化成上半球的延拓，再将延拓后的函数用$\\varphi_{P}^{-1}$拉回去。这是微分几何的典型操作：\n先假设$f\\in W^{1,p}(\\Omega),\\ supp f\\subset B_{r}(P)\\cap\\bar{\\Omega}\\Rightarrow f\\left(\\varphi_{P}^{-1}(x)\\right)\\in W^{1,p}(\\hat{B_{1}})$. 则$f\\left(\\varphi_{P}^{-1}(x)\\right)$可以延拓为$G(x)\\in W^{1,p}(B^{n}_ {1})$, 再令$F(x) = G\\left(\\varphi_{P}(x)\\right)$, 则$F(x)$是$f(x)$的延拓，且$F$的模被$f$控制住。\n\u003c?xml version='1.0' encoding='UTF-8'?\u003e 这时我们就可以使用单位分解，将在$\\Omega$上的函数进行延拓：\n由$\\bar{\\Omega}$是紧集，设其被半径$\u0026lt; \\delta_{0}$的开球$U_{i}$有限覆盖，则存在一组非负函数$\\rho_{i}\\in C_{C}^{\\infty}(\\mathbb{R}^{n})$满足$\\mathrm{supp} \\rho_{i}\\subset U_{i},\\ \\sum_{i=1}^{n}\\rho_{i}\\leq1,\\ \\sum_{i=1}^{n}\\rho_{i}(x)=1,\\ \\forall x\\in\\Omega$. 那么此时对于$f\\in W^{1,p}(\\Omega),\\ f = \\sum_{i=1}^{n}\\rho_{i}f$. 这样就得到两种情况。对于$\\mathrm{supp}\\rho_{i}f\\subset\\Omega$, 即处在$\\Omega$内部的部分，只需令$F_{i} = \\rho_{i}f$; 对于$\\exists P\\ s.t.\\ \\rho_{i}f\\in W^{1,p}\\left(B_{r}(P)\\cap\\Omega\\right),\\ \\mathrm{supp}\\rho_{i}f\\subset B_{r}(P)$, 即处在$\\Omega$边界上的部分，就按照上述方法延拓为$F_{i}$.\n此时令$F = \\sum_{i=1}^{n}F_{i}$, 就有$\\exists\\Omega\u0026rsquo;\\supset\\supset\\Omega,\\ F\\in W^{1,p}(\\Omega\u0026rsquo;),\\ F|_ {\\Omega} = f$, 且$|F|_ {W^{1,p}(\\Omega\u0026rsquo;)}\\leq C|f|_{W^{1,p}(\\Omega)}$. 至此我们已经几乎达到目标。要想将其延拓到整个$\\R{n}$上，就只需要将最外面的部分逐渐消减到$0$, 通过光滑逼近易证，这时再进行零延拓后的函数依旧是Sobolev函数：\n取$\\Omega\\subset\\subset\\Omega\u0026rsquo;\u0026rsquo;\\subset\\subset\\Omega\u0026rsquo;$, 取$\\eta\\ s.t.\\ \\eta\\in C^{\\infty}(\\mathbb{R}^{n}),\\ \\eta|_ {\\Omega} = 1,\\ \\eta|_ {(\\Omega\u0026rsquo;\u0026rsquo;)^{C}} = 0,\\ \\eta\\in[0,1]$，则$\\mathrm{supp}\\eta F\\subset\\subset\\Omega\u0026rsquo;,\\ |\\eta F|_ {L^{p}(\\Omega\u0026rsquo;)}\\leq|F|_ {L^{p}(\\Omega\u0026rsquo;)}$. 由$|\\nabla\\eta F|\\leq|\\nabla\\eta||F|+\\eta|F|$, 就有$|\\nabla\\eta F|_ {L^{p}(\\Omega\u0026rsquo;)}\\leq C\\left(|F|_ {L^{p}(\\Omega\u0026rsquo;)}+|\\nabla F|_ {L^{p}(\\Omega\u0026rsquo;)}\\right)$. 因此$\\eta F\\in W^{1,p}_{0}(\\Omega\u0026rsquo;)$且模被$f$控制。这样我们就彻底完成了任务。虽然整个过程并未写成一个严谨的证明，但具体的细节和核心思想已经完全阐述清楚，我们将其写成一个具体的定理：\nTheorem 1 设$\\Omega$是一个光滑有界区域，$f\\in W^{1,p}(\\Omega)$, 设$\\Omega\\subset\\subset B_{R}(0)$, 则$\\exists$线性算子$P:W^{1,p}(\\Omega)\\longrightarrow W_{0}^{1,p}(B_{R})\\ s.t.\\ P(f)|_{\\Omega} = f$, 且$\\|P(f)\\|_{W^{1,p}(B_{R}(0))}\\leq C\\|f\\|_{W^{1,p}(\\Omega)}$. Remark 上文已经说过，$P(f)$经过零延拓后也是$W^{1,p}(\\mathbb{R}^{n})$中的元素。 Remark $P$的线性性来源于单位分解的构造$\\sum_{i=1}^{n}\\rho_{i}f$. 因此线性性是显然的。 Remark 对于不光滑的有界区域（如矩形区域）也可以做延拓，思想是完全一致的。实际上光滑的条件可以减弱到Lipschitz连续，具体内容可以参考Evans的$\\textit{Measure Theory And Fine Properties of Functions}$. 延拓定理可以强化泛函分析2 Theorem2的结论。它告诉我们只要$\\Omega$的性质足够好，就可以用光滑函数逼近整个区域上的函数。\nCorollary 设$\\Omega$是有界光滑区域，设$u\\in W^{1,p}(\\Omega)$, 则$\\exists u_{k}\\in C^{\\infty}(\\mathbb{R}^{n})\\ s.t.\\ \\|u_{k}-u\\|_{W^{1,p}(\\Omega)}\\to 0$. Proof. 令$v = P(u)\\in W_{0}^{1,p}(B_{R})\\Rightarrow\\exists v_{k}\\in\\mathcal{D}(\\mathbb{R}^{n})\\ s.t.\\ \\|v_{k}-v\\|_{W^{1,p}(\\mathbb{R}^{n})}\\to 0,\\ k\\to+\\infty$. 那么$\\|v_{k}-v\\|_{W^{1,p}(\\Omega)} = \\|v_{k}-u\\|_{W^{1,p}(\\Omega)}\\to 0,\\ k\\to+\\infty$. ","permalink":"https://guoranguan.site/posts/fucana4/","summary":"如何将函数自然地延拓到整个空间的同时，限制原函数及其弱导数的“大小”？","title":"泛函分析4 - 延拓定理"},{"content":"类似经典导数的情况，我们对于弱导数也有链式法则：\nTheorem 1 设$f\\in C^{1}(\\mathbb{R}^{n})$且$f'\\in L^{\\infty}(\\mathbb{R}^{n}),\\ u\\in W^{1,p}(\\Omega)$, 则$f(u)\\in W^{1,p}_{loc}(\\Omega),\\ \\nabla f(u)\\in L^{p}(\\Omega)$. Proof. 取$\\varphi_{k}\\in C^{\\infty}(\\mathbb{R}^{n})\\ s.t.\\ \\|\\varphi_{k}-u\\|_{W^{1,p}(\\Omega')}\\to0,\\ k\\to+\\infty,\\ \\forall\\Omega'\\subset\\subset\\Omega$. 因此有经典的Chain Rule: $\\frac{\\partial f}{\\partial x^{i}}(\\varphi_{k}) = f'(\\varphi_{k})\\frac{\\partial \\varphi_{k}}{\\partial x^{i}}$. 先看原函数的收敛估计。由微分中值定理： $$ \\|f(\\varphi_{k})-f(u)\\|_{L^{p}(\\Omega')}\\leq\\|f'\\|_{L^{\\infty}(\\mathbb{R}^{n})}\\|\\varphi_{k}-u\\|_{L^{p}(\\Omega')}\\to 0,\\ k\\to+\\infty $$ 再看导函数的收敛估计： $$ \\left|f'(\\varphi_{k})\\frac{\\partial\\varphi_{k}}{\\partial x^{i}}-f'(u)\\frac{\\partial u}{\\partial x^{i}}\\right|\\leq\\left|f'(\\varphi_{k})\\left(\\frac{\\partial\\varphi_{k}}{\\partial x^{i}}-\\frac{\\partial u}{\\partial x^{i}}\\right)\\right| + |f'(\\varphi_{k})-f'(u)|\\left|\\frac{\\partial u}{\\partial x^{i}}\\right| $$ 因此有模估计： $$ \\left\\|f'(\\varphi_{k})\\frac{\\partial\\varphi_{k}}{\\partial x^{i}}-f'(u)\\frac{\\partial u}{\\partial x^{i}}\\right\\|_{L^{p}(\\Omega')}\\leq\\|f'\\|_{L^{\\infty}(\\mathbb{R}^{n})}\\left\\|\\frac{\\partial\\varphi_{k}}{\\partial x^{i}}-\\frac{\\partial u}{\\partial x^{i}}\\right\\|_{L^{p}(\\Omega')} + \\left(\\int_{\\Omega'}|f'(\\varphi_{k})-f'(u)|^{p}\\left|\\frac{\\partial u}{\\partial x^{i}}\\right|^{p}\\right)^{\\frac{1}{p}} $$ 由实分析的常用技巧，因为$\\varphi_{k}\\stackrel{L^{p}_{loc}(\\Omega)}{\\longrightarrow}u$, 所以不妨设$\\varphi_{k}\\stackrel{a.e.}{\\longrightarrow}u$, 因此还有$f'(\\varphi_{k})\\stackrel{a.e.}{\\longrightarrow}f'(u)$. 所以利用$\\|f'\\|_{L^{\\infty}(\\mathbb{R}^{n})}\u003c+\\infty$, 由控制收敛定理： $$ \\left\\|f'(\\varphi_{k})\\frac{\\partial\\varphi_{k}}{\\partial x^{i}}-f'(u)\\frac{\\partial u}{\\partial x^{i}}\\right\\|_{L^{p}(\\Omega')}\\to0,\\ k\\to+\\infty $$ 结合以上两点，利用弱导数的定义和Hölder不等式易证积分收敛，从而得到$f(u)\\in W^{1}_{loc}(\\Omega)$且$\\frac{\\partial f(u)}{\\partial x^{i}} = f'\\left(\\frac{\\partial u}{\\partial x^{i}}\\right)\\in L^{p}(\\Omega)$, 也即$f(u)\\in W^{1,p}_{loc}(\\Omega)$. 有了链式法则这一工具之后，就可以研究上下截断函数的弱导数。截断函数由于其有界性，可以迂回地证明很多无法直接证明的结论。一个典型的方法是先将函数截断，再使用Levi收敛定理，有时可以避免无法判断积分是否收敛的情况。另外，由$|u| = u^{+} + u^{-}$, 还可以用来研究绝对值函数的弱导数。\n以下的例子告诉我们研究截断函数弱导数的具体思路：\nExample 1 令$f_{\\varepsilon}(t) = \\left\\{ \\begin{aligned} \u0026 \\sqrt{t^{2}+\\varepsilon^{2}}-\\varepsilon,\u0026 t\u003e0 \\\\ \u0026 0,\u0026 t\\leq 0 \\\\ \\end{aligned} \\right.$, 则$f_{\\varepsilon}\\in C^{1}(\\mathbb{R}),\\ \\lim\\limits_{\\varepsilon\\to0}f_{\\varepsilon} = \\max\\{t,0\\}$. 取$u\\in W^{1,p}(\\Omega)$, 则$f_{\\varepsilon}(u) = \\left\\{ \\begin{aligned} \u0026 \\sqrt{u^{2}+\\varepsilon^{2}}-\\varepsilon,\u0026 u\u003e0 \\\\ \u0026 0,\u0026 u\\leq 0 \\\\ \\end{aligned} \\right.$. 由分子有理化，在$u\u003e0$时，$f_{\\varepsilon}(u) = \\frac{u^{2}}{\\sqrt{u^{2}+\\varepsilon^{2}}+\\varepsilon}\\leq u$. 因此$f_{\\varepsilon}(u)\\in L^{p}(\\Omega)$. 由Theorem 1, $f_{\\varepsilon}(u)\\in W^{1,p}(\\Omega)$. 由$f_{\\varepsilon}$的构造，令$\\varepsilon\\to0,\\ f_{\\varepsilon}(u)\\to\\max\\{u,0\\} = u^{+}$. 先看原函数的收敛估计。由控制收敛定理： $$ \\int_{\\Omega}|f_{\\varepsilon}(u)-u^{+}|^{p} = \\int_{\\{u\u003e0\\}}\\left|\\frac{u^{2}}{\\sqrt{u^{2}+\\varepsilon^{2}}+\\varepsilon}-u^{+}\\right|^{p}\\to 0,\\ \\varepsilon\\to 0 $$ 再看导函数的收敛估计： $$ \\frac{\\partial f_{\\varepsilon}(u)}{\\partial x^{i}} = f'_{\\varepsilon}(u)\\frac{\\partial u}{\\partial x^{i}} = \\left\\{ \\begin{aligned} \u0026 \\frac{u}{\\sqrt{u^{2}+\\varepsilon^{2}}}\\cdot\\frac{\\partial u}{\\partial x^{i}},\u0026 u\u003e0 \\\\ \u0026 0,\u0026 u\\leq 0 \\\\ \\end{aligned} \\right. $$ 令$v_{i} = \\left\\{ \\begin{aligned} \u0026 \\frac{\\partial u}{\\partial x^{i}},\u0026 u\u003e0 \\\\ \u0026 0,\u0026 u\\leq 0 \\\\ \\end{aligned} \\right.$, 于是有： $$ \\left\\|\\frac{\\partial f_{\\varepsilon}(u)}{\\partial x^{i}}-v_{i}\\right\\|_{L^{p}(\\Omega)}\\to 0,\\ \\varepsilon\\to 0 $$. 结合以上两点，利用弱导数的定义和Hölder不等式易证积分收敛，从而得到$u^{+}\\in W^{1,p}(\\Omega)$且$\\frac{\\partial u^{+}}{\\partial x^{i}} = v_{i} = \\left\\{ \\begin{aligned} \u0026 \\frac{\\partial u}{\\partial x^{i}},\u0026 u\u003e0 \\\\ \u0026 0,\u0026 u\\leq 0 \\\\ \\end{aligned} \\right.$, 即$\\nabla u^{+} = \\left\\{ \\begin{aligned} \u0026 \\nabla u,\u0026 u\u003e0 \\\\ \u0026 0,\u0026 u\\leq 0 \\\\ \\end{aligned} \\right.$. 类似地，我们也可以做出$u^{-}$的情况：只需将$u$取负按照同样的方法操作即可。现在我们将以上的内容整理成如下定理：\nTheorem 2 设$u\\in W^{1,p}(\\Omega)$, 则： $u^{+},\\ u^{-},\\ |u|\\in W^{1,p}(\\Omega)$ $\\nabla u^{+} = \\left\\{ \\begin{aligned} \u0026 \\nabla u,\u0026 u\u003e0 \\\\ \u0026 0,\u0026 u\\leq 0 \\\\ \\end{aligned} \\right.$ $\\nabla u^{-} = \\left\\{ \\begin{aligned} \u0026 -\\nabla u,\u0026 u\u003c0 \\\\ \u0026 0,\u0026 u\\geq 0 \\\\ \\end{aligned} \\right.$ $|\\nabla u| = \\left|\\nabla |u|\\right|$ Proof. 只需强调一部分内容即可。定义$u^{-} = \\max\\{-u,0\\}$, 因此$|u| = u^{+} + u^{-}$. 对于第4点的右侧，有$\\nabla|u| = \\nabla (u^{+} + u^{-}) = \\left\\{ \\begin{aligned} \u0026 \\nabla u,\u0026 u\u003e0 \\\\ \u0026 0,\u0026 u=0 \\\\ \u0026 -\\nabla u,\u0026 u\u003c0 \\\\ \\end{aligned} \\right.$. 左侧有$\\nabla u = \\nabla (u^{+} - u^{-}) = \\left\\{ \\begin{aligned} \u0026 \\nabla u,\u0026 u\u003e0 \\\\ \u0026 0,\u0026 u=0 \\\\ \u0026 \\nabla u,\u0026 u\u003c0 \\\\ \\end{aligned} \\right.$. 因此二者的模相等。此处必须要注意“相等”是在几乎处处的意义上，而非点点相等。 \u003c?xml version='1.0' encoding='UTF-8'?\u003e 利用这个定理证明最后的“几乎处处相等”，会得到一个非常有趣的推论，我们不加证明地以例子的形式感受其核心思想：\nExample 2 设$u\\in C^{\\infty}(\\Omega),\\ u(x_{0}) = 0$. 此时会出现两种情况： $\\nabla u(x_{0}) = 0$ $\\nabla u(x_{0}) \\neq 0$ 那么由$|\\nabla u| = \\left|\\nabla |u|\\right|,\\ \\dim\\{\\nabla u(x)\\neq 0,\\ u(x) = 0\\}\\leq n-1$. 对于$f\\in C^{\\infty}(\\mathbb{R})$来说，$\\{x: f'(x)\\neq 0,\\ f(x) = 0\\}$至多是可数集。这个结论体现了一部分正则值原像定理的思想。 我们可以利用如下方法构造截断函数：\nExample 3 设$u\\in W^{1,p}(\\Omega)$, 令$u^{A} = (u-A)^{+} + A = \\max\\{u,A\\}$是一个下截断函数。那么就有$u^{A}\\in W^{1,p}(\\Omega),\\ \\nabla u^{A} = \\left\\{ \\begin{aligned} \u0026 \\nabla u,\u0026 u\u003eA \\\\ \u0026 0,\u0026 u\\leq A \\\\ \\end{aligned} \\right.$. 类似地，$\\min\\{u,A\\}$也可以如是构造。 现在就可以看一个截断函数的简单运用：\nExample 4 设$u\\in W^{1,2}_{0}$是$-\\Delta u = u^{2}$的弱解。则$u\\in L^{3}(\\Omega)$.\n假设我们期待用$\\varphi_{k}\\in\\mathcal{D}(\\Omega)$在$W^{1,2}$中逼近$u$, 那么由弱解定义，$\\int_{\\Omega}\\nabla u\\nabla\\varphi_{k} = \\int_{\\Omega}u^{2}\\varphi_{k}$. 但此时我们无法再直接使用Hölder不等式或控制收敛定理证明右侧的积分必定收敛了，因此需要使用截断函数的方法。\nProof. 取$A\u003e0$, 令$v_{A} = \\max\\{\\min\\{u,A\\},0\\}\\Rightarrow v_{A}\\in L^{\\infty}(\\Omega)\\cap W^{1,2}_{0}(\\Omega)$. 于是类似“泛函分析2”Example 6有： $$ \\int_{\\Omega}|\\nabla u|^{2}\\geq\\int_{\\Omega}\\nabla u\\nabla v_{A} = \\int_{\\Omega}u^{2}v_{A} $$ 令$A\\to+\\infty$, 则由Levi渐升定理，$\\int_{\\Omega}|\\nabla u|^{2}\\geq\\int_{\\{u\\geq0\\}}u^{3}$. 类似地，再令$v'_{A} = \\min\\{\\max\\{u,-A\\},0\\}\\Rightarrow \\int_{\\Omega}|\\nabla u|^{2}\\geq\\int_{\\{u\\leq0\\}}u^{3}$. 因此$\\int_{\\Omega}u^{3}\u003c+\\infty$.\n","permalink":"https://guoranguan.site/posts/fucana3/","summary":"体会弱导数和强导数的微妙差异。","title":"泛函分析3 - 链式法则"},{"content":"我们将阐明Sobolev空间的本质是光滑函数某种意义上的完备化。\n令$\\omega$是磨光核，i.e. $\\omega\\geq 0,\\ \\int_{\\mathbb{R}^{n}}\\omega = 1,\\ \\omega\\in\\mathcal{D}\\left(B_{1}^{n}(0)\\right)$. 令$\\omega_{\\varepsilon} = \\frac{\\omega(x/\\varepsilon)}{\\varepsilon^{n}}\\Rightarrow \\omega_{\\varepsilon}\\in\\mathcal{D}\\left(B_{\\varepsilon}^{n}(0)\\right),\\ \\omega_{\\varepsilon}\\geq 0,\\ \\int_{\\mathbb{R}^{n}}\\omega_{\\varepsilon} = 1$. 通过磨光核，可以对$f\\in L_{loc}^{1}(\\mathbb{R}^{n})$定义卷积$f_{\\varepsilon} = f * \\omega_{\\varepsilon} = \\int_{\\mathbb{R}^{n}}f(x-y)\\omega_{\\varepsilon}(y)\\mathrm{d}y = \\int_{\\mathbb{R}^{n}}f(y)\\omega_{\\varepsilon}(x-y)\\mathrm{d}y$. 则由实分析的基本结论，有：\n$f_{\\varepsilon}\\in C^{\\infty}(\\mathbb{R}^{n})$, 若$supp f$有界，则$f_{\\varepsilon}\\in\\mathcal{D}(\\mathbb{R}^{n})$. $f\\in L^{p}(\\mathbb{R}^{n})\\Rightarrow |f_{\\varepsilon}-f|_{L^{p}(\\mathbb{R}^{n})}\\to 0,\\ \\varepsilon\\to 0$. 现在令$f\\in W^{1,p}(\\mathbb{R}^{n})$, 我们有如下的推理： $$ \\frac{\\partial f_{\\varepsilon}(x)}{\\partial x^{i}} = \\int_{\\mathbb{R}^{n}}f(y)\\frac{\\partial \\omega_{\\varepsilon}}{\\partial x^{i}}(x-y)\\mathrm{d}y = -\\int_{\\mathbb{R}^{n}}f(y)\\frac{\\partial\\omega_{\\varepsilon}}{\\partial y^{i}}(x-y)\\mathrm{d}y = \\int_{\\mathbb{R}^{n}}\\frac{\\partial f}{\\partial y^{i}}(y)\\omega_{\\varepsilon}(x-y)\\mathrm{d}y $$\n以上最后一个等号用到了弱导数的性质。于是我们得到结论： $$ \\frac{\\partial f_{\\varepsilon}(x)}{\\partial x^{i}} = \\left(\\frac{\\partial f}{\\partial x^{i}}\\right) * \\omega_{\\varepsilon} \\Rightarrow \\left|\\frac{\\partial f_{\\varepsilon}}{\\partial x^{i}} - \\frac{\\partial f}{\\partial x^{i}} \\right|_{L^{p}(\\mathbb{R}^{n})} \\to 0,\\ \\varepsilon\\to 0. $$\n利用$C_ {p}$不等式 ，我们可以将以上的推理写成如下引理：\nLemma 1 设$f\\in W^{1,p}(\\mathbb{R}^{n})$, 则$\\lim\\limits_{\\varepsilon\\to 0}\\|f_{\\varepsilon}-f\\|_{W^{1,p}(\\mathbb{R}^{n})} = 0$. 利用弱导数的定义和Hölder不等式（用于证明积分收敛），可以得到如下推论：\nCorollary $f\\in W^{1,p}(\\mathbb{R}^{n})$, 当且仅当$\\exists f_{k}\\in C^{\\infty}(\\mathbb{R}^{n})\\cap W^{1,p}(\\mathbb{R}^{n}),\\ g_{i}\\in L^{p}(\\mathbb{R}^{n})\\ s.t.\\ \\|f_{k}-f\\|_{L^{p}(\\mathbb{R}^{n})}\\to 0,\\ \\sum_{i=1}^{n}\\|\\frac{\\partial f_{k}}{\\partial x^{i}} - g_{i}\\|_{L^{p}(\\mathbb{R}^{n})}\\to 0,\\ k\\to +\\infty$. 我们现在想要弱化以上推论的条件，证明$W^{1,p}$中的元素可以被紧支光滑函数逼近。其中用到了截断函数(cut-off function)的重要技巧。\n令$\\eta\\in C^{\\infty}(\\mathbb{R}^{n})\\ s.t.\\ \\eta = \\begin{cases} 1,\\ \u0026amp;|x|\u0026lt;1 \\\\ \\in(0,1),\\ \u0026amp;\\text{otherwise} \\\\ 0,\\ \u0026amp;|x|\u0026gt;2 \\end{cases}$. 由实分析的结论，我们知道这样的$\\eta$一定存在。现令$\\eta_ {m} = \\eta\\left(\\frac{x}{m}\\right)$, 则利用控制收敛定理可知，$\\eta_{m}f_{k}\\in\\mathcal{D}(\\mathbb{R}^{n}),\\ |\\eta_{m}f_{k}-f_{k}|_{L^{p}(\\mathbb{R}^{n})}\\to 0,\\ m\\to +\\infty$.\n现在我们考察它们的导数是否可以逼近： $$ |\\nabla\\eta_{m}f_{k}-\\nabla f_{k}| = |(\\nabla\\eta_{m})f_{k}+(\\eta_{m}-1)\\nabla f_{k}| \\leq |\\nabla\\eta_{m}||f_{k}|+|\\eta_{m}-1||\\nabla f_{k}| \\leq \\frac{c}{m}|f_{k}| + |\\eta_{m}-1||\\nabla f_{k}| $$ 其中$c$是一个与$\\eta$有关的常数。由控制收敛定理，有： $$ \\lim\\limits_{m\\to+\\infty}|\\nabla\\eta_{m}f_{k} - \\nabla f_{k}|_{L^{p}(\\mathbb{R}^{n})} = 0 $$\n结合对原函数的逼近和对导数的逼近，此时对$\\forall k$, 取$m_ {k}\\ s.t.\\ |\\eta_{m_{k}}f_{k}-f_{k}|_ {W^{1,p}(\\mathbb{R}^{n})}\u0026lt;\\frac{1}{k}$, 令$\\varphi_{k} = \\eta_{m_ {k}}f_ {k}\\in\\mathcal{D}(\\mathbb{R}^{n})$，则有$|\\varphi_{k}-f_{k}|_{W^{1,p}(\\mathbb{R}^{n})}\\to 0,\\ k\\to+\\infty$.\n由以上$f_{k}$和$\\varphi_{k}$的构造，我们可以很容易地得到以下的定理：\nTheorem 1 $f\\in W^{1,p}(\\mathbb{R}^{n})\\iff \\exists\\varphi_{k}\\in\\mathcal{D}(\\mathbb{R}^{n})$且$\\|\\varphi_{k}-f\\|_{W^{1,p}(\\mathbb{R}^{n})}\\to 0,\\ k\\to+\\infty$. 但是当我们想要将$\\mathbb{R}^{n}$的情况推广到任意的$\\Omega\\subset\\mathbb{R}^{n}$时，会很明显的遇到问题。假设类似上面的操作，为了做卷积，我们先将$f$进行零延拓：$f|_ {\\Omega^{\\mathrm{c}}} = 0,\\ f_ {\\varepsilon} = f * \\omega_ {\\varepsilon} = \\int_ {\\mathbb{R}^{n}}f(y)\\omega_{\\varepsilon}(x-y)\\mathrm{d}y$. 类似地，我们有： $$ \\frac{\\partial f_{\\varepsilon}}{\\partial x^{i}}(x) = -\\int_{\\mathbb{R}^{n}}f(y)\\frac{\\partial\\omega_{\\varepsilon}}{\\partial x^{i}}(x-y)\\mathrm{d}y = \\int_{\\mathbb{R}^{n}}f(y)\\frac{\\partial\\omega_{\\varepsilon}}{\\partial y^{i}}(x-y)\\mathrm{d}y $$ 我们想在这一步开始做分部积分。但此时我们注意到$\\frac{\\partial\\omega_{\\varepsilon}}{\\partial y^{i}}(x-y)$并不一定在$\\mathcal{D}(\\Omega)$中！\n\u003c?xml version='1.0' encoding='UTF-8'?\u003e 从上图中可以看出来，正因为$supp\\ \\frac{\\partial\\omega_{\\varepsilon}}{\\partial y^{i}}(x-y)\\subset B_{\\varepsilon}(x)$, 因此当$x$很靠近$\\Omega$的边界时，这个函数就不再属于$\\mathcal{D}(\\Omega)$了。这就提示我们，在处理$\\Omega$的情况时，要注意边界的问题，在$\\Omega\u0026rsquo;\\subset\\subset\\Omega$时才能把磨光核的支集控制在$\\Omega$中。\n我们将上面的想法严格地写成定理和证明：\nTheorem 2 令$f\\in W^{1,p}(\\Omega)$, 则$\\exists\\varphi_{k}\\in C^{\\infty}(\\mathbb{R}^{n})\\ s.t.\\ $对$\\forall \\Omega'\\subset\\subset\\Omega$, 有$\\|\\varphi_{k}-f\\|_{W^{1,p}(\\Omega')}\\to 0,\\ k\\to+\\infty$. Proof. 取核$\\omega$, 令$f|_{\\Omega^{\\mathrm{c}}} = 0,\\ f_{\\varepsilon} = f * \\omega_{\\varepsilon} = \\int_{\\mathbb{R}^{n}}f(y)\\omega_{\\varepsilon}(x-y)\\mathrm{d}y$. 于是有： $$ \\frac{\\partial f_{\\varepsilon}}{\\partial x^{i}}(x) = \\int_{\\mathbb{R}^{n}}f(y)\\frac{\\partial\\omega_{\\varepsilon}}{\\partial x^{i}}(x-y)\\mathrm{d}y =- \\int_{\\mathbb{R}^{n}}f(y)\\frac{\\partial\\omega_{\\varepsilon}}{\\partial y^{i}}(x-y)\\mathrm{d}y $$ 令$x\\in\\Omega',\\ \\varepsilon\u003c\\mathrm{d}(\\Omega', \\partial\\Omega)\\Rightarrow \\frac{\\partial\\omega_{\\varepsilon}}{\\partial y^{i}}\\in\\mathcal{D}(\\Omega)$.于是有： $$ \\frac{\\partial f_{\\varepsilon}}{\\partial x^{i}}(x) = \\int_{\\Omega}\\frac{\\partial f}{\\partial y^{i}}(y)\\omega_{\\varepsilon}(x-y)\\mathrm{d}y $$ 现在令$F_{i} = \\left\\{ \\begin{aligned} \u0026 \\frac{\\partial f}{\\partial y^{i}}(y),\u0026y\\in\\Omega \\\\ \u0026 0,\u0026 y\\notin\\Omega \\\\ \\end{aligned} \\right.$, 于是有： $$ \\frac{\\partial f_{\\varepsilon}}{\\partial x^{i}}(x) = F_{i} * \\omega_{\\varepsilon},\\ \\forall x\\in\\Omega',\\ F_{i} * \\omega_{\\varepsilon}\\stackrel{L^{p}(\\mathbb{R}^{n})}{\\longrightarrow}F_{i},\\ \\varepsilon\\to 0. $$ 因此就可以得到： $$ \\left\\|\\frac{\\partial f_{\\varepsilon}}{\\partial x^{i}}-\\frac{\\partial f}{\\partial x^{i}}\\right\\|_{L^{p}(\\Omega')} = \\|F_{i} * \\omega_{\\varepsilon}-F_{i}\\|_{L^{p}(\\Omega')} \\leq \\|F_{i} * \\omega_{\\varepsilon}-F_{i}\\|_{L^{p}(\\mathbb{R}^{n})}\\to 0,\\ \\varepsilon\\to 0 $$ 剩下的证明内容由$f_{\\varepsilon}$的构造和光滑逼近是显然的。 通过上面的定理我们了解到，$W^{1,p}(\\Omega)$中的任意元素都能够被$C^{\\infty}(\\mathbb{R}^{n})$中的函数逼近，但不都能够被$\\mathcal{D}(\\Omega)$中的函数逼近。于是，将那些能够被$\\mathcal{D}(\\Omega)$中的函数逼近的元素就值得单独划出一个门类来。这再一次体现了”完备化“的思想！\nDefinition 1 称$f\\in W^{k,p}_{0}(\\Omega)$, 若$\\exists\\varphi_{k}\\in\\mathcal{D}(\\Omega)\\ s.t.\\ \\|\\varphi_{k} - f\\|_{W^{k,p}(\\Omega)}\\to0,\\ k\\to+\\infty$. Example 1 由上面$\\mathbb{R}^{n}$的情况可知，$W_{0}^{1,p}(\\mathbb{R}^{n}) = W^{1,p}(\\mathbb{R}^{n})$. Example 2 由上面的证明过程容易推得：若$f\\in W^{1,p}(\\Omega)$且$supp\\ f\\subset\\subset\\Omega\\Rightarrow f\\in W^{1,p}_{0}(\\Omega)$. Example 3 以下的结论通过两次逼近也是显然的：设$f_{k}\\in W^{1,p}_{0}(\\Omega),\\ f\\in W^{1,p}(\\Omega)$且$\\|f_{k}-f\\|_{W^{1,p}(\\Omega)}\\to 0,\\ k\\to+\\infty$, 则$f\\in W_{0}^{1,p}(\\Omega)$. 虽然简单，但这是一个重要的结论。它告诉我们$W_{0}^{k,p}$是$W^{k,p}$的闭子空间。 下面的两个例子可以将分部积分的条件从$\\mathcal{D}(\\Omega)$放松到Sobolev空间上。\nExample 4 设$f\\in W^{1,p}(\\Omega),\\ g\\in W_{0}^{1,p'}(\\Omega),\\ p\u003e1,\\ \\frac{1}{p} + \\frac{1}{p'} = 1$. 则$\\int_{\\Omega}f\\frac{\\partial g}{\\partial x^{i}} = -\\int_{\\Omega}\\frac{\\partial f}{\\partial x^{i}}g$. Proof. 取$\\varphi_{k}\\in\\mathcal{D}(\\Omega)\\ s.t.\\ \\|\\varphi_{k}-g\\|_{W^{1,p'}(\\Omega)}\\to 0,\\ k\\to+\\infty$.由Sobolev函数的性质，我们有： $$ \\int_{\\Omega}f\\frac{\\partial \\varphi_{k}}{\\partial x^{i}} = -\\int_{\\Omega}\\frac{\\partial f}{\\partial x^{i}}\\varphi_{k} $$ 由$W^{1,p'}$模与$L^{p'}$模在原函数和弱导数上的关系，利用Hölder不等式证明两边可以取到极限: $$ \\int_{\\Omega}f\\frac{\\partial \\varphi_{k}}{\\partial x^{i}}\\to\\int_{\\Omega}f\\frac{\\partial g}{\\partial x^{i}},\\ \\int_{\\Omega}\\frac{\\partial f}{\\partial x^{i}}\\varphi_{k}\\to\\int_{\\Omega}\\frac{\\partial f}{\\partial x^{i}}g,\\ k\\to+\\infty $$ 即可得到结论。 Example 5 令$f\\in W^{1,1}(\\Omega)$, 设$g\\in W^{1}(\\Omega)$满足： $supp\\ g\\subset\\subset\\Omega$ $|g| + |Dg|\u003c C $, 其中$C$是一个常数 则$\\int_{\\Omega}f\\frac{\\partial g}{\\partial x^{i}} = -\\int_{\\Omega}\\frac{\\partial f}{\\partial x^{i}}g$. Proof. 由Example2易证$g\\in W_{0}^{1,p}(\\Omega),\\ \\forall p$. 现取$\\varphi_{k}\\in C(\\mathbb{R}^{n})\\ s.t.\\ \\|\\varphi_{k}-f\\|_{W^{1,1}(\\Omega)}\\to 0,\\ k\\to+\\infty,\\ \\forall\\Omega'\\subset\\subset\\Omega$. 于是有： $$ \\int_{\\Omega}g\\frac{\\partial \\varphi_{k}}{\\partial x^{i}} = -\\int_{\\Omega}\\frac{\\partial g}{\\partial x^{i}}\\varphi_{k} $$ 通过控制收敛，我们证明两边可以取到极限： $$ \\int_{\\Omega}g\\frac{\\partial \\varphi_{k}}{\\partial x^{i}}\\to\\int_{\\Omega}g\\frac{\\partial f}{\\partial x^{i}},\\ \\int_{\\Omega}\\frac{\\partial g}{\\partial x^{i}}\\varphi_{k}\\to\\int_{\\Omega}\\frac{\\partial g}{\\partial x^{i}}f,\\ k\\to+\\infty $$ 即可得到结论。 接下来的例子将会展示一个重要且常用的结果：Laplace算子的解的导数可以被原函数和解控制。\nExample 6 我们先将弱解的定义从$\\mathcal{D}(\\Omega)$延拓到Sobolev空间上。现设$u\\in W^{1,2}(\\Omega),\\ f\\in L^{2},\\ u$是$\\Delta u = f$的弱解，i.e., $\\forall \\varphi\\in\\mathcal{D}(\\Omega),\\ \\int_{\\Omega}\\nabla u\\nabla \\varphi = \\int_{\\Omega}f\\varphi$. 因此对于$\\forall v\\in W_{0}^{1,2}(\\Omega)$, 取$\\varphi_{k}\\in\\mathcal{D}(\\Omega)\\ s.t.\\ \\int_{\\Omega}|\\nabla\\varphi_{k}-\\nabla v|^{2}\\to 0,\\ \\int_{\\Omega}|\\varphi_{k}- v|^{2}\\to 0,\\ k\\to+\\infty$. 因此由Hölder不等式两边取极限易证：$\\int_{\\Omega}\\nabla u\\nabla v = \\int_{\\Omega}fv,\\ \\forall v\\in W^{1,2}_{0}(\\Omega)$. 现令$v = \\eta^{2}u$, 其中$\\eta\\in\\mathcal{D}(\\Omega)$且$\\eta|_{\\Omega'} = 1,\\ \\Omega'\\subset\\subset\\Omega$. 由Example2，$v\\in W_{0}^{1,2}(\\Omega)$. 于是由弱解的延拓定义，我们有： $$ \\int_{\\Omega}\\nabla u\\nabla \\eta^{2}u = \\int_{\\Omega}\\eta^{2}uf $$ 展开并化简： $$ \\int_{\\Omega}\\nabla u(\\eta^{2}\\nabla u+2\\eta u\\nabla \\eta) = \\int_{\\Omega}\\eta^{2}|\\nabla u|^{2} + \\int_{\\Omega}2\\nabla u (\\nabla\\eta)\\eta u = \\int_{\\Omega}\\eta^{2}uf $$ 因此就由基本不等式得到: $$ \\int_{\\Omega}\\eta^{2}|\\nabla u|^{2} = \\int_{\\Omega}\\eta^{2}uf - \\int_{\\Omega}2(\\eta\\nabla u)(u\\nabla\\eta)\\leq C\\left(\\int_{\\Omega}\\eta^{2}f^{2}+\\int_{\\Omega}\\eta^{2}u^{2}\\right)+\\varepsilon\\int_{\\Omega}\\eta^{2}|\\nabla u|^{2}+\\frac{4}{\\varepsilon}\\int_{\\Omega}|\\nabla\\eta|^{2}u^{2} $$ 任取一个$\\varepsilon\u003c1$, 并且利用$\\eta$紧支光滑函数及其导数的有界性，就可以得到： $$ \\int_{\\Omega'}|\\nabla u|^{2}\\leq\\int_{\\Omega}\\eta^{2}|\\nabla u|^{2}\\leq C\\int_{\\Omega}(f^{2}+u^{2}) $$ 其中$C$是一个与$u$无关的常数。 ","permalink":"https://guoranguan.site/posts/fucana2/","summary":"Sobolev空间，距离离我们熟悉的空间，到底有多远？","title":"泛函分析2 - 光滑逼近"},{"content":"对于一个光滑函数，我们总可以定义其导数。但是我们同时也知道，一列光滑函数的极限函数不总是可微的，如何定义这些函数的导数？我们需要弱导数的概念，并以此重新划出一个空间。这个空间实际上就是光滑函数的完备化。\n在这一节，我们总是令$\\Omega$是$\\mathbb{R}^{n}$中的一个区域。 同时沿用实分析的定义，若$E\\subset\\mathbb{R}^{n}$可测，$f,\\ g$可测，称$f\\sim g$, 若$f = g\\ a.e.$, 并用$f$代替$f/_ {\\sim}$, 则$L^{p}(E) = \\left\\{f: \\int_ {E} |f|^{p} \u0026lt; \\infty \\right\\}$, 其中$f$可测。对$p\\in(1,+\\infty)$定义$\\Vert f\\Vert_{L^{p}(E)} = \\left(\\int_{E}|f|^{p} \\right)^{\\frac{1}{p}}$; 对$p = +\\infty$定义 $\\Vert f\\Vert_{L^{\\infty}(E)} = \\inf\\limits_{Z\\subset E,\\ \\mu(Z) = 0}\\sup\\limits_{x\\in E\\setminus Z}|f(x)|$, 其中$Z$是可测集，$\\mu$表示测度。\n现在我们就可以尝试给出弱导数的定义，以及如何从这个定义出发，认识Sobolev空间。\n我们先从一个例子看如何定义$f\\in L_{loc}^{1}(\\Omega)$的导数。\nExample 1 设$f\\in C^{1}(\\Omega)$, 令$\\varphi\\in\\mathcal{D}(\\Omega) = \\{u\\in C^{\\infty}(\\Omega):supp\\ u\\subset\\subset\\Omega\\}$ , 则根据分部积分公式： $$ \\int_{\\Omega}\\frac{\\partial f}{\\partial x^{i}}\\varphi = -\\int_{\\Omega}f\\frac{\\partial\\varphi}{\\partial x^{i}} $$ 则$\\int_{\\Omega}\\frac{\\partial f}{\\partial x^{i}}\\varphi$就由$\\varphi$唯一确定。因此由实分析的基本结论，若此时$\\exists g\\ s.t.\\ \\int_{\\Omega}g\\varphi = -\\int_{\\Omega}f\\frac{\\partial\\varphi}{\\partial x^{i}},\\ \\forall\\varphi\\in\\mathcal{D}(\\Omega)$，那么$g = \\frac{\\partial f}{\\partial x^{i}}$. 此时我们就可以利用积分给出弱导数的定义：\nDefinition 1 令$f,\\ g\\in L^{1}_{loc}(\\Omega)$, 称$g$是$f$关于$x^{i}$方向的弱导数，若：$\\int_{\\Omega}g\\varphi = -\\int_{\\Omega}f\\frac{\\partial\\varphi}{\\partial x^{i}},\\ \\forall\\varphi\\in\\mathcal{D}(\\Omega)$. 一般我们将$g$记作$\\frac{\\partial f}{\\partial x^{i}}$, 并有记号$\\nabla f = \\mathrm{D}f = \\left(\\frac{\\partial f}{\\partial x^{1}},\\frac{\\partial f}{\\partial x^{2}}, ... , \\frac{\\partial f}{\\partial x^{n}}\\right)$. 有了弱导数，就可以定义一类Sobolev空间：\nDefinition 2 令$W^{1} = \\{f\\in L^{1}_{loc}(\\Omega): f$有$L_{loc}^{1}$弱导数$\\}$. 这个空间称作$W^{1}$空间，其中$f$就称作$W^{1}$空间内的Sobolev函数。 Remark 我们有如下一些比较容易看出来的事实：\n若$f\\in W^{1}(\\Omega),\\ \\varphi\\in C^{1}(\\Omega)$, 则$f\\varphi \\in W^{1}(\\Omega)$且$\\mathrm{D}f\\varphi = (\\mathrm{D}f)\\varphi+f\\mathrm{D}\\varphi$. 若$f_{k}\\in W^{1}(\\Omega),\\ \\exists g_{i}\\ s.t.\\ \\sum_{i=1}^{n}\\Vert\\frac{\\partial f_{k}}{\\partial x^{i}}-g_{i}\\Vert_{L^{1}(\\Omega ')}+\\Vert f_{k}-f\\Vert_{L^{1}(\\Omega ')}\\to 0,\\ \\forall\\Omega '\\subset\\subset\\Omega$, 则$f\\in W^{1}(\\Omega)$. 如果对原函数和弱导数加上范数的限制，就有可以得到一个新的空间：\nDefinition 3 记$W^{1,p} = \\left\\{f\\in W^{1,p}(\\Omega): \\left(\\displaystyle{\\int_{\\Omega}|f|^{p} + \\sum_{i=1}^{n}\\left|\\frac{\\partial f}{\\partial x_{i}}\\right|^{p}}\\right)^{\\frac{1}{p}} \u003c+\\infty \\right\\}$. 其中定义$W^{1,p}$模$\\|f\\|_{W^{1,p}}=\\left(\\displaystyle{\\int_{\\Omega}|f|^{p} + \\sum_{i=1}^{n}\\left|\\frac{\\partial f}{\\partial x_{i}}\\right|^{p}}\\right)^{\\frac{1}{p}}$.\n类似的，我们还可以定义更高阶的Sobolev空间。以下我们令$\\alpha = (\\alpha_{1}, \\alpha_{2}, \u0026hellip; , \\alpha_{n}),\\ \\alpha_{i}\\in\\mathbb{Z}^{+}\\cup\\{0\\},\\ |\\alpha| = \\sum_{i=1}^{n}\\alpha_{i}$.\nDefinition 4 称$f\\in W^{k}(\\Omega)$, 若对$f\\in L_{loc}^{1}(\\Omega),\\ \\forall |\\alpha|\\leq k,\\ \\exists g\\in L_{loc}^{1}(\\Omega)\\ s.t.\\ \\int_{\\Omega}g\\varphi = (-1)^{|\\alpha|}\\displaystyle{\\int_{\\Omega}f\\frac{\\partial^{|\\alpha|}\\varphi}{\\partial x_{i}^{\\alpha_{1}}\\partial x_{2}^{\\alpha_{2}}...\\partial x_{n}^{\\alpha_{n}}}},\\ \\forall\\varphi\\in\\mathcal{D}(\\Omega)$.\n记$W^{k,p}(\\Omega) = \\left\\{f\\in W^{k,p}(\\Omega): \\left(\\displaystyle{\\int_{\\Omega}|f|^{p} + \\sum_{|\\alpha|=1}^{k}\\left|\\frac{\\partial^{|\\alpha|}\\varphi}{\\partial x_{i}^{\\alpha_{1}}\\partial x_{2}^{\\alpha_{2}}...\\partial x_{n}^{\\alpha_{n}}}\\right|^{p}}\\right)^{\\frac{1}{p}} \u003c+\\infty \\right\\}$.\n其中定义$W^{k,p}$模$\\|f\\|_{W^{k,p}}=\\left(\\displaystyle{\\int_{\\Omega}|f|^{p} + \\sum_{|\\alpha|=1}^{k}\\left|\\frac{\\partial^{|\\alpha|}\\varphi}{\\partial x_{i}^{\\alpha_{1}}\\partial x_{2}^{\\alpha_{2}}...\\partial x_{n}^{\\alpha_{n}}}\\right|^{p}}\\right)^{\\frac{1}{p}}$.\nRemark 显然上面所有的Sobolev空间都是线性空间。 通过Minkowski不等式易得$\\|f+g\\|_{W^{k,p}}\\leq\\|f\\|_{W^{k,p}}+\\|g\\|_{W^{k,p}}$. 易证$\\|\\lambda f\\|_{W^{k,p}} = |\\lambda|\\|f\\|_{W^{k,p}}$. 接下来的例子有助于帮助我们理解弱导数的定义，以及它和经典导数的关系。\nExample 2 设$f\\in C^{0}(\\mathbb{R}^{2}),\\ f\\in C^{1}(\\mathbb{R}^{2+})\\cap C^{1}(\\mathbb{R}^{2-})\\Rightarrow f\\in W^{1}(\\mathbb{R}^{2})$. Proof. 取$\\varphi\\in\\mathcal{D}(\\mathbb{R}^{2})$, 有： $$ \\int_{\\mathbb{R}^{2}}\\frac{\\partial f}{\\partial x}\\varphi = \\int_{\\mathbb{R}^{2+}}\\frac{\\partial f}{\\partial x}\\varphi + \\int_{\\mathbb{R}^{2-}}\\frac{\\partial f}{\\partial x}\\varphi = -\\int_{\\mathbb{R}^{2+}}f\\frac{\\partial\\varphi}{\\partial x} - \\int_{\\mathbb{R}^{2-}}f\\frac{\\partial\\varphi}{\\partial x} $$ 因此有： $$ \\int_{\\mathbb{R}^{2}}f\\frac{\\partial f}{\\partial x} = -\\int_{\\mathbb{R}^{2}}\\frac{\\partial f}{\\partial x}\\varphi $$ 对于$y$方向上的导数，因为区域从中间分隔开，因此我们必须注意分部积分的结果： $$ \\int_{\\mathbb{R}^{2}}f\\frac{\\partial \\varphi}{\\partial y} = \\int_{\\mathbb{R}^{2+}}f\\frac{\\partial \\varphi}{\\partial y} + \\int_{\\mathbb{R}^{2-}}f\\frac{\\partial \\varphi}{\\partial y} = -\\int_{\\{y\u003e0\\}}\\frac{\\partial f}{\\partial y}\\varphi - \\int_{\\{y=0\\}}f\\cdot\\varphi - \\int_{\\{y\u003c0\\}}\\frac{\\partial f}{\\partial y}\\varphi + \\int_{\\{y=0\\}}f\\cdot \\varphi $$ 因此有： $$ \\int_{\\mathbb{R}^{2}}f\\frac{\\partial \\varphi}{\\partial y} = -\\int_{\\mathbb{R}^{2}\\setminus\\{y=0\\}}\\frac{\\partial f}{\\partial y}\\cdot\\varphi = -\\int_{\\mathbb{R}^{2}}\\frac{\\partial f}{\\partial y}\\cdot\\varphi $$ 从而$f$在$x,\\ y$两个方向上都有一阶弱导数，因此$f\\in W^{1}(\\mathbb{R}^{2})$. 回到序章的例子。有了弱导数之后，我们可以定义偏微分方程各种类型的解。\nExample 3 考虑偏微分方程$(*) \\left\\{ \\begin{aligned} \u0026 -\\Delta u = f \\\\ \u0026 u|_{\\partial B_{1}^{n}(0)} = 0 \\\\ \\end{aligned} \\right. $, 称： $u\\in C^{2}(\\Omega),\\ f\\in C^{0}$, 满足$(*)$, 则$u$是经典解。 $u\\in W^{2,p}(\\Omega),\\ f\\in L^{p}$, 满足$(*)$, 则$u$是强解。 $u\\in W^{1,2}(\\Omega),\\ f\\in L^{2}$, 满足$\\int_{\\Omega}\\nabla u\\nabla \\varphi = \\int_{\\Omega}f\\varphi,\\ \\forall\\varphi\\in\\mathcal{D}(\\Omega)$, 则$u$是弱解。 这些空间的性质不仅可以拓宽解的范围，还提供了更多的泛函分析手段来处理以上的微分方程。在之后我们将逐渐了解$C^{2}(\\Omega)$不是自反空间，因此无（弱）紧性；而$W^{2,p}(\\Omega)$是自反空间，有弱紧性；在$W^{1,2}(\\Omega)$空间上可以定义内积将其化作可分的Hilbert空间。\n","permalink":"https://guoranguan.site/posts/fucana1/","summary":"Sobolev空间是体会泛函分析最重要的例子。","title":"泛函分析1 - Sobolev空间的定义"},{"content":"生物学家们探索的似乎总是定性的规律，这几乎已经成为学科内部的共识了：蛋白A与蛋白B是否互作；确定一个通路的具体结构；确定蛋白质的分子结构；探究某一蛋白质的功能特性……概括地说，这些研究 或者在试图回答“是”或“否”的二元问题以及由这些问题堆垒而成的更复杂的问题，或者通过成像与观察总结经验规律。另一方面，为了适应这些问题引发的需求，另一部分人试图解决技术上的困难，这些技术尤其涉及显微镜与分子生物的领域；虽然他们自称scientist，但是他们长期浸润在这些领域中，工程思维是十分浓厚的。\n这引出了一个几乎显而易见的疑问：除了定性之外，我们是否还需要考虑生物学中的定量问题？\n这是一个无聊的问题。询问当今任何一名生物学家，他们的回答都将会是“是”。但与此同时，这是一个深刻的问题，而这个问题应该有一个更精确的说法：解决生物学中的定量问题到底能够给我们带来什么？换言之，定量分析能展现定性分析无法显现的结果吗？如果我们能给出一个肯定的回答，那么研究定量问题的动机才足够明确、研究什么样的定量问题才足够清晰。否则，我们就没必要真正研究定量问题了；相反，定量分析就纯粹成为定性分析的附庸。\n动机 (motivation)。这是一个在生物学中被忽视的美妙词汇。与许多数学课不同，在生物课上我们很少探究某个领域的动机是什么，但是它却能告诉我们应该做怎样的问题。不妨假设定量分析能够展现定性分析无法显现的结果，并将其作为一种原则，我们就可以分辨什么是“伪”定量。例如，毫不客气地说，一些组学研究就是伪定量：研究某一群蛋白表达量在不同条件下的升高与降低，与WB所得的结果并无本质的不同——只不过组学用了一种看似更定量的方法比较了蛋白表达量的差异，而不是依赖人眼；或者换一种温和的说法，这些研究将定量的数据转化为了定性（“高”或“低”）的判断，从而所做的和传统的定性分析并无差别。又例如，某些利用各种算法分析大量数据内部的关联性（这是AI for science的“重灾区”），获得那么几个蛋白的“相互作用”，最后回归到某个定性分析下基本的模型框架中。这些定量分析所带来的发现，只是为定性分析提供了新的素材，本质上并没有突破定性分析的范式，从而不符合我们最基本的动机，是一种“伪”定量。 因此，要回答这样的动机是否真正存在，就必须给出定量分析超越了定性分析的例子，否则上述关于“真”“伪”定量的分析将毫无意义。\n在葛颢和钱纮合著的《数学动力学模型：在生物物理和生物化学中的应用》中有许多这样的例子。我们不妨拿出其中一例：修饰子的激发-抑制转换。考虑一个简单的酶催化反应，这个酶E在被底物结合时可以被一个修饰子M修饰。一般而言，我们可能会认为修饰物要么是激发剂，要么是抑制剂。定性生物学家很可能观察到在不同条件下M既可以作为激发剂也可以作为抑制剂的现象，但是却很难使用单纯的定性生物学方法去解释。换言之，即使从结构生物学出发，也很难考察出现这种现象具体的机制。然而，通过定量手段，可以阐明：在一般的动力学系统中，激发剂和抑制剂的区分不一定成立。一个同样的修饰物既可以是激发剂，也可以是抑制剂，而这完全依赖于M的浓度，并可以在二者之间转换，这就是激发-抑制转换。\n此处直接借用书中原图。不过上下两幅小图的$\\alpha^{o}$与$\\beta$标号似乎不一致，还需仔细甄别。\n我们可以略去一些具体的计算过程，单纯思考应该如何理解根据化学反应网络分析计算得到的如下结果。设$p_{TES}^{ss}(u)=(p_{ES}+p_{MES})^{ss}$为稳态下可以用于产生产物的底物的总量，其中$u$是M的浓度。我们可以通过计算得到$p_{TES}^{ss}(0)\u0026lt; p_{TES}^{ss}(\\infty)=1$。如果$(p_{TES}^{ss})\u0026rsquo;(0)\u0026lt; 0$，我们就可以期待这个函数是一个凸函数，在M浓度较低时起抑制作用；在M浓度较高时起促进作用。\n计算的结果和我们预想的一致：随着M浓度的增大，其会经历先抑制后激发的转换。\n这个结果很美妙，也很优雅。它揭示了一个重要的想法或事实：生物系统中的化学反应网络作为重要的研究对象，至少在研究与动力学相关的现象时，单纯使用定性分析将无法揭示一些重要但简单的事实。此时定量分析才真正具有重要意义，也因而在生物学研究中定量分析才展现出其必要性。因此，定量分析的意义绝对不在于用复杂的数学建模和大量的参数重现特定的生物学现象， 而在于当定性分析失效时运用定量的手段对生物现象给出简洁、合理、富有洞见的解释。\n然而，这正是科学的矛盾与伟大之处——定量分析的结果往往难以轻易洞察，人们的直觉比他们想象的还要更不精确。但当我们面对并尝试理解一个定量分析的结果时，最终还是需要重塑并依赖自己的直觉；换言之，这就像阅读一篇数学证明，在确认了每一步的细节之后，还需要理解它在总体图像上的内涵、理解证明的作者如何将他自己对这个问题的直观想法转化为逻辑严谨的符号，并尝试在自己的脑中构建出与作者相同的直观，这样才算读懂了证明；类似地，我们也总将利用自己的直观理解定量分析的结果。在计算之前就得到有意义的看法始终是定量分析的目标，而这本身正是定性分析希望发挥的作用。在这个意义上，二者殊途同归，也无怪许多人总是弄错定量分析真正的内涵了。\n如此观之，我们或许尚未真正理解定量分析对研究生物系统的意义和威力——在AI风靡的当下、在所有人举着“More is different”的旗帜， 随意批判所谓的还原论的时候，我们依旧不应该放弃探究支配系统的基本规律——更何况这条路本身并不如很多人所想的那么艰难，生物系统的精巧是远超想象的。我们确实应当扪心自问：自己是否真的理解了手头这个系统的基本规律？\n出于娱乐的目的，不妨以一个有趣的故事作为结尾。一个月前Izaak Neri到Pablo Sartori实验室访问，其实是要和Pablo当面讨论他们将要合作发表的某个文章的细一些节。午休时间，大家询问起Izaak当下的研究兴趣。他坦言自己将重心放在研究某个线性系统上面，其中还有很多没被前人发现过的有趣现象。他说的话十分深刻：“大家总以为他们完全弄清楚了线性系统，并因此转而去研究非线性的系统。但我们的结果表明：人们还完全没理解线性系统。”\n","permalink":"https://guoranguan.site/posts/quantiquali1/","summary":"定量的目标，是更深刻的定性。","title":"定量的与定性的生物学"},{"content":"在数学分析中，我们已经学过了$\\mathbb{R}^{n}$上区域上函数的连续性、微分和积分。这些理论的基础就是实数理论，尤其是在$\\mathbb{R}^{n}$上的紧性。我们知道，在$\\mathbb{R}^{n}$中的紧集等价于有界闭集，这是一个非常方便的性质。对于一个函数$f:\\Omega\\rightarrow\\mathbb{R}^{m},\\ \\Omega\\subset\\mathbb{R}^{n}$，在$\\Omega$中的元素$x$是一个有限维向量。\n在泛函分析中，我们将研究一个泛函$F_{1}$:函数空间$\\rightarrow$函数空间，$F_{2}$: $\\mathbb{R}^{n}$上曲线空间$\\rightarrow$$\\mathbb{R}^{n}$上曲线空间，$F_{3}$:流形度量空间$\\rightarrow$流形度量空间……的连续性、积分和微分。简而言之，就是要类比数学分析，研究Banach空间（或是Hilbert空间）到Banach空间的泛函，或是Banach流形到流形的泛函的性质。因此，我们的基础同样也是紧性，当然还需要辅以Banach空间的一些代数性质。以下的例子可以帮助我们理解有限维空间和无穷维空间问题的异同：\nExample 1 分别考虑偏微分方程$ \\begin{cases} -\\Delta u = f \\\\ u|_{\\partial B_1^n(0)} = 0 \\end{cases} $, $x\\in B_{1}^{n}(0)$的求解和$Ax = y$, $x\\in\\mathbb{R}^{n}$, $y\\in\\R{n}$, $A$对称正定的求解。我们有分析和代数两种方法来解决这两个问题。\n先看分析方法。我们知道：$Ax = y \\so \\forall z\\in\\R{n},\\ z^{\\mathsf{T}}Ax = z^{\\mathsf{T}}y$. 定义$\\varphi(x) = \\frac{1}{2}x^{\\mathsf{T}}Ax - x^{\\mathsf{T}}y$, 若$x_{0}$是最小值, 则有$\\forall t,\\ z,\\ \\varphi(x_{0} + tz)\\geq\\varphi(x_{0}) \\so \\frac{\\partial\\varphi(x_{0} + tz)}{\\partial t} = 0$. 令$\\lambda_{0} = \\inf\\limits_{x\\in\\R{n}}\\varphi(x) \u003e -\\infty,\\ \\lim\\limits_{x\\to\\infty}\\varphi(x) = +\\infty$, 则$\\exists x_{k}\\in\\R{n}\\ s.t.\\ \\varphi(x_{k})\\rightarrow \\lambda_{0}$. 由$\\varphi(x)$的性质，有$|x_{k}| \u003c C \\so \\exists x_{k_{i}},\\ x_{0}\\ s.t.\\ x_{k_{i}}\\rightarrow x_{0}\\so \\varphi(x_{0}) = \\lambda$. 这样我们就找出了这个方程的解。需要注意的是，上述找到子列收敛的过程用到了$\\R{n}$的紧性。\n回到偏微分方程的问题中，类似地，我们可以令$I(u) = \\frac{1}{2}\\int_{B_{1}^{n}(0)}|\\nabla u|^{2} - \\int_{B_{1}^{n}(0)}fu$, 并期待若$\\exists u_{0}\\ s.t.\\ I(u_{0}) = \\min I \\so u_{0}$是解。 但是取$u_{k}\\ s.t.\\ I(u_{k})\\rightarrow \\inf I = \\lambda$, $u_{k}$有界是否能推出存在子列收敛？这往往是不行的。我们将会证明，在自反空间中，可以得到$u_{k}$存在子列弱收敛，而这个结论外加$u$的一些限制就足以让我们得到方程的解了。这一步的缺失是无穷维空间和有限维空间关键的不同点。\n再看代数方法。由对称正定矩阵的性质，我们可以取出标准正交基$e_{1}, ... , e_{n}\\ s.t.\\ Ae_{i} = \\lambda e_{i}$. 令$x = \\sum_{i = 1}^{n}\\mu_{i}e_{i},\\ y = \\sum_{i = 1}^{n}a_{i}e_{i}$，则有$$\\sum_{i = 1}^{n}\\mu_{i}Ae_{i} = \\sum_{i = 1}^{n}a_{i}e_{i} \\so \\sum_{i = 1}^{n}\\lambda_{i}\\mu_{i}e_{i} = \\sum_{i = 1}^{n}a_{i}e_{i} \\so \\mu_{i} = \\frac{a_{i}}{\\lambda_{i}}$$ 因此$x = \\sum_{i = 1}^{n}\\frac{a_{i}}{\\lambda_{i}}e_{i}$是解。\n对于偏微分方程的问题，我们也可以做类似的形式上的操作。取基$\\{e_{i}\\}_{i=1}^{\\infty}\\ s.t.\\ -\\Delta e_{i} = \\lambda_{i}e_{i}$. 令$u = \\sum_{i=1}^{\\infty}\\mu_{i}e_{i},\\ f = \\sum_{i=1}^{\\infty}a_{i}e_{i} \\so u = \\sum_{i=1}^{\\infty}\\frac{a_{i}}{\\lambda_{i}}e_{i}$是解。问题在于，这样的$\\{e_{i}\\}_{i=1}^{\\infty}$是否存在？$u$是否可以表达为$\\sum_{i=1}^{\\infty}\\mu_{i}e_{i}$的形式？$\\Delta u$是否等于$\\sum_{i=1}^{\\infty}\\mu_{i}\\Delta e_{i}$？这些原本在有限维空间平凡的问题，在无穷维空间中需要仔细地考虑。实际上，这将是我们在谱分解理论着重研究的问题。\n有限维空间和无穷维空间的异同可以总结为如下几点（设$V$是有限维空间）： $V$是有限维内积空间；无限维空间可以无内积。Eg. $C^{0}(\\Omega) = {u: u\\in C\\left(\\bar{\\Omega}\\right)}$.\n$V$上有界闭集是紧集；无穷维空间单位球非紧。我们将会证明，自反空间中的有界集弱列紧。\n$V$上的线性函数一定连续；无穷维空间上的线性函数（算子）不一定连续。\n$V$的自空间一定是闭的；无穷维空间的自空间不一定闭\n$\\left(V^{* }\\right)^{*} = V$；无穷维空间中只有自反空间满足这个性质。\n设$f:\\ V\\rightarrow V,\\ \\dim V = \\dim \\mathrm{Ker}f + \\dim \\mathrm{Im}f$；无穷维空间无法定义其维数。但我们将会证明：设$X$是Banach空间，$L$是其闭子空间，当$\\mathrm{codim}L\u0026lt;\\infty$时，$\\exists$闭子空间$G\\ s.t.\\ \\dim G = \\mathrm{codim}L,\\ X = G\\oplus L$; 当$\\dim L\u0026lt;\\infty$时，$\\exists$闭子空间$E\\ s.t.\\ X = L\\oplus E$.\n在$V$上$\\mathrm{Ker}f = 0 \\Leftrightarrow$满射$\\Leftrightarrow$同构；无穷维空间中满射通常无法推出同构。\n设$V_{1}$是$V$的子空间$\\Rightarrow f\\in V_{1}^{* }$可以延拓为$V^{*}$中元素；在Banach空间上，这是著名的Hahn-Banach定理。\n可以看到，很多在有限维空间上显而易见的性质，在无穷维空间上则不一定正确，或是很不平凡。但我们依旧可以以有限维空间的性质为参照，发展无穷维空间上的理论。这就是泛函分析的基本脉络。\n本专栏的参考书主要是张恭庆先生的《泛函分析讲义》和Peter D. Lax的$\\textit{Functional Analysis}$。\n","permalink":"https://guoranguan.site/posts/fucana0/","summary":"泛函分析，到底都在说些什么？","title":"泛函分析的基本问题和本专栏的脉络"},{"content":"摘要\n“了”的语法功能在经典汉语语法分析中纷繁芜杂，并且和语义分析相互交错，导致其语法分析相对混乱。本文旨在通过生成语法分析的框架，阐明“了”只有两个基本句法功能：1、在动词后充当“完成时”格标记，并且此格标记与动词语义无关。2、在句末占据Complementizer的位置，并限制句子向更复杂的结构发展。按照此分析，本文提出了两种附庸关系：1、体对时的附庸；2、低位结构对高位结构的附庸。这个分析法防止了语义参与讨论“了”的句法功能，并针对现代汉语结构短小但自由的现象提供了一种解释。\n关键词 生成语法；X-bar理论；体标记；句尾“了”\n在传统的汉语句法分析中，往往将一个词的句法功能和语义功能混杂在一起阐述，甚至出现“语法意义”之类的词汇，导致在句法分析中出现混乱。以“了”的分析为例，阐述“走了一个小时”的歧义时，先将“了”归为“走”的体范畴，再分析“了”的功能有“静态的延续”和“动态的延续”，分别对应“离开了一个小时”和“走（这个动作）持续了一个小时”。但是“了”的句法功能是单一的——“表示某一状态延续”；还是可分的——“表示静态/动态的状态延续”呢？如果单一，则句子的歧义由前面“走”这个动词的歧义产生：“走”既可以表示一个动作持续进行的状态，也可以表示离开的状态；如果可分，一切也可以说得通。然而，所谓“静止”、“动态”、“延续”，这些都是语义功能的范畴，用语义定义句法，显然不符合现代句法分析中句法和语义分离的基本原则。 如果不能使用这种描述性的句法分析，该如何分析“了”的句法功能？“了”在句子可以承载多少句法功能？利用结构主义生成语法的分析方法，最大限度减少语义分析在句法分析中的比重，可以寻求到统一又简洁的解释。\n一、X-bar 理论简介\n乔姆斯基（Noam Chomsky）发明了生成句法理论，经过发展，最基础、最广泛的是X-bar理论。相比于原始的S[[NP][VP]]的结构，X-bar理论通过在句法树中嵌入“X’”的结构，更强调二分性。这种处理方式有其好处：可以更清晰地表现出句法成分的层级关系。以下介绍其基本架构。 对于任意一个词组XP，其下一个层级总二分为标定语（Specifier）和X’，其中X’又在下一层级划分为中心词（Head）和补语（Complement）。其中XP可以是名词短语（NP）、动词短语（VP）、形容词短语（AP）、介词短语（PP）、副词短语（AdvP）等等；也可以指代各种句子分类，例如Complementizer phrase （CP），时态短语（TP），否定短语（NegP）等等。需要强调：在不同语言中，同一层级上的各个元素可以互换位置；但在一种语言中，层级内的相对位置相对固定。例如：在英语中中心词总在标定语后，补语总在中心词后；在现代汉语中，CP的中心词总在补语后，VP的补语总在中心词后；德语的情况恰与现代汉语相反。另一个常用的成分是附助词（Adjunct），可以有多个，也不限定与中心词之间的相对位置，可见其处于修饰语的地位。\n图 1 X-bar理论基本架构示意图\n对于每一种词组，虽然其补语可以有很多种词组种类，但标定语往往只有一个。不过，在整个基础架构中，除了中心词不可或缺，其他成分都可以表现为“空集”，不在句子中出现。下表给出了一些词组中的中心词和标定语的关系：\n中心词 标定语 名词 N 限定词 Det 动词 V 名词 N 形容词 A 程度词 Deg 副词 Adv 无明显分类 介词 P 无明显分类 表 1：一些中心词和标定语的组合关系 出于对分析的方便考虑，一般也在NP的上方再附加上一个层级，记作限定词词组（DP），其中心词为限定词，补语为NP。在实际使用中，一直使用DP来替换NP，换言之，在比较简单情况下，DP的地位等同于NP。其基础架构如下图所示：\n图 2 DP的架构示意图\n除了常见的词组，短语也被整合进X-bar理论中。CP主要用于替换经典句法理论中S的位置，实际上将句子也看作一个短语，这样分析就可以处理从句关系。它是一个简单句中最顶层的结构。CP的中心词Complementizer在英语句法分析中有that，which等，在现代汉语中最经典的是“的”。然而，对于现代汉语中什么词可以处在C的位置还没有很清晰的论述。TP则在CP的下一个层级，其中心词T可以存放句子的时态、助动词、情态动词等，应用广泛。它的功能是传统“时”范畴的扩展，不局限于过去，现在和将来。需要强调：在CP和TP中，标定语通常为空集，可供复杂句的DP或VP移位至此处。\n现在可以看一个简单的例子：分析简单句“我喜欢语言学。”\n图 3 “我喜欢语言学”的句法树图\n一般用“-pst”符号表示现在时，“+pst”符号表示过去时。在大多数印欧语中，VP的标定词通常移位到TP的标定词下，符合乔姆斯基提出的EPP规则（Extended Projection Principle），由于汉语更自由，可以选择移位，也可以不移位。此处采用与印欧语相同的操作，我们之后会看到这种操作的合理性。\n二、体是时的附庸\n从X-bar理论的构建看，时（TP）占据了至关重要的位置，是句子不可或缺的成分。既然传统语法分析中往往将“了”作为完成体，不论其在语义上的争议，“了”作为现代汉语的体范畴是受绝大多数人认可的，那么对于“了”句法功能的探究，可以从体范畴和时范畴的关系入手。\n体范畴是“用动词的词形变化表示行为动作进行的各种阶段和状态”来表达的范畴，可见其本身只是动词词形变化的一部分，因此“睡了”，“写了”，“读了”等词都可以视作“睡”，“写”，“读”这些动词的词形变化，均可以放在句法树中V之下——不会有人疑问worked中“ed”是否应该单独占据句法树中的一格。虽然“了”在句末可以表示将来的“实现体”，如“到本世纪末，我国就实现四个现代化了”；但是对于这种紧连动词的体变化，它只能表示完成时，而不能表达“实现时”或“实现体”： 我曾写了一本书。 * 我正写了一本书。 ？ 我曾写一本书。 * 到本世纪末，我国就实现了四个现代化。 到本世纪末，我国就实现四个现代化了。 但是所谓“完成时”并不是传统的时范畴，在此提出的所谓“完成时”，可以看作是现代汉语中“了”的特征时：只要出现表达完成意义的时，就要在后面的动词进行“了”变体。“完成时”不同于“现在”、“过去”、“将来”这些时，而是一个独立的时。这个做法其实具有合理性：在英语句法分析中，T可以存放表达完成时意义的助动词have。在这里的所谓“完成时”，既可以看作广义的时，也可以看作隐形的“助动词”。因此，具有标记体变化功能的“了”强烈依赖于句子中的完成时。将完成时和“了”在句法树中偶联，所有关乎体标记的“了”句迎刃而解。以下是几个例子：\n（1）我曾写了一本书。\n图 4 “我曾写了一本书。”的句法树\n（2）我吃了三碗饭。\n图 5 “我吃了三碗饭。”的句法树\n（3）他走了一个小时。\n图 6 “他走了一个小时。”的句法树\n对于“了”是否真的受制于时的管辖，还可以这样讨论：将T改变为其他的词语，再考察“了”的合法性。例如：\n* 你可以吃了饭。\n这句句子奇怪的原因在于“可以”作为情态动词占据了T的位置，挤去了“+完成时”的位置，在“+完成时”不出现的情况下动词出现了体标记，这显然是不合法的。\n图 7 *“你可以吃了饭。”的句法树\n将体标记的格视作动词词形的变化，也即动词的一部分，“了”的存在受到时（此处是完成时）的管辖，这样的分析统一了不同语义下的“了”。为了说明这一点，回到本文开始的例子：他走了一个小时。对于歧义产生的原因，有两种可能的解释：\n句子的深层结构不同，导致虽然表层结构相同，但其内里的意思不一样。 句子的深层结构相同，但是由于词汇的语义问题，其表达的意思不一样。 对于第一种情况，有一个典型的例子：他谁都认识。这句话有两个无歧义的近义句：\n谁都认识他。 他认识所有人。 第二种意义在原句中的原始结构是“他都认识谁”。我们可以观察到两种意思深层结构的不同：\n图 8 “他谁都认识”的两种句法结构\n可以说明两种移位都是合理的：左图将宾语移位至TP的标定语处，与前文所述相吻合；右图可以看作“他”首先移位至TP的标定语处，“谁”再移位至“他”原来的位置——此时就能显现出前文令现代汉语也符合EPP规则的好处，此处正好多出了一个位置供“谁”移位。虽然移位后的表层结构均相同，但是由于其一开始的深层结构不同、移位过程也不同，最终表达的意思就有微妙的差别，产生了歧义。\n然而，“他走了一个小时”不是这样的情况。我们只能画出唯一的图 6所示的句法结构；而两种歧义句的主谓成分都完全一致，因而这样的歧义并非由句法结构的不同导致，而是由词汇语义功能的歧义导致。这就意味着：“了”的句法功能在这句话中是单一的，只能是完成时的体标记，是动词的一种变化形式，不承载歧义的句法功能。而歧义产生的原因仅在于“走”至少有两种不同的语义功能：一是指“走路”这一动作；一是指“离开”这一状态。从这个例子可以更深刻地看到，无论语义如何，作为紧跟动词的“了”，它完全是完成时的附庸，与动词语义毫无关系。\n三、句末“了”是Complementizer\n对于句末的“了”，刘勋宁（2002）对它的“实现体”意义和在形容词后“言有所为”的意义进行了详细的阐发，但这终究还是语义分析，而非“了”的语法分析。根据语义来区分不同的“了”，在句法上是很难接受的。然而有一点值得注意：刘勋宁发现了句末“了”的含义独立于时。沿着这个思路，就可以发现句末“了”在句子结构中的地位。\n有学者认为，在现代汉语中关系从句里“的”占据的CP是后核心的。沿用这一观察，如果现代汉语的CP的确是后核心的，即CP的中心词在标定语右边，由于CP的位置很高，其中心词C被放到了句末的位置。因此有一个猜想：句末“了”是否占据了C的位置？\n这种处理有它的好处：只要所有的句末“了”都统一归为顶层CP的位置，就无需理会“了”的具体语义，把“太+形/动+了”，“我吃饭了”，“到本世纪末，我国就实现四个现代化了”等句子全部归结在一起，避免了要用语义进行各种分类的情况。\n图 9 “我吃饭了。”的句法树\n一种对于“了”处在C的坚实证据是考察下列两句句子：\n*你可以吃了饭。 你可以吃饭了。 前文已经阐述过第一句不合法的原因。对于第二句，我们可以画出一个合法的句法树，表明结构中各个部分的位置。“了”除了在C处，已经无处可去了。\n图 10 “你可以吃饭了”的句法树\n但是一个词是否出现在C的位置，还需要观察它在从句中的行为。为了验证这一点，可以看看关系从句中“了”和“的”的关系，其中“的”在关系从句中是明显的C的位置：\n（1）他送我的一本书 （2）他送我了一本书 （3）*他送我了的一本书 （4）*他送我的了一本书 至少从关系从句中“的”“了”不能在相邻位置共同存在可以佐证“了”处在C的位置。通过句法树，可以更清晰地看到“了”和“的”同处于较高的C的位置，从而不能同时出现在关系从句的指示位中。\n图 11 “他送我的一本书”和“他送我了一本书”的句法树\n但一个显然的问题出现了：“他送我的一本书”的确可以看作是关系从句，而主体还是“一本书”；可是“他送我了一本书”只能理解为一句完整的句子，“他送了我”并不能视作修饰“一本书”。这似乎又否认了句末“了”处于C的位置。不过如果重新审视“了”出现的时刻，除开作为动词的体标记的情况，基本都出现在某个结构的末尾处，而这个结构往往不会再更复杂，因而特别出现了针对句末“了”的研究。为了处理“了”到底处于哪里的问题，可以提出如下观点：不作为体标记的“了”处在一个句子中CP的中心词C的位置，有拒绝更高层结构的附加语法功能，即要么只能处在简单句中（句末“了”），要么在从句中只能修饰简单成分，简单成分上层没有更高级的结构（“他送我了一本书”）。虽然“他送我了一本书”具有上层结构“一本书”是不太可以接受的，但是这种不可接受不妨视作“了”的语法功能。\n“拒绝更高层结构”的语法功能或许在现代汉语中比较常见，毕竟现代汉语的一个典型特征就是以简单句为主的不断串联。而像“了”这样的虚词或许承担了类似的句法功能，造成这个典型特征。\n有另一点需要注意之处：虽然“他送我了一本书。”和“他送了我一本书。”的语义相同，但是其深层结构完全不同。前句“了”处在C的位置，具有多层复杂结构；后句“了”只是“送”的体标记，只具有简单句结构。另一个类似的句子是“这本书我送你了”，它的初始结构是“我送你这本书了”的双宾语结构，再将“这本书”移位至TP下，可见“了”依旧在C的位置。“不同结构表示相同语义”并非不可理喻：如果一门语言中结构与语义一一对应，未免太过单调了吧！\n四、“V了O了”的合法性\n刘勋宁（2002）在最后提出了一个有趣的现象：北京话的标准句型是“V了O了”，可是“近年”出现了大量的句子如“我回家了”“我吃饭了”“我打二两油了”等等，认为动词后“了”的消失是由于句尾“了”表示过去时，因而省略简化了动词后的“了”。二十余年已过，语言演化的速度实在太快，“V了O了”已经不是主流，已然有人不能接受这样的说法了。\n然而，这并不影响研究“V了O了”的结构。根据前文的分析，答案已经呼之欲出了：“V了”中的“了”是V的体标记，而末尾的“了”是整句句子的最高点，处在C的位置。实际上前一个“了”才受到时的调控，后一个“了”可以阻止句子像更复杂的结构演进。如果细细揣摩，“我吃饭了”出现时，有很强的确定性，句子也被截断了；“我吃了饭”则更可能出现在某一句完整句的中间位置：“我吃了饭，也吃了猪肉，还吃了香菜。”，隐隐体现了句末“了”的功能。从这个角度看，“V了O了”的语义更接近“VO了”。从这个小现象可以看出处于更高位置的语法结构或许比处于较低位置的语法结构承载了更多的语义功能，或是具有更强的决定性。在这个意义上，低位置的语法结构是高位置语法结构的附庸。\n因此，在考察“V了O了”的演化时，发现这种结构往往演化为“VO了”的形式而非“V了O”的形式。既然作为格标记的“了”处在作为C的“了”之下，是其附庸，因而省略前一个而保留后一个是更合理的做法。这种省略或许出于说话的方便考虑，从而这句话的句尾“了”可以视作承载了体标记的功能，也可以理解为体标记被隐藏了。\n五、结语：更复杂的层与“了吗？”“了呢！”\n行文至此，已经将不同的“了”给出了语法分类。事情比想象的要简单很多：凡是与动词相连的“了”，都视作动词的格标记；凡是在句尾的“了”，都视作占据句法树中的C位置。这样的分析抛开了语义，将语义功能和句法功能拆开，避免了讨论句法功能时的混乱。对于一些较特殊情况，还可以进行一些拾遗。\n句末“了”和体标记“了”重合时，应该如何区别两种“了”？再举“我吃了饭了”的例子。“我吃了饭了”，“我吃了”和“我吃饭了”表达更接近的意思，而和“我吃了饭”离得又远些，归根结底，还是由于低层结构对高层结构的附庸。因此根据这个原则，还是应当认为这类“了”应当放在C的位置，而不将其视作动词的体标记。\n但是对于被动句，情况又有所不同。“猴子吃了三根香蕉”中“了”是动词的体标记，“三根香蕉被猴子吃了”中“了”还应当看作处于C的位置吗？这其实涉及到X-bar理论对被动句的处理。仿照英文的处理思路，我们可以按照下图处理这件事，即将“被”也看作一个实义动词，在原有“猴子吃了三根香蕉”的基础上再加一层VP结构，而T依旧是“+完成时”：\n图 12 “三根香蕉被猴子吃了”的句法树\n因此，在被动句中，这种情况下的句尾“了”是动词的体标记。\n除了研究陈述句，疑问句和感叹句中“了”的应用也应当关注。一般情况下，前文提出的规律依旧适用，例如“发生了什么事？”中的“了”还是体标记；“发生什么事了？”中的“了”还是处在C的位置。在加上疑问词之后，事情或许发生了改变：“发生了什么事吗？”的结构尚未改变，“了”依旧是体标记；但是“发生什么事了吗？”该如何分析？类似地，“发生什么事了呢？”“他还吃猪肉了呢！”也有类似的疑惑。这牵扯到一个更深的问题：“吗”，“呢”到底应该放在句法树中的什么位置？如果鉴于之前的句法树，那么“吗”只能放在C的位置，可是这样处理有两个问题：一者“了”无处可去，原来的分析也失效了，规则不能相容；二者“吗”通常并不能作为某种从句的标记，何以呆在C的位置上？\n实际上，这需要借助句法树中更精细的结构。Waltraud Paul教授的《汉语句法新视角》提出将CP分裂为更精细的结构：AttitudeP \u0026gt; ForceP \u0026gt; ClowP \u0026gt; TP。其中ForceP（也称作语力层）用于存放“吗”“呢”之类的语气词，而比其低层的ClowP可以放置“了”。这与前文的视角是完全兼容的：“了”处于CP之内。\n看似纷繁芜杂的“了”问题在生成语法的框架下拥有一个简洁的归一和判断方法，并借由这些分析发现了“了”本身的两个语法功能：作为单纯的体标记和“拒绝更高层结构”。这正是句法理论分析带来的好处：不仅能够给出简洁、统一的句法阐释，还能从另一个视角发现现代汉语结构简便、自由的表象下潜藏的秘密。\n参考文献\n[1] 刘勋宁（2002）现代汉语“了”的语法意义及其解说，《世界汉语教学》第三期。\n[2] 刘元满（1998）“了”在“太+形/动”句中出现的条件，《北大海外教育》第二辑，北京：北京大学出版社。\n[3] Cheng LLS. de in Mandarin. Canadian Journal of Linguistics/Revue canadienne de linguistique. 1986;31(4):313-326.\n[4] 杨烈祥（2018）汉语句法研究新图景——评Waltraud Paul教授的《汉语句法新视角》，《北京第二外国语学院学报》第四十期。\n","permalink":"https://guoranguan.site/posts/ling1/","summary":"“了”到底占据了汉语语法中的什么位置？","title":"体，时，句末助词与附庸关系——以现代汉语“了”的句法分析为例"}]