线性代数 | 学习启示与策略改进

注:本文为台湾国立阳明交通大学周志成教授 "线性代数学习" 相关合辑。

略作重排,如有内容异常,请看原文。


答 chang ── 关于线性代数的学习改进方法

Posted on 06/20/2012 by ccjou

网友 chang 留言:

在线代学习中会有这样一个疑问,就是不比数学分析之类的课程,线性代数似乎学了很容易忘?是不是学习上有什么方法可以改进吗?

答曰:

英国数学家哈代(G. H. Hardy)晚年时觉得他唯一还能为数学做些贡献的事是写一本探讨数学的书,藉以表达自己对这门学科的看法,此书名为《一个数学家的辩白》(A Mathematician's Apology),一开头就说:

如果一个数学家发现自己在写关于数学的东西,他会感到很忧伤的。因为数学家的工作是做实事,比如证明新定理,使数学有所发展,而不是谈论自己或别的数学家干了些甚么。

政治家蔑视时事评论家;画家蔑视艺术评论家;生理学家、物理学家或数学家一般都有类似的感觉。做事者对评论者的蔑视是最深刻的,总的来看也是最合理的。解释、评论、鉴赏是次等工作。

或许在一流数学家眼中,解释(exposition)、评论(criticism)和鉴赏(appreciation)是次等工作,但对于研习数学(特别是线性代数)的人来说,这些却都是最重要的实事。

线性代数与其他数学科目,如微积分、微分方程、概率的主要不同之处在于学习重心从计算程序转移至消化并掌握计算程序底下的基本观念。线性代数着重演绎逻辑(deductive logic),我们经常以概念词汇取代量化关系,譬如,以「对称矩阵」取代 a j i = a i j a_{ji} = a_{ij} aji=aij,因此清楚理解这些概念是学好线性代数的第一步。紧接着,我们又创造出许多命题来联系概念之间的关系,譬如,「实对称矩阵对应相异特征值的特征向量必定正交」。最后,我们还希望从不同或相反的角度来掌握问题,譬如,我们想知道「哪些矩阵其对应相异特征值的特征向量必定是正交的」?下面我针对上述几项分别说明学习线性代数时必须特别注意的重点。

定义:什么是对称矩阵?

教科书普遍采用的定义如下:我们说 A = [ a i j ] A = [a_{ij}] A=[aij] 是一个 n × n n \times n n×n 阶对称矩阵,若 a i j = a j i a_{ij} = a_{ji} aij=aji,或简记为 A T = A A^T = A AT=A,其中 A T A^T AT 是 A A A 的转置矩阵,即 ( A T ) i j = a j i (A^T){ij} = a{ji} (AT)ij=aji。这个朴素的定义像是展示泡在药水瓶里的青蛙标本,我们看见了它的形体,却不知道这只青蛙活着时不仅在池塘中游泳,也会跑到陆地上活动。想要进一步理解对称矩阵,唯有重新认识转置矩阵一途。数学家的口袋里其实还有另一个转置矩阵的定义,称为「伴随」(adjoint):若 A A A 是一个实矩阵,对于任意 x , y ∈ R n \mathbf{x}, \mathbf{y} \in \mathbb{R}^n x,y∈Rn,转置矩阵 A T A^T AT 满足

( A x ) T y = x T ( A T y ) (A\mathbf{x})^T \mathbf{y} = \mathbf{x}^T (A^T \mathbf{y}) (Ax)Ty=xT(ATy)

符合此性质的 A T A^T AT 是唯一存在的(证明见 [转置矩阵的意义])。此处所指的伴随与 a d j A \mathrm{adj}A adjA 不同,请见 [伴随矩阵]。若采用此定义,实对称矩阵 A T = A A^T = A AT=A 满足下列等式:

( A x ) T y = x T ( A y ) (A\mathbf{x})^T \mathbf{y} = \mathbf{x}^T (A \mathbf{y}) (Ax)Ty=xT(Ay)

这么一来,对称矩阵从标本变成了活的生物──线性变换,我们称它为「对称变换」或许更恰当些。读者一时可能还看不出此定义的优点,但至少我们知道对称矩阵可由向量内积界定。当上式等于零时,有这个结果:若 A x A\mathbf{x} Ax 正交于 y \mathbf{y} y,则 A y A\mathbf{y} Ay 亦正交于 x \mathbf{x} x。

命题:如何证明对于实对称矩阵,对应相异特征值的特征向量必定正交?

最直接的做法是由左向右证明(见 [实对称矩阵可正交对角化的证明]),如下:实对称矩阵的特征值为实数,可设 A x = λ x A\mathbf{x} = \lambda \mathbf{x} Ax=λx, A y = μ y A\mathbf{y} = \mu \mathbf{y} Ay=μy, λ , μ ∈ R \lambda, \mu \in \mathbb{R} λ,μ∈R 且 λ ≠ μ \lambda \neq \mu λ=μ。第二式左乘 x T \mathbf{x}^T xT,就有

x T A y = x T μ y = μ x T y \mathbf{x}^T A \mathbf{y} = \mathbf{x}^T \mu \mathbf{y} = \mu \mathbf{x}^T \mathbf{y} xTAy=xTμy=μxTy

对第一式取转置, x T A T = λ x T \mathbf{x}^T A^T = \lambda \mathbf{x}^T xTAT=λxT,再右乘 y \mathbf{y} y,即得

x T A T y = λ x T y \mathbf{x}^T A^T \mathbf{y} = \lambda \mathbf{x}^T \mathbf{y} xTATy=λxTy

因为 A T = A A^T = A AT=A,上面两式等号左边相同,两式相减可得

( μ − λ ) x T y = 0 (\mu - \lambda) \mathbf{x}^T \mathbf{y} = 0 (μ−λ)xTy=0

已知 λ ≠ μ \lambda \neq \mu λ=μ,推论 x T y = 0 \mathbf{x}^T \mathbf{y} = 0 xTy=0,即 x ⊥ y \mathbf{x} \perp \mathbf{y} x⊥y。这个证法的主要缺点是它包含过多的代数运算,我们即使获得证明也未必真的弄懂了。原因是当人们投入心力在计算时,往往不能同时推理,自然也就不会思考其中的意义。信息一旦缺少了意义,便无法成为知识。可想而知,那些不被我们使用的信息又如何能在脑中长存呢?遗忘所学是没有慎思的必然结果。

如果采用实对称矩阵的内积定义 ( A x ) T y = x T ( A y ) (A\mathbf{x})^T \mathbf{y} = \mathbf{x}^T (A \mathbf{y}) (Ax)Ty=xT(Ay),代入特征方程 A x = λ x A\mathbf{x} = \lambda \mathbf{x} Ax=λx 和 A y = μ y A\mathbf{y} = \mu \mathbf{y} Ay=μy,即得

λ x T y = μ x T y \lambda \mathbf{x}^T \mathbf{y} = \mu \mathbf{x}^T \mathbf{y} λxTy=μxTy

当 λ ≠ μ \lambda \neq \mu λ=μ,立刻推知 x T y = 0 \mathbf{x}^T \mathbf{y} = 0 xTy=0。由于我们事先「活化」对称矩阵的涵义,部分的推理步骤已纳入扩大化的概念版图,证明过程遂变得极为简易,不须耗费一兵一卒即可攻城掠地。

推广:还有哪些矩阵对应相异特征值的特征向量也是正交的?

猜想是提升洞察力、直觉和原创力的有效良方。或许实对称矩阵的死对头──反对称矩阵(anti-symmetric matrix)也拥有此性质?我们称 A A A 是反对称矩阵,若 A T = − A A^T = -A AT=−A,亦即

( A x ) T y = − x T ( A y ) (A\mathbf{x})^T \mathbf{y} = -\mathbf{x}^T (A \mathbf{y}) (Ax)Ty=−xT(Ay)

不过这回事情变得复杂,反对称矩阵的特征值必为零或纯虚数(见「[特殊矩阵(13):反对称矩阵]),特征向量可能是复向量,实向量内积 x T y \mathbf{x}^T \mathbf{y} xTy 因此必须改成 x ∗ y \mathbf{x}^{\ast} \mathbf{y} x∗y,就有

( A x ) ∗ y = − x ∗ ( A y ) (A\mathbf{x})^{\ast} \mathbf{y} = -\mathbf{x}^{\ast} (A \mathbf{y}) (Ax)∗y=−x∗(Ay)

代入 A x = ( i λ ) x A\mathbf{x} = (i\lambda)\mathbf{x} Ax=(iλ)x 和 A y = ( i μ ) y A\mathbf{y} = (i\mu)\mathbf{y} Ay=(iμ)y,其中 λ , μ ∈ R \lambda, \mu \in \mathbb{R} λ,μ∈R, i = − 1 i = \sqrt{-1} i=−1 ,可得

− i λ x ∗ y = − i μ x ∗ y -i\lambda \mathbf{x}^{\ast} \mathbf{y} = -i\mu \mathbf{x}^{\ast} \mathbf{y} −iλx∗y=−iμx∗y

当 λ ≠ μ \lambda \neq \mu λ=μ,即得 x ∗ y = 0 \mathbf{x}^\ast \mathbf{y} = 0 x∗y=0。运用其他分析技巧,我们甚至可以证明只要 A A A 满足 A ∗ A = A A ∗ A^{\ast} A = A A^{\ast} A∗A=AA∗,称为正规矩阵(normal matrix),不论其特征值为何, A A A 总有完整的单范正交(orthonormal)特征向量(见 [特殊矩阵(2):正规矩阵]。

结论:线性代数的学习改进方法包括以下几点。

  1. 釐清概念的定义与涵义,尽可能列举出概念的所有性质以延伸版图。
  2. 推论证明时应尽量多使用「居先的」(a priori)事实,也就是那些我们已经累积的经验命题。居先的事实越完整,推理步骤便越简短,如此也较容易在脑中形成绵密且强固的知识网络。
  3. 将既有的成功推论程序应用于其他问题上,以加速开疆辟土。倘若失败,则表示我们需要使用新概念或另觅其他分析技巧。百尺竿头,更进一步。这时我们应当为新障碍的出现而感到高兴。

此外,我建议读者多利用画图来阐述概念之间的联系。推论前务必取得足够信息。过程中跟紧前提,大胆猜测,并不时反向推理。结束后记录研究结果,撰述评论,供日后个人或他人鉴赏之用。

行远必自迩,登高必自卑。谁说解释、评论、鉴赏是次等工作?

引用来源:

维基百科:一个数学家的辩白

"It is a melancholy experience for a professional mathematician to find himself writing about mathematics. The function of a mathematician is to do something, to prove new theorems, to add to mathematics, and not to talk about what he or other mathematicians have done. Statesmen despise publicists, painters despise art - critics, and physiologists, physicists, or mathematicians have usually similar feelings; there is no scorn more profound, or on the whole more justifiable, than that of the men who make for the men who explain. Exposition, criticism, appreciation, is work for second - rate minds."

"对于一位专业数学家来说,发现自己在写关于数学的东西是一种令人忧伤的体验。因为数学家的工作是做实事,比如证明新定理,为数学增添内容,而不是谈论自己或别的数学家做过些什么。政治家蔑视时事评论家;画家蔑视艺术评论家;生理学家、物理学家或数学家一般都有类似的感觉。做事者对评论者的蔑视是最深刻的,总的来看也是最合理的。解释、评论、鉴赏是次等工作。"


如何学好线性代数?

Posted on 02/26/2016 by ccjou

线性代数是美国数学教授哈尔莫斯(Paul R. Halmos)的专长,他在 26 岁时出版了一本经典教材《有限维向量空间》(Finite - Dimensional Vector Spaces )。哈尔莫斯在回忆录《我要做数学家》(I Want to Be a Mathematician)谈到他第一次学习线性代数的悲惨经历:

代数课很难,我读得很生气。...当我说生气,我是真的生气。Brahana 不知道如何说清楚,我们的教材是 Bôcher 的书(我认为写得一团糟),我花在这个科目的多数时间里,我的情绪恼火到愤怒。...不知怎么的,我的线性代数导论最后幸存下来。过了四、五年,在我取得博士学位,听了诺伊曼(von Neumann)讲的算子理论后,我才真正开始明白这个科目到底在讲甚么。

为什么线性代数这么难?从哈尔莫斯说的这段话可以归结两个原因:第一是老师很烂,第二是课本很糟。如果学习一门科目的两个要素不是烂就是糟,我们还能冀望学好它吗?不过话说回来,即使哈尔莫斯的线性代数启蒙老师是数学大师诺伊曼,哈尔莫斯未必当下就能真正明白线性代数在讲甚么。我说的真正明白不是指考试拿高分,而是有一天你在洗澡时豁然开悟,奔出浴室光着身子在马路上边跑边叫:「啊哈!我明白了!」

老实讲,我不认为有哪个老师或哪本教科书可以让学生「第一次学线代就上手」。真正全面性的理解线性代数需要时间,需要勤奋练习与坚持思考。

客观上,线性代数之所以不容易学好的主要原因在于这个科目是由许多「人造的概念」架构而成的理论,而且它们经常以公设化的形式出现:定义─定理─证明(其实近代数学基本上都是这样)。美国作家梭罗(Henry David Thoreau)说:「任何傻瓜订个规则,就有笨蛋在意它。」数学家制定这些定义与公设的背后当然有其动机与目的(数学家们又不是傻瓜),但在老师与课本都只字不提的情况下,基于什么信念我们要接受这套几乎与日常生活经验无关的理论?(我们也不是笨蛋,对吧?)

人们不可能理解毫无动机的定义与缺少目的的定理。俄国数学家阿诺尔德(Vladimir Arnold)在〈论数学教育〉说:

理解乘法交换律的唯一可能的方式,打个比方就是分别按行序和列序来数一个阵列里士兵的人数,或者说用两种方式来计算长方形的面积(见 [傻瓜的规则])。任何试图只做不与物理和现实世界打交道的数学都属于宗派主义和孤立主义,这必将损毁在所有敏感的人们眼中把数学创造视为一项有用的人类活动的美好印象。

遗憾的是,理解线性代数的核心观念与内容没有什么唯一可能的方式,把物理和现实世界拉进来常常也起不了多少作用。许多学生暗地隐藏心中的困惑与怀疑,继续伪装成线性代数爱好者的一个现实原因是他们听别人说:「线性代数是一门应用广泛的重要基础课目」,于是怀着一丝盼望,期待有朝一日经过苦痛学来的线性代数终会发光发热(见 [学线性代数有什么用?])。这些学生至少还留下一点火种,另外一批学生或早或晚将放弃线性代数,从此对任何与矩阵运算有关的学科敬而远之。美国计算机科学教授鲍许(Randy Pausch)在〈最后一课〉(The Last Lecture)说:「人生路上有阻挡你梦想的砖墙,那是有原因的。这些砖墙让我们来证明我们究竟有多么想要得到我们所想要的。」线性代数是一道砖墙,接下来我要讲的话是给那些想翻越这道砖墙的人听的。

英国数学家哈代(G. H. Hardy)说:「数学家的模式,如画家或诗人的模式一定是美丽的;数学家的想法,如色彩或文字必须以和谐的方式结合在一起。美是首要的试金石:丑陋的数学不可能永存。」线性代数是一个优美凝练的数学分支。线性代数像是巴赫(J. S. Bach)的〈无伴奏大提琴组曲〉,巴赫在这里构建了一种循序渐进和连贯统一的风格,每首组曲在结构上都按照严格的曲式谱成。而在音乐发展的过程中,每个乐章之间的内在联系更是交响曲的先声。线性代数的结构是向量空间,曲式是线性变换。线性代数的乐章有矩阵代数、正交、行列式、特征值与特征向量,以及二次型等。研习线性代数与演奏〈无伴奏大提琴组曲〉同样都需要有效的学习方法。

回到标题,如何学好线性代数?哈尔莫斯从不知道线性代数到底在讲甚么,短短几年变身为一代宗师,他是怎么办到的?哈尔莫斯公开了他的数学学习秘笈:

别只是读;跟它对抗!问你自己的问题,找你自己的例子,发现你自己的证明。这个假设是必要的吗?反向命题成立吗?经典的特例有哪些情况?退化时会怎么样?证明在何处使用了假设?

在〈无伴奏大提琴组曲〉中,有些乐章(如 Sarabande)的音乐性格和内容与其他乐章明显不同。在线性代数中,两个数学物件常具有某种相异的性质却又有一些相同的性质。譬如,在一般情况下,两个同阶方阵 A A A 和 B B B 不满足乘法交换律, A B ≠ B A AB \neq BA AB=BA,但是 det ⁡ ( A B ) = det ⁡ ( B A ) \det(AB) = \det(BA) det(AB)=det(BA)。读了课本的证明,你可能依然困惑。哈尔莫斯鼓励我们提出「蠢问题」。譬如, det ⁡ ( A B ) \det(AB) det(AB) 和 det ⁡ ( B A ) \det(BA) det(BA) 的几何意义是什么? A B AB AB 与 B A BA BA 是否拥有其他的基本不变量使得行列式不改变(见[AB 与 BA 有何关系?])?继续推广,三个同阶方阵 A , B , C A, B, C A,B,C 的乘积 A B C , A C B , B A C , B C A , C A B , C B A ABC, ACB, BAC, BCA, CAB, CBA ABC,ACB,BAC,BCA,CAB,CBA 除了行列式不变,是否还有其他相同的性质?一般来说,无论老师或课本都不会主动地回答我们的「蠢问题」。教师常以「世界上没有愚蠢的问题,只有愚蠢的答案」呼吁学生发问,但绝少学生愿意公开提出他们心中的「蠢问题」。吊诡的是,回答「蠢问题」偏偏是研习线性代数的一个极为有效的途径。下面列举一些困扰我们却又羞于启齿的「蠢问题」供读者思考,但我未将「蠢答案」贴上免得破坏众人的学习乐趣。运气好的话,你在这个网站上乱逛说不定可以找到「蠢答案」,当然「蠢答案」不会是大家都认同的标准答案。

蠢问题

Q1. 二阶行列式定义为
∣ a b c d ∣ = a d − b c \begin{vmatrix} a & b \\ c & d \end{vmatrix} = ad - bc acbd =ad−bc

为什么不定为
∣ a b c d ∣ = b c − a d \begin{vmatrix} a & b \\ c & d \end{vmatrix} = bc - ad acbd =bc−ad


∣ a b c d ∣ = a b − c d \begin{vmatrix} a & b \\ c & d \end{vmatrix} = ab - cd acbd =ab−cd

呢?

Q2. 一个 2 × 2 2 \times 2 2×2 阶矩阵

a b c d \] \\begin{bmatrix} a \& b \\\\ c \& d \\end{bmatrix} \[acbd

的行列式是平面上两个向量

a c \] \\begin{bmatrix} a \\\\ c \\end{bmatrix} \[ac

b d \] \\begin{bmatrix} b \\\\ d \\end{bmatrix} \[bd

或 ( a , b ) (a, b) (a,b) 与 ( c , d ) (c, d) (c,d) 所张平行四边形的(有号)面积。三维空间的两个向量

a c e \] \\begin{bmatrix}a \\\\c \\\\e \\end{bmatrix} ace 与 \[ b d f \] \\begin{bmatrix}b \\\\d \\\\f \\end{bmatrix} bdf 也张开一平行四边形,我们何不定义 3 × 2 3 \\times 2 3×2 阶矩阵 \[ a b c d e f \] \\begin{bmatrix} a \& b \\\\c \& d \\\\e \& f \\end{bmatrix} acebdf 的「行列式」为该平行四边形的面积? Q3. 怎么解释 ∣ a b c d ∣ = ∣ a b 2 a + c 2 b + d ∣ \\begin{vmatrix}a \& b \\\\c \& d \\end{vmatrix}=\\begin{vmatrix} a \& b \\\\2a + c \& 2b + d \\end{vmatrix} acbd = a2a+cb2b+d 但 ∣ a b c d ∣ ≠ ∣ a b a + 2 c b + 2 d ∣ \\begin{vmatrix}a \& b \\\\c \& d\\end{vmatrix}\\neq \\begin{vmatrix}a \& b \\\\a + 2c \& b + 2d\\end{vmatrix} acbd = aa+2cbb+2d 呢? Q4. 为什么两个向量 x = ( x 1 , x 2 , x 3 ) \\mathbf{x} = (x_1, x_2, x_3) x=(x1,x2,x3) 与 y = ( y 1 , y 2 , y 3 ) \\mathbf{y} = (y_1, y_2, y_3) y=(y1,y2,y3) 没有乘法运算却有外积(cross product)?譬如,为什么不定义向量乘法 x × y = ( x 1 y 1 , x 2 y 2 , x 3 y 3 ) \\mathbf{x} \\times \\mathbf{y} = (x_1 y_1, x_2 y_2, x_3 y_3) x×y=(x1y1,x2y2,x3y3) 呢? Q5. 如何理解一个矩阵的最大线性独立的行向量数(行秩,column rank)等于最大线性独立的列向量数(列秩,row rank)? Q6. 为什么 2 × 2 2 \\times 2 2×2 阶矩阵形成的集合可称为向量空间?既然平面上向量是一个具有方向与长度的数学物件,如何理解矩阵 \[ a b c d \] \\begin{bmatrix} a \& b \\\\c \& d \\end{bmatrix} \[acbd

的方向与长度?我们需要引入什么必要的运算?

Q7. 行列式可乘公式
det ⁡ ( A B ) = ( det ⁡ A ) ( det ⁡ B ) \det(AB) = (\det A)(\det B) det(AB)=(detA)(detB)

即两个同阶方阵乘积的行列式等于这两个方阵的行列式的乘积,这个事实的几何意义是什么?

Q8. 矩阵乘法不具有交换律,为什么不定义一种矩阵乘法使得同阶方阵的乘积具有交换律呢?

Q9. 「线性」是什么意思?为什么向量空间也称为线性空间?对于向量 x , y \mathbf{x}, \mathbf{y} x,y 与纯量 α \alpha α,线性变换 T T T 满足
T ( x + y ) = T ( x ) + T ( y ) T(\mathbf{x} + \mathbf{y}) = T(\mathbf{x}) + T(\mathbf{y}) T(x+y)=T(x)+T(y)


T ( α x ) = α T ( x ) T(\alpha \mathbf{x}) = \alpha T(\mathbf{x}) T(αx)=αT(x)

何以具备这两个性质就称为线性变换?

Q10. 为什么线性变换的定义域与到达域都限定为向量空间(或子空间)而非任意的向量集合?

Q11. 向量空间的一个子空间为什么一定要包含零向量?为什么 a x + b y = 0 ax + by = 0 ax+by=0 的解集合称为子空间,但 a x + b y + c = 0 ax + by + c = 0 ax+by+c=0, c ≠ 0 c \neq 0 c=0,的解集合却不称为子空间?

Q12. 一个线性变换可以用不同的矩阵来表示,那么不同的线性变换可以用相同的矩阵来表示吗?

Q13. 为什么线性代数课本都没有讨论如何解矩阵方程,譬如,满足 X 2 = I X^2 = I X2=I 以及 Y 2 = Y Y^2 = Y Y2=Y 的 2 × 2 2 \times 2 2×2 阶矩阵 X X X 与 Y Y Y 要怎么解?

注解

Paul R. Halmos, I Want to Be a Mathematician, 1985, pp 40 - 41.

"The algebra course was hard and I worked at it furiously;...When I say furiously, I mean furiously. Brahana didn't know how to be clear, the text was Bôcher's book (which I thought was mess), and my dominant emotion during much of the time that I spent on the subject was exasperation reaching to anger....somehow I survive my introduction to linear algebra. I didn't really begin to understand what the subject was about till four or five years later, after I got my Ph.D. and heard von Neumann talk about operator theory."

"代数课很难,我学得很拼命......我说拼命,就是拼命的意思。Brahana 不知道如何讲清楚,教材是 Bôcher 的书(我觉得写得很乱),我花在这个科目的多数时间里,我的情绪恼火到愤怒......不知怎么的,我的线性代数导论最后幸存下来。过了四、五年,在我取得博士学位,听了诺伊曼讲的算子理论后,我才真正开始明白这个科目到底在讲什么。"

"Any fool can make a rule, and any fool will mind it."

"任何傻瓜都能订个规则,任何傻瓜都会在意它。"

"It is only possible to understand the commutativity of multiplication by counting and re - counting soldiers by ranks and files or by calculating the area of a rectangle in the two ways. Any attempt to do without this interference by physics and reality into mathematics is sectarianism and isolationism which destroy the image of mathematics as a useful human activity in the eyes of all sensible people."

"理解乘法交换律的唯一可能的方式,打个比方就是分别按行序和列序来数一个阵列里士兵的人数,或者说用两种方式来计算长方形的面积。任何试图只做不与物理和现实世界打交道的数学都属于宗派主义和孤立主义,这必将损毁在所有敏感的人们眼中把数学创造视为一项有用的人类活动的美好印象。"

"Brick walls are there for a reason: they let us prove how badly we want things."

"人生路上有阻挡你梦想的砖墙,那是有原因的。这些砖墙让我们来证明我们究竟有多么想要得到我们所想要的。"

"The mathematician's patterns, like the painter's or the poet's must be beautiful; the ideas, like the colours or the words must fit together in a harmonious way. Beauty is the first test: there is no permanent place in this world for ugly mathematics."

"数学家的模式,如画家或诗人的模式一定是美丽的;数学家的想法,如色彩或文字必须以和谐的方式结合在一起。美是首要的试金石:丑陋的数学不可能永存。"

引用自维基百科:无伴奏大提琴组曲

"Don't just read it; fight it! Ask your own questions, look for your own examples, discover your own proofs. Is the hypothesis necessary? Is the converse true? What happens in the classical special case? What about the degenerate cases? Where does the proof use the hypothesis?"

"别只是读;跟它对抗!问你自己的问题,找你自己的例子,发现你自己的证明。这个假设是必要的吗?反向命题成立吗?经典的特例有哪些情况?退化时会怎么样?证明在何处使用了假设?"


via: