为何从一元五次方程开始就没有由有限次加、减、乘、除、开方运算构成的求根公式了?

【相关问题】能否通过列举一些代数式、方程加以分析、说明,直解释阿贝尔定理? - 数学大家都知道,一元一次、二次、三次、四次方程都有根式解,从五次方程开始就没有一般解了。然而这个情况为什么是五次方程开始出现?为什么这个数字是五?为什么不是六或者是七?为什么恰好是五次方程才开始没有根式解?难道说当多项式的次数达到五的时候,其形态会有根本性的改变?―――另外,就是现行初中数学教材关于一元二次方程的章节中…
关注者
2422
被浏览
257423

29 个回答

过600赞,感谢知友赏光。感谢 @余翔在本原根上的指正,已修改。之前在引理的证明上有失误,感谢@李亦仰指正,已经对关键证明做了修正。

---------------------------------600赞感谢分割线---------------------------

按理来讲 @zero的答案已经说明清楚了,不过从这个问题的问法看来题主好像对整个过程并不清楚,那我们就做详细一点的剖析,主要走伽罗华理论的这条路。
该答案主要面向数学系之外的爱好者,部分地牺牲了逻辑上的严密。长文预警,为此先给本文一个任务清单:

  • 了解根式求解的局限性从何而来;
  • 开根号和加多项式的根是两种扩张数域的方式;扩张的结构是否相同,决定多项式能不能用根式求解;
  • 将同一多项式的所有根视为一个整体,为何可以看作一个整体;
  • 了解刻画整体的方式:{局部}+{局部到其他局部的映射的集合(也就是)}
  • 了解怎样用这种刻画方式来描述整体的层级结构;
  • 群和扩张构成结构上的一一对应,群结构不同于根式求解的多项式,其扩张结构和开根号的扩张结构也不同,此类多项式将无法用根式求解。



这个问题提得比较糙,导致最后问起来好像特别玄乎。我们应该说“有理系数五次方程”或者说“有理数域上的五次多项式”没有求根公式。在另外一些的特定数域上,存在五次方程有求根公式的情况,不过我只是知道有这回事,那些数域并没有做详细的了解。

先说说多项式。大家都知道它长这样:
a_nx^n+a_{n-1}x^{n-1}+...+a_1x+a_0
“有理数域上的多项式”,不是说这个多项式的根是有理数,而是指多项式的系数a_n,a_{n-1},...,a_0是有理数。
强调系数是有理数有什么意义?看一下有理系数二次方程标准形式ax^2+bx+c=0的求根公式:
\frac{-b\pm \sqrt{b^2-4ac}}{2a}
当然我们可以把它记为
f(a,b,c)=\frac{-b\pm \sqrt{b^2-4ac}}{2a}
也就是说,它实际上相当于系数a,b,c的一个函数。
这意味着什么?假设一个函数f(a,b,c)只是对a,b,c做加减乘除,那么,当a,b,c是有理数的时候,只要分母不为0,f(a,b,c)一定不是无理数。
而也就是说,系数及其计算方式控制着求根公式的输出范围,这使得根式求解有它的局限。比如,如果只允许加减乘除的计算方式,那么连x^2-2=0这种都不存在求根公式,因为有理数做加减乘除不会得到无理数。要是系数是复数,因为复数域是代数闭域,复数域上任何一个多项式的根都是复数,就不存在无法求解的问题了。

所以,“有理系数五次以上多项式无法用根式求解”的意思,是说五次以上的多项式里存在这些多项式,它们的根无法用有理数做四则运算和开乘方得出。
总而言之,根在有理数域里的,靠四则运算就已经能求解(数学上称有理数域对四则运算封闭)。根在有理数域外的,我们只有通过开方去拓展有理数域——加入有理数的整数次方根——组成一个新的数域,让方程的根可以算出来。这就是要出现“根式求解”的原因。人们一直以为靠开方生成的“拓展树”(数学上称这个“拓展树”为根式扩张塔)可以把它的枝桠伸到任何一个多项式的根那里,但是阿贝尔扼杀了这种乐观。直观地说,五次以上多项式无法用根式求解,就是存在多项式的根藏在在这株“拓展树”的枝桠的“缝隙”里。


怎样发现这种“缝隙”?这个问题就像我们问"有理数之间的缝隙怎样被发现“一样。有理数和有理数的间隔可以任意小,用直观的发现方法已不可行,因此发现这个”缝隙“只能是利用反证法。
这个反证法怎么做?回忆一下\sqrt{2} 是无理数的证明。概括地说,有理数总可以表示为互质的两个整数之比p/q,在这种情况下分子分母不可能继续约分,而费马证明,\sqrt{2} 如果有整数比的形式,分子和分母可以无穷次地约分下去,从而\sqrt{2} 不可能是有理数。
这就是说,发现“缝隙”的方式,就是证明存在和现有的情形不同的性质。说个很简单的例子:你知道某棵树的树枝永远都只是分成两支生长,但现在我拿出了一个三岔的树枝,因此可以判断它不属于这棵树,这棵树也长不出这种树枝。所以我们得首先知道根式扩张塔这株“拓展树”遵循怎样的结构生长。

关于扩张的结构我们要了解的两个事实:
1、从代数角度讲,根没有大小,只有运算功能\sqrt{2} -\sqrt{2} 的运算功能都是相同的,就是它们的平方等于2。对于有理数域来讲,它们没有区别,都只是那个“平方是2的数”,也不会影响有理数部分的任意四则运算,这就好像往实直线的有理数点中间安插了一个两只脚的架子,哪只脚在左哪只脚在右并没有关系,都不影响有理数域上的任何运算结果。
所以,多项式的根并不完全各行其是,它们因运算功能的相同而连结起来,形成一个“架子”的几个脚,当我们加入多项式的根对有理数域进行扩充,重点在于这个根所在的“架子”的样子,而不是这个根究竟叫什么
好像这和根式可解没什么关系。那现在我们可以对根式可解的条件改写成:如果多项式的根的架子和根式扩张的架子结构不一样,那么这个多项式的根是不可以用根式求解的
有没有打开新世界的大门的感觉?别急,这只是开始。

现在我们需要来研究这个架子应当怎样用数学表达。
架子是个整体,怎样和根这个个体联系起来?比如说,现在我们面对一个四脚架,而我们能表达的只有架子里面的某只脚,怎么做?那就不妨先假定这只脚是一个“原点”,记为j_1(“脚1”的意思……= =),然后令其他脚表示为j_1到它们的映射\sigma的像,记为\sigma (j_1)。于是四个脚都拥有了自己的表达方式:脚1是\sigma_1 (j_1),脚2是\sigma_2 (j_1),脚3是\sigma_3 (j_1),脚4\sigma_4 (j_1)。当然,不同的脚在\sigma的作用下也变成另外的脚,暂不细说。现在我们说,这些映射\sigma就组成了一个\{\sigma_i\},i=1,2,3,4
于是,面对一个整体的时候,我们可以尝试将它表示为“一个局部(原点)+一个局部到其他局部的映射的群\{\sigma\}”这样的结构。
这和原来的脚1、脚2、脚3、脚4的表示有什么区别?关键在于,这个表达方式让人们明白,原点的选取并不是重点,这个群\{\sigma\}才反映了这个架子的整体性质。比如说,这个四脚架的群指出它允许通过旋转使一只脚转移到另一只脚(如下图架子1)。如果这个四脚架的群只有\{\sigma_1,\sigma_3\},那就意味着它只能做翻转,将一只脚翻转到它的对脚(如下图架子2)。同样是四脚架,群不一样,它们的结构就不一样。
(尽管这里对群的表述是非常粗糙的,不过不妨碍得出这个结论)
类似的,多项式的根集,其结构也由根集的群所决定。这是方程可解性的一个重要转折点:要了解多项式的根,可以先了解多项式的根集的群。由于这个群里的成员只是负责把多项式里的一个根变成另外一个根(也可能变成自身),相当于对多项式里的根做置换,数学上称之为根的置换群

注意这种置换要保持有理数域不变,看一个例子:
多项式x^4-10x^2+1的四个根分别是
\left\{
\begin{aligned}
&x_1=\sqrt{2}+\sqrt{3}\\
&x_2=\sqrt{2}-\sqrt{3}\\
&x_3=-\sqrt{2}+\sqrt{3}\\
&x_4=-\sqrt{2}-\sqrt{3}
\end{aligned}
\right.
假设这四个根里面的某个置换\sigmax_1换成x_2,即
\sigma (\sqrt{2}+\sqrt{3})=\sqrt{2}-\sqrt{3}
看得出\sigma只是把\sqrt{3}变成-\sqrt{3}\sqrt{2} 并没有变化。因此考察\sigma对其他根的作用,就应该将这种运算保持,比如\sigma作用在x_4上,结果应该是:
\begin{align*}
\sigma(x_4)&=
\sigma( -\sqrt{2} -\sqrt{3})\\&=-\sigma(\sqrt{2})-\sigma(\sqrt{3})\\
&=-\sqrt{2}-(-\sqrt{3})\\
&=-\sqrt{2}+\sqrt{3}\\
&=x_3
\end{align*}
而不会是\sigma(x_4)=x_1.
(注意:上面计算的第二行的依据是“保持有理数域上的运算结果”的直接运用,也就是数学上“同构”概念的直接定义)
也就是说,我们只讨论使有理数域保持不变的根的置换群,这个群被称为伽罗华群。实际上伽罗华群的定义要比这个广义一些,为了方便讨论我们先这样定义。

我们知道多项式的根填进有理数域中,会形成一个更大的数域,这个数域和群有着怎样的联系?这里就要用到第二个事实,也是名垂千古的伽罗华基本定理的雏形。

2、既然是讨论多项式的根的置换群,我们得让这个扩张出来的数域能够把该多项式的所有根都包括进去,以便根集的“架子”可以自由地切换落脚点。
比如说,Q(\sqrt[4]{2} )\sqrt[4]{2} 是多项式x^4-2的根,但这个多项式的四个根\sqrt[4]{2} ,\sqrt[4]{2} i,-\sqrt[4]{2} ,-\sqrt[4]{2} i中,\sqrt[4]{2} i-\sqrt[4]{2} i都不在Q(\sqrt[4]{2} )中,那么就应该扩充成Q(\sqrt[4]{2} ,\sqrt[4]{2}i),才能讨论x^4-2的根的置换群。
我们称这种扩张为正规扩张。一个多项式的正规扩张包括了该多项式的所有根,也就是说,该扩张容纳了所有可能的置换结果。所以,请特别记住这个性质:在一个多项式的正规扩张里,该多项式的根的置换是充分的。这是接下来的关键信息。

很显然,每个多项式都拥有属于自己的正规扩张,有些多项式的正规扩张只有一步,像x^2-2就只有Q\subseteq Q(\sqrt{2})=Q(\sqrt{2},-\sqrt{2}),而像x^4-10x^2+1这种多项式,它的正规扩张可以分成Q\subseteq Q(\sqrt{2})\subseteq Q(\sqrt{2},\sqrt{3})两步,这两步都是正规扩张。但不管是怎样的多项式,假设它是f,对于它的正规扩张E\supseteq Q,我们都可以找到一个正规扩张链,将它的正规扩张域分解为逐步的正规扩张E\supseteq E_1 \supseteq Q:大的域是中间域的正规扩张,中间域又是更小的域的正规扩张……我们可以想象每一步正规扩张都好像在原来的数域(称为基域)上加了一层外圈,Q加了第1层变成E_1E_1加上第2层变成E,如下图:

当然,每一层的正规扩张都由特定的一个多项式生成,也就是说,E\supseteq E_1是某个多项式f_1的正规扩张,(特别提醒一下,f_1绝不是f的因式!)而f_1也拥有自己的根的置换群。
现在的重点是怎样在这个图上表示f的置换群。f的根在基域之外,那么它就分布在外圈;多项式的根的置换保持基域Q不动,那么我们可以把置换视作外圈的转动(如果读者家里有那种转动的门把手的话,你们可以观察一下它转动的时候中间的锁芯是不动的,就跟这个图的意思一样)。记这个转动为\sigma,它把Q外的一点\alpha转到\sigma(\alpha);并且这个转动有,记为\sigma^{-1},它负责把\sigma(\alpha)转回\alpha(注意\sigma作用的是Q的整个外圈,包括了第1层和第2层):

顺带地,我们把\sigma的集合记为G(E/Q),意思就是“保持Q不动的置换群”。
那么f_1的置换群是啥样的?f_1的正规扩张是E\supseteq E_1,那么它的根的置换群当然就是G(E/E_1),即“保持E_1(在图中是Q和第1层)不动的置换群”。记G(E/E_1)的某一元素\tau,它的作用就是转动图中的第2层,如下:

显然G(E/E_1)G(E/Q)的子群,“整个外圈的所有转动”就包含了“固定Q和第1层转动第2层”的所有操作。

请注意我们想要让正规扩张链E\supseteq E_1 \supseteq Q逐步分解下去,而我们现在已经假定了E \supseteq E_1是正规扩张,然后我们剥去E/E_1,就只剩下E_1\supseteq Q这层扩张,那什么情况下E_1\supseteq Q才是正规的呢?
这时候就要出动之前提到的性质:在一个多项式的正规扩张里,该多项式的根的置换是充分的。伽罗华即将施展开他的魔法。

如果E_1\supseteq Q是正规扩张,E_1/ Q里的元素\alpha都可以表示成某一多项式f_2的根,进而f_2的根的置换结果还会在E_1里(也就是说\sigma(\alpha)还会在第1层里)。复习一下刚才那个图示:

要用等式说明这个事实,我们需要对第2层进行扰动,以证明第1层的元素经过置换后还在第1层里,这样当我们同时对第1、2层进行转动(施加了\sigma)的时候,第2层的转动\tau就完全地独立于第1层从而在1、2层共同转动时,第2层不仅在扩张的角度上,在置换群(转动)的角度上也可以和第1层完全剥离开来
于是我们使用E\supseteq E_1的伽罗华群G(E/E_1)。之前已经说过,G(E/E_1)只作用在第2层,而\alpha\sigma(\alpha)都在第1层,因此G(E/E_1)不会对f_2的根产生影响,于是我们可以得出下图里的等式:
\tau\sigma(\alpha)=\sigma(\alpha)

既然\sigma(\alpha)\tau的作用下保持不动,那么施加\sigma^{-1}就会返回\alpha,即
\sigma^{-1}\tau\sigma(\alpha)=\alpha
下图表达了整个计算的过程:
注意到第2层(E/E_1)的元素由于\tau的扰动,施加了\sigma^{-1}之后并没有返回原位,就相当于是被施加了G(E/E_1)里的某个映射\tau',也就是\sigma^{-1}\tau\sigma(\alpha)=\tau'(\alpha)=\alpha。由于\tau\tau'都属于G(E/E_1),考虑到\tau\tau'的任意性,事实上我们可以把这条式子写成(G(E/E_1)简写成G_1方便看):
\sigma^{-1} G_1 \sigma=G_1
再考虑\sigma的任意性,事实上G(E/E_1)G(E/Q)里的每个成员都要满足上式,这时候我们就称G(E/E_1)就称为G(E/Q)正规子群
整理一下,我们就得到一个正规扩张(在这里涉及的正规扩张被称为伽罗华扩张)及其伽罗华群的对应条件:
对于伽罗华扩张Q\subseteq E_1\subseteq EQ\subseteq E_1是正规扩张当且仅当G(E/E_1)G(E/Q)的正规子群。
字面上看艰涩无比,然而总结一下:
正规扩张在扩张家族里是个自带坚硬外壳的种类,壳内的元素只能在壳内做置换。于是,当好几层外圈一起做置换时,外层的置换就被挡在里层的壳外进行。这时候,我们就说外层的置换群是整个置换群的正规子群。
反过来,如果想要证明里面那层是正规扩张,那就只需要证明外层的置换被“挡”在里层的之外,便可以得知一个讯息:“里层是带壳的!”这样就证明了里面那层是正规扩张。

读者可能已经发现了,每一层正规扩张一定对应着一个正规子群,那么它们会不会是一一对应的呢?恭喜你,伽罗华也是这样想的!

上述的表述实际上就是伽罗华基本定理的一个关键性引理的证明主体。根据这个引理,伽罗华证明了伽罗华基本定理,也就是正规扩张链和正规子群链的一一对应,史称伽罗华对应。
正规子群是伽罗华独创的概念,它的思想之精妙怎样夸赞都不为过。对于正规子群的意义,我曾写下如下文字:

正规子群的意义有多大呢?它是剖析复合运动的利器,是对复合运动进行分类最简洁最漂亮的方式。在生活和研究中我们会遇到各种各样复合的动作与映射,就像我们说的\sigma一样,而我们并不知道其中的分动作究竟是连带的呢,还是它可以独自行动,就像\tau一样。平抛运动既向前又向下,向前和向下的运动是不是相互独立、可以分开分析的呢?这些动作的可能性往往有无穷多种,不可能一一检验,分类更是往往只能基于个人感受,哪里可能想到还有这样的区分方法,通过检验,直接在复合作用中分离出自成一体的部分?将群的正规子群和域的正规扩张进行一一对应的数学方法就是伽罗华理论核心的内容,而正规子群的提出和上面定理的证明则是这个对应方法的关节处,当然更是伽罗华本人的首创。考虑到那时候数学远不如现在发达,伽罗华这一突破可谓石破天惊,他成为数学史上唯一一个以名字来命名其理论的数学家,也就不惊奇了。而他死的时候,才21岁。

事实上,群论的研究方法——将动作视为运算,构造特殊的运算系统,研究系统的内部结构,进行分类、分层,将它的结构等同于研究对象的结构,就是由伽罗华开创的。由于群的构造非常自由,只要满足封闭运算的性质(允许逆运算不动运算)就可以做,因此随着时间推移,群被应用在越来越多的领域上,以各种各样的形式出现,伽罗华也就取代了群的概念的真正发明者拉格朗日,成为了群论的祖师爷。


赞完正规子群之后,让我们再次回到最初的问题上。怎么判断多项式能不能根式求解呢?伽罗华理论告诉我们,根据伽罗华对应,看这个多项式的伽罗华群,是否具备根式扩张的伽罗华群的结构,如果具备就可解,不具备就不是根式可解的。于是,现在问题只剩下这个:根式扩张的伽罗华群有怎样的特性?


讨论根式扩张的伽罗华群的结构,注意一下三个事实,在此不加证明:
1、根式扩张,在运算中也就是我们所说的开根号,总可以分解成素数次方的开根。如果有非素数次方根\sqrt[n]{a} ,其中n=pq,那么我们就能令\sqrt[n]{a} =\sqrt[q]{\sqrt[p]{a}} ,一直到p是素数为止。所以我们只需要研究开素数次方的根式扩张。
2、任何的根式扩张总可以扩充成一个正规扩张。根式扩张并不一定是正规扩张。Q(\sqrt[3]{2} ) \supseteq Q是根式扩张,但是\sqrt[3]{2} 的极小多项式(知道是以\sqrt[3]{2} 为根的最小多项式即可)x^3-2的其他两个根的都是复数,不在Q(\sqrt[3]{2} )里面,所以Q(\sqrt[3]{2} ) \supseteq Q不是正规扩张,但是它可以扩充成一个正规扩张,根式扩张的伽罗华群也就可以用这个正规扩张去研究。
3、开素数次方的伽罗华群总是有且仅有素数个成员。我们说群的阶数一定是个素数。
根据上面三个事实,我们可以得出如下结论:
根式扩张的伽罗华群一定可以分解成一条正规子群链,其中每一层的阶数都是素数。
因此,如果一个多项式的伽罗华群的正规子群链里面出现某一层的阶数必须只能是合数,那么这个多项式就不能用根式求解了。
(其实每一层的群不叫伽罗华群,叫这个伽罗华群的商群,不过为了讨论方便目前先这样处理)

现在终于可以回过头来解释 @zero的那个答案了。计算多项式的伽罗华群——我们只说计算群的阶数是一项比较专门的技术,在此不作赘述,不过数学家得出了以下结果,它包含了我们要讨论的最终结果:
1、一个一般的n次多项式的伽罗华群是n个根的自由置换群,称为对称群S_n,也就是说不管怎么换都能保持有理数域不动。用初等的组合数学就知道这种置换共有n!种可能,即S_n中有n!个成员。很显然S_1\subseteq S_2\subseteq ...S_n\subseteq ...
2、S_5(阶数是5!=120)有一个子群A_5,是自由置换群中所有偶数次置换的集合,A_5的阶数很好算,120的一半,也就是60。但是A_5的正规子群有且只有平凡的正规子群,即A_5\{1\}(这就是所谓的单群的定义),因此正规子群链S_5\supseteq A_5 \supseteq \{1\}有一层必须是合数阶,于是一般的五次多项式没有根式求解。
又因为S_5\subseteq S_6\subseteq ...S_n\subseteq ...,因此五次以上的多项式都存在这种情形,即伽罗华群存在一条经过A_5的正规子群链,从而五次以上的多项式也没有一般的求根公式
3、但是,对于特定的n次多项式,并不是没有根式求解的可能,最简单的就是x^n-1这个情形,有复数基础的人都知道它有n个根,均匀分布在复平面以原点为圆心、长度为1的圆周上。这些根是:
e^{\frac{k}{n} 2\pi i},k=1,2,...,n
什么?这根本没有根式表达?它们其实就是使\sqrt[n]{1}n个不同写法啊,只是因为一般默认\sqrt[n]{1}是正实数,才不能一视同仁的。

后记:
读者可以在这篇回答中一窥伽罗华理论的整体架构。文中有大量不加证明的引理、定理直接引用,以及许多并没有做明确定义但极其重要的概念(域扩张、极小多项式、同构、商群等等),还有一些关键性的并没有写进文中的概念(单扩张、域上的线性空间、可分/可离扩张、域同构、自同构等等),实际学习中的困难可以想象。但它的中心思想又这样精彩,值得付出这样的精力,由此可以看到伽罗华理论是一门多么精妙的数学。
伽罗华理论除了解答了方程可解性的历史难题,它的相关运用还成功地证明“古希腊三大几何问题”——立方倍积、化圆为方、三等分角都不可能解决,这些问题要作出的点都在以尺规作图为扩张方式的“拓展树”的缝隙里,因此不可能用尺规作图解决。伽罗华对应还成为了怀尔斯解决费马大定理的关键性工具。从数学领域的开拓来说,伽罗华理论成了群论、群表示论乃至抽象代数的最好引荐人,而现在这些领域的影响已经远远超出数学领域。将伽罗华理论视作近代数学的开端可谓实至名归。

在回答问题之前,我想先来解释一下这个问题到底是什么意思。如题目所说,系数为有理数的五次(及以上)方程没有加减乘除开方的求根公式。

不要理解为『有理数系数五次方程没有公式解』。我们有办法使用一些超越函数来构造出五次方程的公式解。这里说的是,只用『加减乘除』和『开方(即使用根号)』给不出五次方程的求根公式。

也不要理解为『对于每一个有理数系数的五次方程,都无法只用加减乘除和开方来表示出它的根』。对于某些五次方程,我们完全可以找到根式解,比如x^5-2=0 的解(之一)是\sqrt[5]{2} . 这里说的是,我们没法给出一个只使用加减乘除和开方的通用公式,使其可以给出任何一个有理数系数的五次方程的解——就像大家熟知的二次方程求根公式那样。

所以,理论上说,我们其实只需要找到一个没有根式解的有理数系数的五次方程,就可以说明五次方程没有只使用加减乘除和开方的求根公式了。这样的例子当然是有的,比如x^5-6x+3=0 就没有根式解。(当然,要说明其为什么没有根式解并不是一件简单的事情。)

其实,这个现象没有看上去那么神奇。这只是说明,『加减乘除』和『开方』的运算组合有其局限性罢了。如果我们不允许开方,只允许用加减乘除,那么我们只能给出一次方程的求根公式,对于二次方程我们便束手无策了——这就是『加减乘除』的局限性。通过引入『开方』运算,我们可以给出四次方程的一般解,这已经是一大进步啦=w= 所以,如果说『开方』运算如加减乘除一样,也有其局限性,这并不是一件那么让人意外的事情。

然而,这还是有一点点神奇的。神奇之处在于,为什么恰好是五次呢?为什么不是四次或者六次?嗯,这便是这篇回答想要讨论的问题。

大致思路是这样的:为了找到方程的解(在本文的语境下是多项式的根),我们需要进行域扩张,因为方程的解往往不在有理数域中。同时,多项式的根具有某种对称性。我们可以通过群的概念来描述对称性,而多项式的根的对称性可以转化为域扩张的对称性,后者可以被『伽罗瓦群』来描述。『加减乘除』这四种运算无法进行域扩张,而通过『开方』进行的域扩张(根式扩张)具有某种特殊的对称性——其对应的伽罗瓦群是『可解的』。而通常情况下,五次方程的解(即五次多项式的根)对应的域扩张的伽罗瓦群是『不可解的』,所以仅用『加减乘除』和『开方』不可能让我们从有理数域扩张到包含五次方程解的域。

好吧,我估计不少人都会觉得上面一段话『每个字都能看懂』……我会试图在回答里慢慢解释上述这些概念。如之前一样,这篇回答为了可读性,会牺牲一些严谨性。

一般说来,要想真正弄清楚这个问题,需要学习两个学期的抽象代数,而且对于大多数人来说,抽象代数也不是一上来毫无基础就可以学的。所以,想通过一篇简短(跟教材比起来)的回答来把这个问题彻底解释清楚,是根本不可能的事情。

这篇回答最多只能让没学过相关数学知识的读者大致了解要解决这个问题『大概是怎样做的』或『从什么角度入手』,所以不要对本文抱有太高的期望。(如果只靠阅读知乎回答就可以学数学,那我们还要大学干什么呢?)对于将要学习或正在学习相关数学知识的读者,我不敢保证这篇回答会对你们在『直观理解』上有帮助。但如果有一点点帮助的话,我会很开心的=w=

以下是一些阅读建议:

1. 不要试图一次性读完全文(尤其对于没有学过相关知识的同学来说)。我把全文分了若干节,每次读一到两节就可以了,不要求快,尤其是在读数学时。

2. 我在每一节的开头写出了『读完这一节之后你应该知道哪些概念』。再阅读下一节之前,先确保自己对这些概念有一定的认识。

3. 本文以介绍『对称与群的关系』开始,这一部分非常重要。囫囵吞枣可能会导致之后的阅读寸步难行。

4. 在读本文之前,最好先读:

群论研究结构,「结构」一词是什么意思?跟数学有什么关系? - 匡世珉的回答 - 知乎

如何给高中生解释群论? - 匡世珉的回答 - 知乎

为什么尺规不能三等分一个任意角? - 匡世珉的回答 - 知乎

以上三篇回答有助于更好地理解本文。为了控制篇幅,以上三篇回答中详细介绍过的概念,本文可能就不会花过多笔墨了。

5. 再强调一遍,这篇回答最多只能让没学过相关数学知识的读者大致了解要解决这个问题『大概是怎样做的』或『从什么角度入手』,所以不要对本文抱有太高的期望。在本文最后我会列出一些教材与资料,对于想真正弄清楚这个问题的同学们来说,那些才是你们应该认真看、认真读的东西。

这篇回答献给教了我一学年抽象代数的Robert D. Friedman教授。

大二上学期的最后一次抽代考试,我在答题纸的最后写下了:

Thank you for your great lectures. They have made mathematics as beautiful as it should be.

好的,正文要开始了=w=


===============第一节===============

【对称、对称操作、对称操作的四条性质】

首先我们来看两个图形:

左边的是圆,右边的是正方形,他们都是『对称图形』,没错吧?

请听题:这两个图形哪一个『更对称』呢?

为了回答这个问题,我们必须要知道到底什么是『对称』。当我们用『对称』来形容一个图形的时候,我们其实是在说这个图形在某些操作下保持不变——这样的操作我们称之为『对称操作』。

对于正方形来说,『(顺或逆时针)旋转90度』就是一个对称操作,而『旋转45度』则不是。我们可以这么理解:如果你在我闭上眼睛的时候悄悄地把正方形(绕中点)旋转90度,我是不会发现你做了这个操作的。但如果你把正方形转了45度,我肯定就会发现了。

那么正方形的对称操作有哪些呢?一个可能的答案是『所有角度为90的倍数的旋转(包括旋转0度)』。然而,由于旋转360度等于没有转,所以其对称操作其实只有『(顺时针)旋转0度、90度、180度、270度』这四种。

如果允许翻折的话,我们还可以得到另外四种对称操作,即『水平、竖直、沿对角线翻折』。

那么圆的对称操作有哪些呢?

我们发现,任何角度的旋转都是对称操作。如果允许翻折的话,沿任何一条过圆心的直线翻折也都是对称操作。

所以,圆具有无穷多种对称操作,而正方形只有有限多种对称操作(四或八种,取决于是否允许翻折)。如果以对称操作的数量为标准的话,我们可以说『圆比正方形更对称』。

现在我们来仔细研究一下『对称操作』。

正如之前所说的那样,我没有办法确定你是否在我闭上眼睛期间做了某种『对称操作』。我们可以说,对称操作就是那些可以通过『闭眼测试』的操作。(啊,这个词是我自己造的,只是为了方便叙述与理解=w=)

注意,这样意味着我们只关心『操作开始前的状态』和『操作结束后的状态』,至于中间到底做了什么我们并不关心。比如,一次『先逆时针旋转45度再顺时针旋转135度』的操作与一次『顺时针旋转90度』的操作并无区别,都是同一种对称操作。

那么对称操作(可以通过『闭眼测试』的操作)具有哪些性质呢?

第一,如果我们把两个对称操作连起来做,看成一个『复合操作』,那么这个新得到的『复合操作』也是一个对称操作。

不妨这么想:如果操作A和B都能分别通过『闭眼测试』,那么『先做A再做B』也应该能通过『闭眼测试』。

举个例子,『先顺时针旋转90度,再顺时针旋转180度』也是一个对称操作,等价于『顺时针旋转270度』。

两个对称操作的复合可以让我们得到新的对称操作,就像两个整数相加可以得到新的整数一样,所以我们可以把对称操作的『复合』看成是一种运算。(这让我想到Friedman教授在第一节抽代课上说的:Basically, you combine two things and get a third. That’s algebra.)

第二,对称操作的复合运算满足『结合律』。

这几乎是一句废话。如果A、B、C是三个对称操作,那么结合律就可以描述为『先「做A然后做B」再做C』与『先做A再「做B然后做C」』的效果一样——这显然效果一样,因为两次都是把A、B、C按顺序做,完全没有区别。

注意,这是结合律,不是交换律,对称操作的顺序没有改变。(复合运算不一定满足交换律,考虑正方形『顺时针旋转90度』与『竖直翻折』这两个操作。)

如果觉得结合律过于显然,那么可以暂时不去管它。(强调结合律其实是为了把对称操作进行抽象,而既然我们现在就在讨论对称操作,所以结合律就是自带属性。)

第三,『什么都不做』也是一个对称操作。

额,我知道这个看起来有点奇怪,『什么都不做』为什么也算是一个操作呢?不过『什么都不做』也可以通过『闭眼测试』呀:我没办法知道我闭上眼睛之后你是做了『什么都不做』还是什么都没做……

好吧,如果觉得这不能说服你,那么让我们来想一想之前的第一条性质:对称操作的复合还是对称操作。我们把『顺时针旋转90度』与『顺时针旋转270度』复合起来,得到的就是『什么都不做』。为了让第一个性质成立,就让我们把『什么都不做』也当成对称操作吧!

好吧,这简直是个假对称操作。

为了显得稍微正经一些,我们把『什么都不做』的操作称为『恒等操作』。

第四,每一个对称操作的『逆操作』也是对称操作。

这不难理解:如果一个操作可以通过闭眼测试,那么把它反过来做,也可以通过闭眼测试。比如『顺时针旋转90度』是对称操作,那么『逆时针旋转90度』即『顺时针旋转270度』也是对称操作。

等等,逆操作就是『反过来做』的操作?那什么叫『反过来做』?

好吧,如果觉得这个说法随意了一些,那我这么说:把一个对称操作与其『逆操作』复合起来(无论先做哪一个),得到的新对称操作都是『恒等操作』。

好的,关于『对称操作』的性质,我们知道这四个就足够了。现在我们可以说:『群』就是某个图形(或对象)的所有对称操作的集合。


===============第二节===============

【群、群与对称的关系、群的例子(很重要,后文会用到)、群同构】

是的,就是这么简单。给定一个图形(或对象),其所有对称操作构成的集合就是一个群。注意到集合自然地带有一个『复合』运算。(反过来说,对于任何一个群,它都是由某个图形(或对象)的所有对称操作构成的。)

还是用例子来说明吧:假设桌上有五个完全一样的纸杯排成一行,把每个纸杯看成一个点(如下图),那么把这五个纸杯看成一个整体,其对应的群是什么?

给个提示:想想看之前所说的『闭眼测试』。既然纸杯完全一样,那么在闭眼时交换任意两个纸杯,我都发现不了。

没错,所以这五个纸杯的每一种『重新排列』(即『置换』)都是一种对称操作。注意,对称操作是『置换』的动作,而不是置换之后的状态。

于是,对称操作的数量就是五个纸杯不同排列的数量,也就是120种。这五个纸杯所对应的群就由『五个对象的全部置换方式』构成,记作S_5 ,是一个120阶的群(阶即元素的个数)。

请听题:如果把五个纸杯改为四个纸杯呢(如下图)?对应的群是什么?

好吧,这题过于简单了。对应的群由『四个对象的全部置换方式』构成,记作S_4 ,是一个24阶的群。

下一题有点难度:如果纸杯A和B完全一样,纸杯C和D完全一样,而纸杯A和C不一样(如下图),这回对应的群是什么?

回忆一下『闭眼测试』,我们发现,『交换A和C』是不行的,因为这两个纸杯不一样,交换了就会被发现。我们只能交换A和B,或者交换C和D,所以对应的群是什么?

答案是:一个由『恒等操作』、『交换A和B』、『交换C和D』、『同时交换A和B、C和D』这四个对称操作构成的四阶群,记作V,或者称为『克莱因四元群』。

稍微想一下我们会发现,如果把四个点分成黑色与红色两部分,那么每一部分分别对应一个S_2的群(与之前的记号一致),所以我们可以把V群看成是由两个S_2群『组合』在一起得到的——我们说V是两个S_2的『直积』,记作V\cong S_2\times S_2 ——不过这暂时不重要。

提醒一下,别忘了群还带有『复合』运算。比如在这个例子中,先做『交换A和B』再做『同时交换A和B、C和D』,就得到了『交换C和D』。

讲了这么半天,这些东西跟五次方程到底有什么关系啊?

别急,再举一个例子我们就讲方程(多项式)。

一个长方形,在允许翻折的情况下,对应的群是什么?

答案是:一个由『恒等操作』、『水平翻折』、『竖直翻折』、『旋转180度』这四个对称操作构成的四阶群。复合运算关系如下图:

重点来了:这个群跟之前所说的V群具有同样的结构

什么意思?

如果我们把V群中的元素『恒等操作』、『交换A和B』、『交换C和D』、『同时交换A和B、C和D』分别换成『恒等操作』、『水平翻折』、『竖直翻折』、『旋转180度』,就会发现它们的复合运算完全一致。

前一个例子中,我们说过,先做『交换A和B』再做『同时交换A和B、C和D』,就得到了『交换C和D』。按照上述规则,这个句子被我们换成:

先做『水平翻折』再做『旋转180度』,就得到了『竖直翻折』。

实际上确是如此!

再打个比方,如果我现在造出一个机器,机器上有四个按钮,分别贴着『恒等操作』、『交换A和B』、『交换C和D』、『同时交换A和B、C和D』这四个标签。依次按下任意两个按钮,其复合运算对应的按钮就会亮起。所以这相当于是一个『V群复合运算计算器』。

此时,如果我把这四个标签换成『恒等操作』、『水平翻折』、『竖直翻折』、『旋转180度』,而丝毫不改动机器本身的电路,我们会发现这个机器依然可以正确计算这四个操作的复合运算!

所以,我们说这两个群是『同构』的,只是元素的名字不同罢了。如果用函数f来表示『换标签』,即标签a被换成了f(a),并用*来表示复合运算,那么同构满足什么样的条件呢?

如果我们用ab来表示ab复合的结果,那么我们就有a*b=ab,而『换标签』对运算完全不影响,所以就有f(a)*f(b)=f(ab),而通常我们会把星号省略,写成f(a)f(b)=f(ab);同时,这里『换标签』是一一对应的,所以我们也要求f是一一对应的,即不能有两个不同的按钮换成了同样的标签。于是,如果一个一一对应的函数f满足f(a)f(b)=f(ab)的等式,我们就说f是一个(群)同构。而f(a)f(b)=f(ab)这个等式的意义就是『函数f保持运算结构』。

(在这里提一下:按照一般的严格定义,『群』是带有一个运算的集合,并满足封闭性、结合律、存在单位元、存在逆元这四个条件,这正是我们之前总结的『对称操作』的性质。事实上,从范畴的角度来看,群可以定义为由一个元素构成的范畴,其态射为群同构,这正是我在本文中所说的定义。Leinster 的Basic Category Theory 的例子1.1.8(c)对此有精彩的描述。)


===============第三节===============

【多项式的根的对称性】

好的,我们来谈方程与多项式吧!

由于多项式的根就是使其等于零的x的值,也就是方程的解,所以在下文中我将不加区分地使用『方程的解』和『多项式的根』这两个表述。

我在开头说过,方程的解具有某种对称性。这到底是什么意思呢?举个例子,我们来看多项式x^4-4x^2-5,因式分解为(x^2+1)(x^2-5),它的四个根为:\pm i, \pm \sqrt{5} .

我们写出随便写几个包含这四个根的多项式形式的(以下省略)等式,比如i^2+1=0, \sqrt{5}+(-\sqrt{5})=0, i(-\sqrt{5})-(-i)\sqrt{5}=0.

现在,把这些数字都当成标签,交换\pm i的标签,我们发现等式依然成立:比如之前的i^2+1=0变成了(-i)^2+1=0,而这个等式是对的。

换句话说,如果我告诉你我用ab来表示\pm i,写出一堆包含ab的等式,你永远不可能知道到底ab哪个是i哪个是-i,因为无论是哪种情况,等式都成立。所以我们说,i-i在代数上是无法区分的,因为它们满足的等式完全一样——它们的标签可以随意交换

还记得什么叫『对称』吗?对称就是在某些操作下保持不变。而在这里,交换\pm i的标签,所有的等式都没有发生变化,这就是多项式的根的对称性

同样地,交换\pm \sqrt{5}的标签,或者同时交换\pm i\pm \sqrt{5}的标签,等式仍然保持不变。

于是,这个多项式的根所对应的群是什么呢?

答案是:一个由『恒等操作』、『交换\pm i的标签』、『交换\pm \sqrt{5}的标签』、『同时交换\pm i\pm \sqrt{5}的标签』这四个对称操作构成的四阶群。

也许你已经意识到了,这个群同构与V所以多项式x^4-4x^2-5对应的群正是『克莱因四元群』。

这真的是很神奇的一件事情。如果不借助群来研究对称性,我们很难想到这个多项式竟然会跟长方形有内在的联系!

为了更方便地研究多项式的根的对称性,我们需要引进一个新的概念:


===============第四节===============

【域、域扩张、域的对称性、自同构群】

所谓『域』,就是一个对加、减、乘、除都封闭的集合。换句话说,对于域中的数字,无论你怎么用加减乘除(当然,零不能做除数)去蹂躏它们,它们依然还是在这个域里。

比如,全体有理数构成有理数域\mathbb{Q},因为任意两个有理数做加减乘除之后结果还是有理数。而全体整数则不能构成域,因为两个整数相除不一定得到整数。

如果只能使用加、减、乘、除,那么我们无法给出(有理数系数,以下省略)二次方程的求根公式。为什么呢?从『域』的角度看,我们就可以给出答案了:因为二次方程的解却可能不在有理数域里(比如x^2-5=0),而无论在有理数域中怎么做加减乘除,我们仍然只能得到有理数。

这样看来,『域』就如同如来佛的手掌心——如果加减乘除是你全部的招数,那你永远无法离开这个『域』。

而这个时候,『开方』就是一个格外强大的技能:它能让我们离开原来的域,进行『域扩张』。

比如,在有理数域里对5开二次方根,我们就得到了\sqrt{5},而\sqrt{5}不是有理数——不在有理数域中。这时,我们再借助加减乘除,就可以得到一个同时包含有理数和\sqrt{5}的新的域,记作\mathbb{Q}(\sqrt{5}),而x^2-5=0的解正是在这个新的域里。所以,通过『开方』的操作,我们就可以得到x^2-5=0的解。

所以,要想给出一个五次方程的解,我们希望能通过『开方』不断地扩张我们的域,直到我们的域中包含该方程的解。然而伽罗瓦告诉我们,这往往是做不到的。

还记得之前我们说的多项式的根的对称性吗?我们之前考察了x^4-4x^2-5=(x^2+1)(x^2-5)的四个根的对称性——其对应的群正是『克莱因四元群』。这个多项式还是复杂了些,因为它可以被拆成两个次数更低的多项式的乘积——我们称其为『可约』多项式。

我们现在来单独考察它的一个因子x^2-5——它作为有理数系数多项式是『不可约』的,因为它没有办法再被拆成两个次数更低的多项式的乘积,除非引进\sqrt{5}

如前文所说,x^2-5的根是\pm \sqrt{5},均不在有理数域中。同时,这两根具有对称性:我们可以随意交换两根,它们满足的等式不会改变。

重点来了:如果我们把这两个根放在它们所在的域\mathbb{Q}(\sqrt{5})中考虑,那么根的对称性就转化为域的对称性——我们可以同时交换一切a+b\sqrt{5}a-b\sqrt{5},而域\mathbb{Q}(\sqrt{5})中所有的等式都不会改变!

举个例子:我们知道(2+\sqrt{5})(3-\sqrt{5})=1+\sqrt{5},现在我们交换一切a+b\sqrt{5}a-b\sqrt{5},得到(2-\sqrt{5})(3+\sqrt{5})=1-\sqrt{5},而这个等式依然是成立的!

也许这有些难以置信,但事实就是如此。你可以自己尝试更多的例子=w=

套用之前的比方,如果我现在造出一个机器,它有无穷多个按钮,对应了域\mathbb{Q}(\sqrt{5})的每一个数。它可以正确地计算域\mathbb{Q}(\sqrt{5})中的加减乘除(如之前一样,以亮灯的形式)。如果我同时交换一切a+b\sqrt{5}a-b\sqrt{5}的按钮标签,这个机器依然能够正确的计算加减乘除!

所以,如之前一样,这个『交换标签』的操作是域\mathbb{Q}(\sqrt{5})的『同构』。不仅如此,它还是一个『自同构』,因为它没有牵涉到任何『新的标签』,仅仅是把原有的标签换了位置

其实,我们在中学数学里早已接触过域的自同构了。

不知大家是否还记得,我们在解二次方程时,复数解一定是成对出现的——如果其中的一个解是复数,那么另一个解也是复数,并且这两个解一定共轭。

比如,x^2-2x+5=0的解是1+2i1-2i,它们是共轭的。

这是为什么呢?因为全体复数构成复数域\mathbb{C},其中的每个元素都可以写成a+bi的形式,而『同时交换一切a+bia-bi』是复数域\mathbb{C}的自同构。

我们把思路理一下。如果我们已经知道『同时交换一切a+bia-bi』是复数域\mathbb{C}的自同构,那么对于任何一个等式,比如(1+2i)^2-2(1+2i)+5=0,我们可以放心地交换1+2i1-2i,得到(1-2i)^2-2(1-2i)+5=0;前者意味着1+2ix^2-2x+5=0的解,后者意味着1-2ix^2-2x+5=0的解。

所以,二次多项式的复根一定是成对出现的。(实际上,我们完全不用局限于二次——任何次数的多项式的复根都是成对出现的,理由正是『交换共轭对』是复数域的自同构。)

接下来的一句话很重要!

『自同构』就是一个域的『对称操作』。

(其实我之前讲了这么多,就是为了说出这句话。不妨停下来想一想,确定自己理解这句话之后再继续往下读。)

所以,一个域的所有自同构构成了一个群——我们称之为『自同构群』。

那么域\mathbb{Q}(\sqrt{5})的自同构群是什么呢?

『同时交换一切a+b\sqrt{5}a-b\sqrt{5}』是一个对称操作(自同构),并且『恒等操作』也是一个对称操作(自同构),除此之外没有更多的对称操作(自同构)了。所以,其对称群就是S_2——还记得这个符号吗?回想一下排列纸杯的例子吧。

(其实这就相当于是在置换\pm \sqrt{5},因为它们的变动完全决定了域中每一个数的变动。)

为了避免大家迷失在众多的数学概念中,我们来简短地回顾一下:

我们的目的是寻找五次方程的根式解。由于五次方程的解往往不在有理数域中,所以我们只能寄希望于通过『开方』不断地扩张数域,直到数域包含五次方程的解。同时,方程的解具有对称性,并可以转化为所在的域的对称性,可以用『自同构群』来描述。

如果我们能说明『五次方程的解所在的域』具有的对称性与『可以通过开方扩张的数域』具有不同的对称性,那么就意味着『五次方程的解所在的域』不是『可以通过开方扩张的数域』,也就意味着五次方程没有求根公式。

所以,为了说明这一点,我们不仅需要研究『域』的对称性,还需要研究『域扩张』的对称性。域的对称性可以用『自同构群』来描述,而域扩张的对称性则可以用『伽罗瓦群』来描述。

有了之前这么多的铺垫,『伽罗瓦群』就不难理解了——它只是『自同构群』的『子群』罢了


===============第五节===============

【子群、域扩张的对称性、伽罗瓦群】

子群』的概念与『子集』类似,很简单。H是G的子群就意味着G包含了H中的所有对称操作。也就是说,H是G的『一部分』——当然,H也得是一个群

举个例子,回到最开始的正方形。如果不允许翻折,那么正方形具有四种对称操作,它们构成的群记作C_4;如果允许翻折,那么正方形据有八种对称操作,它们构成的群记作D_4. 显然,每一个C_4里的对称操作都在D_4里,所以C_4D_4的子群,记作C_4 \leq D_4 .

现在我们考虑从有理数域\mathbb{Q}到域\mathbb{Q}(\sqrt{5})的域扩张。

我们已经知道域\mathbb{Q}(\sqrt{5})的对称操作是『恒等操作』和『同时交换一切a+b\sqrt{5}a-b\sqrt{5}』,它们构成了\mathbb{Q}(\sqrt{5})的自同构群,同构于S_2群。

我们现在规定,这个域扩张的对称操作是:\mathbb{Q}(\sqrt{5})的自同构群中保持\mathbb{Q}不变的对称操作

域扩张的对称操作构成的群被称为『伽罗瓦群』。按照这个定义,『伽罗瓦群』自然是『自同构群』的子群。

更一般地来说,如果我们把域F扩张成域E,那么这个域扩张的对称操作就是E的自同构群中保持F不变的对称操作,它们构成了这个扩张的『伽罗瓦群』,记作Gal(E/F).

本例中,伽罗瓦群记作Gal(\mathbb{Q}(\sqrt{5})/\mathbb{Q}) .

那么这个伽罗瓦群到底包含了什么对称操作呢?

首先,『恒等操作』保持了\mathbb{Q}(\sqrt{5})不变,自然就保持了\mathbb{Q}不变——因为\mathbb{Q}(\sqrt{5})\mathbb{Q}的扩域,\mathbb{Q}\mathbb{Q}(\sqrt{5})的一部分。

接着我们发现,『同时交换一切a+b\sqrt{5}a-b\sqrt{5}』也保持了\mathbb{Q}不变——这个操作只影响到那些带有\sqrt{5}的数,对有理数完全没有影响。

所以,在这个例子里,『伽罗瓦群』不仅是『自同构群』的子群,而且它们完全一样!所以Gal(\mathbb{Q}(\sqrt{5})/\mathbb{Q})\cong S_2.

(为什么我们要这么定义域扩张的对称操作呢?因为在这个例子中,要想完成有理数域\mathbb{Q}到域\mathbb{Q}(\sqrt{5})的域扩张,我们既可以在\mathbb{Q}中加入\sqrt{5},也可以在\mathbb{Q}中加入-\sqrt{5},两者效果一样。

那有什么『伽罗瓦群』不是『自同构群』的例子吗?有的。

还记得我们之前讨论的多项式x^4-4x^2-5吗?它的四个根为\pm i\pm \sqrt{5},所以为了得到这个多项式的根,我们需要把有理数域\mathbb{Q}中加入\sqrt{5}i ,得到扩域\mathbb{Q}(\sqrt{5},i)——为什么总共四个根,我们只加入了两个?别忘了域对加减乘除都封闭,如果域里已经有了\sqrt{5},那么它乘上-1的结果(-\sqrt{5})也在域里,-i也是如此。

当然,这个扩张可以分两步进行:先把\mathbb{Q}扩张成\mathbb{Q}(\sqrt{5}),再把\mathbb{Q}(\sqrt{5})扩张成\mathbb{Q}(\sqrt{5},i).

我们现在考虑后一个扩张,即把\mathbb{Q}(\sqrt{5})扩张成\mathbb{Q}(\sqrt{5},i).

为了知道这个扩张的伽罗瓦群是什么,我们需要先知道\mathbb{Q}(\sqrt{5},i)的自同构群,然后再看其中哪些对称操作保持了\mathbb{Q}(\sqrt{5})不变。

在分析多项式x^4-4x^2-5的时候我们就说过,x^4-4x^2-5可以被任意交换,\pm i也可以被任意交换。所以在域\mathbb{Q}(\sqrt{5},i)中,我们可以同时交换一切a+b\sqrt{5}a-b\sqrt{5},也可以同时交换一切a+bia-bi,也可以把它们都交换。

所以域\mathbb{Q}(\sqrt{5},i)的自同构群也同构于克莱因四元群,包含『恒等操作』、『同时交换一切a+b\sqrt{5}a-b\sqrt{5}』、『同时交换一切a+bia-bi』和『同时交换一切a+bia-bi以及一切a+b\sqrt{5}a-b\sqrt{5}』。

那么这四个对称操作中哪些保持了域\mathbb{Q}(\sqrt{5})不变呢?那就是没有牵涉到\sqrt{5}的操作,即『恒等操作』和『同时交换一切a+bia-bi』,它们构成了这个扩张的伽罗瓦群,同构于S_2群。

其实这很好理解:在域\mathbb{Q}(\sqrt{5},i)中我们有两组数可以交换,而为了保持\mathbb{Q}(\sqrt{5})不变,那么只剩一组数可以交换,所以就相当于是『两个纸杯』的情况,对应的群是S_2群。

所以,尽管\mathbb{Q}(\sqrt{5},i)的自同构群包含四个对称操作,但这个扩张的伽罗瓦群里只包含两个对称操作,它们是严格的子群关系。


===============第六节===============

【伽罗瓦对应(群与域的联系)】

为了对伽罗瓦群有更加形象的认识,我们可以画一个这样的图:

我们用一个圆来表示有理数域\mathbb{Q},而域扩张之后,圆的半径就变大了。那么域扩张的对称操作就可以看成是『保持小圆不变,只转动大圆内小圆外的一层』——就像转动圆形门把手一样。

比如,从E到K的域扩张的对称操作就可以看成是『保持E不变(所以F也不变),转动图中K的最外面一层』。

再比如,从F到K的域扩张的对称操作就可以看成是『保持F不变,转动图中K的外面两层』。

这样一来,我们可以很自然地看出Gal(K/E)Gal(K/F)的子群——在K的对称操作中,保持E不变的操作肯定也保持了F不变,因为F在E里面。

一个小问题:从K到K的域扩张对应的伽罗瓦群是什么?再往下看之前不妨先自己想一想=w=

换句话说,这是一个假扩张,域并没有变大。于是我们就要问自己:K的对称操作中保持K不变的有哪些?

那就只有『恒等操作』啦——那个假对称操作

所以,这个假扩张对应的伽罗瓦群Gal(K/K)只包含这个假对称操作,是一个一阶群。为了跟之前的记号统一起来,我们把这个一阶群记作S_1. 注意,与之前的理由一样,Gal(K/K)自然是Gal(K/E)Gal(K/F)的子群。

为了接下来方便叙述,在这里提一句:如果E是F的扩域,那么我们就说F是E的『子域』。

好的,现在我们可以来看一看伽罗瓦理论的核心思想了。看下图:

左边一列是域,右边一列是群,它们有一一对应关系。箭头的起点是子群或子域,指向更大的群或域。

这个对应关系我们称之为『伽罗瓦对应』。到底是怎样对应的呢?

对于一个域来说,它对应了『使它保持不变的对称操作』构成的群。

对于一个群来说,它对应了『在群中对称操作下保持不变的』的域。

而且上述这两个『转换』是互逆的:一个域对应的群对应的域就是这个域本身;一个群对应的域对应的群也是这个群本身。

箭头相反(即包含关系相反)的原因也很好理解:群越大,包含的对称操作就越多,那么能够保持不变的域就越小;域越大,要让其保持不变就越『难』,那么满足要求的对称操作的集合就越小。

其实这个图我并没有画完整,因为我们还有一种扩张方法:先把\mathbb{Q}扩张成\mathbb{Q}(i),再把\mathbb{Q}(i)扩张成\mathbb{Q}(\sqrt{5},i). 如果我们把\mathbb{Q}(i)这个域记作D,我们就可以把图补全:

伽罗瓦理论的核心思想就是伽罗瓦对应——把域与群联系起来,让我们得以在域与群这两种语言中自由切换。伽罗瓦理论的力量无比强大,能帮我们解决很多问题,包括五次方程求根公式的存在性问题——但是先不谈这些『用处』,这个对应本身已经足够美丽。

由于作为例子,所以这个图还是比较简单的。放上一张稍微复杂一些的图:

在继续往下看之前,先对着这张图发一会儿呆吧=w=


===============第七节===============

【对称性缺失的原因与应对措施、伽罗瓦扩张(正规扩张、可分扩张)、根式扩张对应的群的性质——满足交换律】

接下来我有一个坏消息和一个好消息。

先说坏消息:并不是所有时候伽罗瓦对应的性质都这么好。有时候域和群不是一一对应的,或者说,『从域到群』和『从群到域』这两个转换不是互逆的。

比如有的时候,域扩张的对称操作只有『恒等操作』,哪怕这并不是一个假扩张。也就是说,有时域扩张并不具有我们所期待的对称性。

套用圆形门把手的比方来说就是,这个门把手拧不动——外面一层无法旋转。

在解释坏消息之前,我先把好消息也说了吧:

门把手拧不动的时候,我们总可以加一点润滑油让它能够正常旋转——啊,我是说,当域扩张的『缺少』我们期待的对称性时,我们总可以在域里加一些东西,让它获得本应具有的对称性。

我先给一个缺少对称性的例子:如果我们在\mathbb{Q}中加入\sqrt[3]{2},那么我们就得到了一个同时包含\mathbb{Q}\sqrt[3]{2}的域,记作\mathbb{Q}(\sqrt[3]{2}).

与之前一样,为了知道这个域扩张的伽罗瓦群Gal(\mathbb{Q}(\sqrt[3]{2})/\mathbb{Q}),我们需要先找到\mathbb{Q}(\sqrt[3]{2})的自同构(即对称操作)。

别忘了,域的对称操作会保持所有的等式不变。我们现在写一个等式:(\sqrt[3]{2})^3-2=0.

如果我们保持\mathbb{Q}不变(事实上,自同构一定会保持\mathbb{Q}不变),那么对称操作只可能把\sqrt[3]{2}换成其他的数。为了让这个等式依然成立,换上的数必须得是方程x^3-2=0 的解。由于这是自同构,所以换上的数必须在\mathbb{Q}(\sqrt[3]{2})中。

(换句话说,对于同一个多项式,自同构的效果是根的置换——就像之前换纸杯一样,如果一个纸杯被移走了,原有位置必须得换上某一个纸杯,而移走的纸杯必须被移到某个纸杯之前所在的位置。)

问题来了,所有\mathbb{Q}(\sqrt[3]{2})中的数都是实数,而x^3-2=0的实数解只有\sqrt[3]{2},另外两个解都是复数,不在\mathbb{Q}(\sqrt[3]{2})中。

也就是说,\sqrt[3]{2}无处可去,只能留在原地!由于\mathbb{Q}(\sqrt[3]{2})里每一个数可以被有理数与\sqrt[3]{2}表示出来,所以『有理数和\sqrt[3]{2}动不了』意味着\mathbb{Q}(\sqrt[3]{2})里所有的数都动不了!于是,\mathbb{Q}(\sqrt[3]{2})的自同构群以及这个域扩张的伽罗瓦群都只包含『恒等操作』,并没有什么『真正』的对称操作。

也就是说,门把手转不动:

出现这种情况怎么办呢?答案也很显然:把另外两个根也加进这个域里!

实际上,在这个域里加入另外两个根就等于加入了\omega,所以我们就得到了\mathbb{Q}(\sqrt[3]{2},\omega)这个域。于是,考虑从\mathbb{Q}\mathbb{Q}(\sqrt[3]{2},\omega)的域扩张,我们又有了之前的一一对应:

像这样拥有性质非常好的伽罗瓦对应的域扩张我们称之为『伽罗瓦扩张』。

(伽罗瓦扩张是既正规又可分的域扩张。正规扩张保证了多项式的每个根都被加进了域中,于是我们就有足够多的自同构把每个根送到它所有可能去到的位置;可分扩张保证了(不可约)多项式没有重根,就不会出现『两个根在同一个位置』而使得根可以去到的位置减少的情况。)

(域的特征为零时——有理数域就是这种情况——域扩张一定是可分的,所以伽罗瓦扩张等价于正规扩张。)

上述例子非常具有代表性:从\mathbb{Q}\mathbb{Q}(\sqrt[3]{2},\omega)是一个根式扩张(我们对\mathbb{Q}中的2 开了三次方根),如果根式扩张不是伽罗瓦扩张,那么我们总可以加入单位根使其变成伽罗瓦扩张。在上述例子中,\omega就是一个单位根。

有了单位根的帮忙,『根式扩张得到的域』与『群』之间就有非常好的一一对应关系。于是我们可以放心地用后者来研究前者的对称性了!

接下来我不加证明地给出一个结论:

『通过开n次方根进行的域扩张』和『通过加入单位根进行的域扩张』所对应的群都满足交换律——别忘了,一般的群只满足结合律,所以这两种群相当特殊。

(实际上它们都是有限循环群。这个结论其实很容易证明,但需要使用抽象代数的工具,故在此略去。)

于是,如果五次方程有求根公式,那么其方程的解所在的某个域(记作K)一定可以通过有理数域\mathbb{Q}的『根式扩张』得到,那么我们一定可以把从\mathbb{Q}到K的域扩张分为若干(有限)步,使得每一步扩张的伽罗瓦群都是满足交换律的。

如果K满足上述要求,那么我们就把从\mathbb{Q}到K的域扩张对应的伽罗瓦群称为『可解群』。

套用圆形门把手的比方来说就是,我们可以把只有一层的门把手分成若干(有限)层,每一层都可以转动,并且对应的伽罗瓦群都是满足交换律的。如下图:

所以,为了解决五次方程的问题,我们还需要知道最后一件事:如何把门把手分层——如何把域扩张(在不破坏伽罗瓦对应的情况下)分为若干步。

这,是最能体现伽罗瓦非同寻常的洞察力的地方。


===============第八节===============

【如何把域扩张分为若干步、正规子群、商群】

为了方便说明,我仍然使用门把手的图,但采用最开始的『换标签』的比方。

我们要想把域扩张分为若干步,只能『顺其自然』。什么意思呢?就是说,在哪里分割不是我们决定的,我们只是把原本就存在的分割线画出来。如下图所示:

只有原本就是分开的,我们才能把它分开。要不然即使画了分割线,标签还是会跑出来的。如下图所示:

那问题来了,我们如何知道原本是不是分开的呢?

换句话说,我们如何知道,对于每一种换标签的操作,虚线圆内的标签没有跑出来,外面的标签也没有跑进去呢?

我们来思考一个更加生活化的问题:

节日到了,每位同学都准备一个礼物,学校规定了A、B、C、D四种『全校范围内交换礼物』的方式。我们不知道也不关心这四种方式具体是什么,但我们想知道甲班的礼物是否会被这四种方式换到其他班级的同学手中。在可以对全校同学发号施令的情况下,我们可以怎么做呢?

方法如下:

我们先让全校同学按照A方式交换礼物,接着让『除甲班以外的所有同学』按照某种他们任意选择的方式交换礼物,然后再让全校同学把A方式反过来做。

如果甲班同学的礼物没有被A方式换到班级外的话,那么这样做下来,甲班同学应该拿到的是自己原先准备的礼物——因为第二步对甲班没有影响。

如果A方式把甲班中的小明同学的礼物换到了班级外,那么小明的礼物将会在第二步中再次被转手,所以第三步把A反过来做以后,小明拿到的一定不是自己的礼物。

请仔细思考上面三段话,确认自己明白再继续往下读。

按照这种方法,我们可以依次判断这四种方式是否会把甲班的礼物换到其他班级。问题解决!

回到之前『换标签』的比方,如下图:

图中虚线围成的圆也代表一个域,记为O.

为了判断虚分割线是否原本就存在,我们先对外边两层同时做『换标签』的操作(这个操作在从F到K的域扩张的伽罗瓦群Gal(K/F)里),接着对最外层做『换标签』的操作(这个操作在从O到K的域扩张的伽罗瓦群Gal(K/O)里,Gal(K/O)Gal(K/F)的子群),然后再把第一步反过来做(这个操作也在Gal(K/F)里,因为群内每个操作都有逆操作)。

如果这三个操作的复合操作保持了圆O内的标签不变(也就意味着这个复合操作在Gal(K/O)里),那么就说明虚分割线是存在的,我们就可以按照这条分割线来分割域扩张!

注意,第一个操作和第二个操作Gal(K/F)Gal(K/O)里『任选』的操作——这意味着我们实际上要确保Gal(K/F)Gal(K/O)里的每一个操作都能够通过上述检测!

如果确实如此,那么我们就说Gal(K/O)Gal(K/F)的『正规子群』,记作Gal(K/O)\lhd Gal(K/F) .

而按照虚分割线分开之后,我们就得到了一个新的伽罗瓦群Gal(O/F),它是Gal(K/F)Gal(K/O)的『商群』,记作Gal(O/F)\cong Gal(K/F)/Gal(K/O).

所有准备工作都已完毕,现在是时候给出最后一击了!


===============第九节===============

【正规子群链、可解群】

回顾一下之前所说的:

如果五次方程有求根公式,那么其方程的解所在的某个域(记作K)一定可以通过有理数域\mathbb{Q}的『根式扩张』得到,那么我们一定可以把从\mathbb{Q}到K的域扩张分为若干(有限)步,使得每一步扩张的伽罗瓦群都是满足交换律的。

现在,我们可以把这段话改为:

如果五次方程有求根公式,那么我们一定可以找到一条『正规子群链』:

G_1=S_1\lhd G_2\lhd G_3\lhd \cdots\lhd G_n,

其中G_1是一阶群,只包含『恒等操作』,而G_n是从\mathbb{Q}到K的域扩张所对应的伽罗瓦群;同时,每一个商群G_i/G_{i-1}都满足交换律。

满足上述条件的G_n就是『可解群』。

那么从\mathbb{Q}到K的域扩张所对应的伽罗瓦群是什么呢?

根据代数基本定理,我们知道五次方程有五个根。一般说来,我们可以任意交换它们——还记得『五个纸杯』的例子吗——所以从\mathbb{Q}到K的域扩张所对应的伽罗瓦群是S_5.

S_5的正规子群除了一阶群和它本身以外,只有A_5(这是S_5中的所有偶置换构成的群,解释见下一段,跳过解释并不影响阅读),所以我们顶多得到S_1\lhd A_5 \lhd S_5这样一条正规子群链。

(每一个置换都可以拆成若干个『两两交换』的复合,其中能被拆成偶数个『两两交换』的复合的置换就被称为『偶置换』。奇置换同理。显然偶置换与偶置换的复合仍是偶置换——因为偶数与偶数的和仍然是偶数——恒等操作是偶置换,并且偶置换的逆置换也是偶置换,所以一个置换群中的所有偶置换构成群A_5表示S_5中的所有偶置换构成的群。前者是后者的正规子群,因为对于任何一个置换\sigma来说,\sigma\sigma的逆置换奇偶性一样,于是『先做\sigma,再做偶置换,最后做\sigma的逆置换』仍是一个偶置换。而A_5的正规子群只有一阶群和它本身,所以被称为『单群』。不严谨地说,『单群』是一个与『可解群』相对的概念。有限可解单群只有素数阶循环群。)

S_1是一阶群。正如『任何数除以一等于其本身』,任何群与一阶群的商群也等于其本身,所以A_5/S_1\cong A_5 ,而A_5不满足交换律。(就算不知道A_5到底是什么,我们也应该知道『一般说来,群都不满足交换律』,所以这没什么可惊讶的。)

所以五次方程没有『加减乘除』和『开方』的求根公式。

Q. E. D.


===============关于伽罗瓦===============

不算构思的时间(更不谈学习这些知识的时间),这篇回答的累计写作时间大概是五十个小时。我知道,可能这篇回答写完后并不会有多少人看,看完之后很可能也收获甚微,但我还是想把自己的一些思考与理解写出来,万一对谁有一点点帮助呢?

愿意花这么多时间写这篇文章,也是出于我对伽罗瓦的尊敬、崇拜和感激。在我曾经无比痛苦和绝望的时候,伽罗瓦和他的理论给了我继续前行的动力。

伽罗瓦命途多舛:父亲被人害死、考巴黎理工大学两度失败、提交的论文两度石沉大海、被巴黎高师开除、两度入狱、自杀未遂,最终在二十岁时离开了人世,死于决斗——为了自己的心上人。

他在遗书中对革命党人与友人说:『我最终未能为自己的国家死去,希望爱国人士与我的朋友们不要为此责怪我……我将成为一桩风流韵事的受害者。啊!我为什么要死于这种琐碎而可怜的事呢……』

在决斗的前一晚,伽罗瓦匆匆写下了自己脑海中的数学思想,并且不断写着『我没有时间了』。

他把这些手稿夹在交给朋友Chevalier的信中,并在信的末尾嘱咐Chevalier:『请把我的手稿交给高斯和雅各比,听一听他们对这些理论的重要性(而非正确性)作何评价。我希望,未来的某一天,我这些杂乱的手稿会对世人有所帮助。

后人为了纪念伽罗瓦,将他开创的数学理论以他的名字命名。如今,伽罗瓦理论早已成为现代数学不可分割的一部分。伽罗瓦短暂的一生,犹如漆黑夜空中一颗耀眼的流星,照亮了数学家们前进的道路,也为世界带来了一份无与伦比的美丽。


===============其他===============

扩展阅读及参考资料:

Ian Stewart. Galois Theory

Nathan Carter. Visual Group Theory

Edward Frenkel. Love and Math

Thomas Hungerford. Algebra

Tom Leinster. Basic Category Theory

Galois Talk: youtube.com/playlist?

Introduction to Galois Theory: youtube.com/playlist?

以及Friedman教授的抽代课笔记

最后,分享一个我个人非常喜欢的视频,是我在YouTube上无意中看到的,我将它转到了优酷上。这个视频以x^3-2=0这个方程为例子,动态地展示了『伽罗瓦对应』。(还记得前文中的几张图吗?想知道它们『动起来』是什么样子吗=w=)

Visualize Galois Theory—在线播放—优酷网,视频高清在线观看 http://v.youku.com/v_show/id_XMTUwMzc0MzMzNg==.html?spm=a2hzp.8244740.userfeed.5!3~5~5~5!3~5~A

原视频地址:youtube.com/watch?

那么就这样=w=

为什么?