为何从一元五次方程开始就没有由有限次加、减、乘、除、开方运算构成的求根公式了?

【相关问题】能否通过列举一些代数式、方程加以分析、说明,直解释阿贝尔定理? - 数学大家都知道,一元一次、二次、三次、四次方程都有根式解,从五次方程开始就没有一般解了。然而这个情况为什么是五次方程开始出现?为什么这个数字是五?为什么不是六或者是七?为什么恰好是五次方程才开始没有根式解?难道说当多项式的次数达到五的时候,其形态会有根本性的改变?―――另外,就是现行初中数学教材关于一元二次方程的章节中…
关注者
2522
被浏览
285365

在回答问题之前,我想先来解释一下这个问题到底是什么意思。如题目所说,系数为有理数的五次(及以上)方程没有加减乘除开方的求根公式。

不要理解为『有理数系数五次方程没有公式解』。我们有办法使用一些超越函数来构造出五次方程的公式解。这里说的是,只用『加减乘除』和『开方(即使用根号)』给不出五次方程的求根公式。

也不要理解为『对于每一个有理数系数的五次方程,都无法只用加减乘除和开方来表示出它的根』。对于某些五次方程,我们完全可以找到根式解,比如x^5-2=0 的解(之一)是\sqrt[5]{2} . 这里说的是,我们没法给出一个只使用加减乘除和开方的通用公式,使其可以给出任何一个有理数系数的五次方程的解——就像大家熟知的二次方程求根公式那样。

所以,理论上说,我们其实只需要找到一个没有根式解的有理数系数的五次方程,就可以说明五次方程没有只使用加减乘除和开方的求根公式了。这样的例子当然是有的,比如x^5-6x+3=0 就没有根式解。(当然,要说明其为什么没有根式解并不是一件简单的事情。)

其实,这个现象没有看上去那么神奇。这只是说明,『加减乘除』和『开方』的运算组合有其局限性罢了。如果我们不允许开方,只允许用加减乘除,那么我们只能给出一次方程的求根公式,对于二次方程我们便束手无策了——这就是『加减乘除』的局限性。通过引入『开方』运算,我们可以给出四次方程的一般解,这已经是一大进步啦=w= 所以,如果说『开方』运算如加减乘除一样,也有其局限性,这并不是一件那么让人意外的事情。

然而,这还是有一点点神奇的。神奇之处在于,为什么恰好是五次呢?为什么不是四次或者六次?嗯,这便是这篇回答想要讨论的问题。

大致思路是这样的:为了找到方程的解(在本文的语境下是多项式的根),我们需要进行域扩张,因为方程的解往往不在有理数域中。同时,多项式的根具有某种对称性。我们可以通过群的概念来描述对称性,而多项式的根的对称性可以转化为域扩张的对称性,后者可以被『伽罗瓦群』来描述。『加减乘除』这四种运算无法进行域扩张,而通过『开方』进行的域扩张(根式扩张)具有某种特殊的对称性——其对应的伽罗瓦群是『可解的』。而通常情况下,五次方程的解(即五次多项式的根)对应的域扩张的伽罗瓦群是『不可解的』,所以仅用『加减乘除』和『开方』不可能让我们从有理数域扩张到包含五次方程解的域。

好吧,我估计不少人都会觉得上面一段话『每个字都能看懂』……我会试图在回答里慢慢解释上述这些概念。如之前一样,这篇回答为了可读性,会牺牲一些严谨性。

一般说来,要想真正弄清楚这个问题,需要学习两个学期的抽象代数,而且对于大多数人来说,抽象代数也不是一上来毫无基础就可以学的。所以,想通过一篇简短(跟教材比起来)的回答来把这个问题彻底解释清楚,是根本不可能的事情。

这篇回答最多只能让没学过相关数学知识的读者大致了解要解决这个问题『大概是怎样做的』或『从什么角度入手』,所以不要对本文抱有太高的期望。(如果只靠阅读知乎回答就可以学数学,那我们还要大学干什么呢?)对于将要学习或正在学习相关数学知识的读者,我不敢保证这篇回答会对你们在『直观理解』上有帮助。但如果有一点点帮助的话,我会很开心的=w=

以下是一些阅读建议:

1. 不要试图一次性读完全文(尤其对于没有学过相关知识的同学来说)。我把全文分了若干节,每次读一到两节就可以了,不要求快,尤其是在读数学时。

2. 我在每一节的开头写出了『读完这一节之后你应该知道哪些概念』。再阅读下一节之前,先确保自己对这些概念有一定的认识。

3. 本文以介绍『对称与群的关系』开始,这一部分非常重要。囫囵吞枣可能会导致之后的阅读寸步难行。

4. 在读本文之前,最好先读:

群论研究结构,「结构」一词是什么意思?跟数学有什么关系? - 匡世珉的回答 - 知乎

如何给高中生解释群论? - 匡世珉的回答 - 知乎

为什么尺规不能三等分一个任意角? - 匡世珉的回答 - 知乎

以上三篇回答有助于更好地理解本文。为了控制篇幅,以上三篇回答中详细介绍过的概念,本文可能就不会花过多笔墨了。

5. 再强调一遍,这篇回答最多只能让没学过相关数学知识的读者大致了解要解决这个问题『大概是怎样做的』或『从什么角度入手』,所以不要对本文抱有太高的期望。在本文最后我会列出一些教材与资料,对于想真正弄清楚这个问题的同学们来说,那些才是你们应该认真看、认真读的东西。

这篇回答献给教了我一学年抽象代数的Robert D. Friedman教授。

大二上学期的最后一次抽代考试,我在答题纸的最后写下了:

Thank you for your great lectures. They have made mathematics as beautiful as it should be.

好的,正文要开始了=w=


===============第一节===============

【对称、对称操作、对称操作的四条性质】

首先我们来看两个图形:

左边的是圆,右边的是正方形,他们都是『对称图形』,没错吧?

请听题:这两个图形哪一个『更对称』呢?

为了回答这个问题,我们必须要知道到底什么是『对称』。当我们用『对称』来形容一个图形的时候,我们其实是在说这个图形在某些操作下保持不变——这样的操作我们称之为『对称操作』。

对于正方形来说,『(顺或逆时针)旋转90度』就是一个对称操作,而『旋转45度』则不是。我们可以这么理解:如果你在我闭上眼睛的时候悄悄地把正方形(绕中点)旋转90度,我是不会发现你做了这个操作的。但如果你把正方形转了45度,我肯定就会发现了。

那么正方形的对称操作有哪些呢?一个可能的答案是『所有角度为90的倍数的旋转(包括旋转0度)』。然而,由于旋转360度等于没有转,所以其对称操作其实只有『(顺时针)旋转0度、90度、180度、270度』这四种。

如果允许翻折的话,我们还可以得到另外四种对称操作,即『水平、竖直、沿对角线翻折』。

那么圆的对称操作有哪些呢?

我们发现,任何角度的旋转都是对称操作。如果允许翻折的话,沿任何一条过圆心的直线翻折也都是对称操作。

所以,圆具有无穷多种对称操作,而正方形只有有限多种对称操作(四或八种,取决于是否允许翻折)。如果以对称操作的数量为标准的话,我们可以说『圆比正方形更对称』。

现在我们来仔细研究一下『对称操作』。

正如之前所说的那样,我没有办法确定你是否在我闭上眼睛期间做了某种『对称操作』。我们可以说,对称操作就是那些可以通过『闭眼测试』的操作。(啊,这个词是我自己造的,只是为了方便叙述与理解=w=)

注意,这样意味着我们只关心『操作开始前的状态』和『操作结束后的状态』,至于中间到底做了什么我们并不关心。比如,一次『先逆时针旋转45度再顺时针旋转135度』的操作与一次『顺时针旋转90度』的操作并无区别,都是同一种对称操作。

那么对称操作(可以通过『闭眼测试』的操作)具有哪些性质呢?

第一,如果我们把两个对称操作连起来做,看成一个『复合操作』,那么这个新得到的『复合操作』也是一个对称操作。

不妨这么想:如果操作A和B都能分别通过『闭眼测试』,那么『先做A再做B』也应该能通过『闭眼测试』。

举个例子,『先顺时针旋转90度,再顺时针旋转180度』也是一个对称操作,等价于『顺时针旋转270度』。

两个对称操作的复合可以让我们得到新的对称操作,就像两个整数相加可以得到新的整数一样,所以我们可以把对称操作的『复合』看成是一种运算。(这让我想到Friedman教授在第一节抽代课上说的:Basically, you combine two things and get a third. That’s algebra.)

第二,对称操作的复合运算满足『结合律』。

这几乎是一句废话。如果A、B、C是三个对称操作,那么结合律就可以描述为『先「做A然后做B」再做C』与『先做A再「做B然后做C」』的效果一样——这显然效果一样,因为两次都是把A、B、C按顺序做,完全没有区别。

注意,这是结合律,不是交换律,对称操作的顺序没有改变。(复合运算不一定满足交换律,考虑正方形『顺时针旋转90度』与『竖直翻折』这两个操作。)

如果觉得结合律过于显然,那么可以暂时不去管它。(强调结合律其实是为了把对称操作进行抽象,而既然我们现在就在讨论对称操作,所以结合律就是自带属性。)

第三,『什么都不做』也是一个对称操作。

额,我知道这个看起来有点奇怪,『什么都不做』为什么也算是一个操作呢?不过『什么都不做』也可以通过『闭眼测试』呀:我没办法知道我闭上眼睛之后你是做了『什么都不做』还是什么都没做……

好吧,如果觉得这不能说服你,那么让我们来想一想之前的第一条性质:对称操作的复合还是对称操作。我们把『顺时针旋转90度』与『顺时针旋转270度』复合起来,得到的就是『什么都不做』。为了让第一个性质成立,就让我们把『什么都不做』也当成对称操作吧!

好吧,这简直是个假对称操作。

为了显得稍微正经一些,我们把『什么都不做』的操作称为『恒等操作』。

第四,每一个对称操作的『逆操作』也是对称操作。

这不难理解:如果一个操作可以通过闭眼测试,那么把它反过来做,也可以通过闭眼测试。比如『顺时针旋转90度』是对称操作,那么『逆时针旋转90度』即『顺时针旋转270度』也是对称操作。

等等,逆操作就是『反过来做』的操作?那什么叫『反过来做』?

好吧,如果觉得这个说法随意了一些,那我这么说:把一个对称操作与其『逆操作』复合起来(无论先做哪一个),得到的新对称操作都是『恒等操作』。

好的,关于『对称操作』的性质,我们知道这四个就足够了。现在我们可以说:『群』就是某个图形(或对象)的所有对称操作的集合。


===============第二节===============

【群、群与对称的关系、群的例子(很重要,后文会用到)、群同构】

是的,就是这么简单。给定一个图形(或对象),其所有对称操作构成的集合就是一个群。注意到集合自然地带有一个『复合』运算。(反过来说,对于任何一个群,它都是由某个图形(或对象)的所有对称操作构成的。)

还是用例子来说明吧:假设桌上有五个完全一样的纸杯排成一行,把每个纸杯看成一个点(如下图),那么把这五个纸杯看成一个整体,其对应的群是什么?

给个提示:想想看之前所说的『闭眼测试』。既然纸杯完全一样,那么在闭眼时交换任意两个纸杯,我都发现不了。

没错,所以这五个纸杯的每一种『重新排列』(即『置换』)都是一种对称操作。注意,对称操作是『置换』的动作,而不是置换之后的状态。

于是,对称操作的数量就是五个纸杯不同排列的数量,也就是120种。这五个纸杯所对应的群就由『五个对象的全部置换方式』构成,记作S_5 ,是一个120阶的群(阶即元素的个数)。

请听题:如果把五个纸杯改为四个纸杯呢(如下图)?对应的群是什么?

好吧,这题过于简单了。对应的群由『四个对象的全部置换方式』构成,记作S_4 ,是一个24阶的群。

下一题有点难度:如果纸杯A和B完全一样,纸杯C和D完全一样,而纸杯A和C不一样(如下图),这回对应的群是什么?

回忆一下『闭眼测试』,我们发现,『交换A和C』是不行的,因为这两个纸杯不一样,交换了就会被发现。我们只能交换A和B,或者交换C和D,所以对应的群是什么?

答案是:一个由『恒等操作』、『交换A和B』、『交换C和D』、『同时交换A和B、C和D』这四个对称操作构成的四阶群,记作V,或者称为『克莱因四元群』。

稍微想一下我们会发现,如果把四个点分成黑色与红色两部分,那么每一部分分别对应一个S_2的群(与之前的记号一致),所以我们可以把V群看成是由两个S_2群『组合』在一起得到的——我们说V是两个S_2的『直积』,记作V\cong S_2\times S_2 ——不过这暂时不重要。

提醒一下,别忘了群还带有『复合』运算。比如在这个例子中,先做『交换A和B』再做『同时交换A和B、C和D』,就得到了『交换C和D』。

讲了这么半天,这些东西跟五次方程到底有什么关系啊?

别急,再举一个例子我们就讲方程(多项式)。

一个长方形,在允许翻折的情况下,对应的群是什么?

答案是:一个由『恒等操作』、『水平翻折』、『竖直翻折』、『旋转180度』这四个对称操作构成的四阶群。复合运算关系如下图:

重点来了:这个群跟之前所说的V群具有同样的结构

什么意思?

如果我们把V群中的元素『恒等操作』、『交换A和B』、『交换C和D』、『同时交换A和B、C和D』分别换成『恒等操作』、『水平翻折』、『竖直翻折』、『旋转180度』,就会发现它们的复合运算完全一致。

前一个例子中,我们说过,先做『交换A和B』再做『同时交换A和B、C和D』,就得到了『交换C和D』。按照上述规则,这个句子被我们换成:

先做『水平翻折』再做『旋转180度』,就得到了『竖直翻折』。

实际上确是如此!

再打个比方,如果我现在造出一个机器,机器上有四个按钮,分别贴着『恒等操作』、『交换A和B』、『交换C和D』、『同时交换A和B、C和D』这四个标签。依次按下任意两个按钮,其复合运算对应的按钮就会亮起。所以这相当于是一个『V群复合运算计算器』。

此时,如果我把这四个标签换成『恒等操作』、『水平翻折』、『竖直翻折』、『旋转180度』,而丝毫不改动机器本身的电路,我们会发现这个机器依然可以正确计算这四个操作的复合运算!

所以,我们说这两个群是『同构』的,只是元素的名字不同罢了。如果用函数f来表示『换标签』,即标签a被换成了f(a),并用*来表示复合运算,那么同构满足什么样的条件呢?

如果我们用ab来表示ab复合的结果,那么我们就有a*b=ab,而『换标签』对运算完全不影响,所以就有f(a)*f(b)=f(ab),而通常我们会把星号省略,写成f(a)f(b)=f(ab);同时,这里『换标签』是一一对应的,所以我们也要求f是一一对应的,即不能有两个不同的按钮换成了同样的标签。于是,如果一个一一对应的函数f满足f(a)f(b)=f(ab)的等式,我们就说f是一个(群)同构。而f(a)f(b)=f(ab)这个等式的意义就是『函数f保持运算结构』。

(在这里提一下:按照一般的严格定义,『群』是带有一个运算的集合,并满足封闭性、结合律、存在单位元、存在逆元这四个条件,这正是我们之前总结的『对称操作』的性质。事实上,从范畴的角度来看,群可以定义为由一个元素构成的范畴,其态射为群同构,这正是我在本文中所说的定义。Leinster 的Basic Category Theory 的例子1.1.8(c)对此有精彩的描述。)


===============第三节===============

【多项式的根的对称性】

好的,我们来谈方程与多项式吧!

由于多项式的根就是使其等于零的x的值,也就是方程的解,所以在下文中我将不加区分地使用『方程的解』和『多项式的根』这两个表述。

我在开头说过,方程的解具有某种对称性。这到底是什么意思呢?举个例子,我们来看多项式x^4-4x^2-5,因式分解为(x^2+1)(x^2-5),它的四个根为:\pm i, \pm \sqrt{5} .

我们写出随便写几个包含这四个根的多项式形式的(以下省略)等式,比如i^2+1=0, \sqrt{5}+(-\sqrt{5})=0, i(-\sqrt{5})-(-i)\sqrt{5}=0.

现在,把这些数字都当成标签,交换\pm i的标签,我们发现等式依然成立:比如之前的i^2+1=0变成了(-i)^2+1=0,而这个等式是对的。

换句话说,如果我告诉你我用ab来表示\pm i,写出一堆包含ab的等式,你永远不可能知道到底ab哪个是i哪个是-i,因为无论是哪种情况,等式都成立。所以我们说,i-i在代数上是无法区分的,因为它们满足的等式完全一样——它们的标签可以随意交换

还记得什么叫『对称』吗?对称就是在某些操作下保持不变。而在这里,交换\pm i的标签,所有的等式都没有发生变化,这就是多项式的根的对称性

同样地,交换\pm \sqrt{5}的标签,或者同时交换\pm i\pm \sqrt{5}的标签,等式仍然保持不变。

于是,这个多项式的根所对应的群是什么呢?

答案是:一个由『恒等操作』、『交换\pm i的标签』、『交换\pm \sqrt{5}的标签』、『同时交换\pm i\pm \sqrt{5}的标签』这四个对称操作构成的四阶群。

也许你已经意识到了,这个群同构与V所以多项式x^4-4x^2-5对应的群正是『克莱因四元群』。

这真的是很神奇的一件事情。如果不借助群来研究对称性,我们很难想到这个多项式竟然会跟长方形有内在的联系!

为了更方便地研究多项式的根的对称性,我们需要引进一个新的概念:


===============第四节===============

【域、域扩张、域的对称性、自同构群】

所谓『域』,就是一个对加、减、乘、除都封闭的集合。换句话说,对于域中的数字,无论你怎么用加减乘除(当然,零不能做除数)去蹂躏它们,它们依然还是在这个域里。

比如,全体有理数构成有理数域\mathbb{Q},因为任意两个有理数做加减乘除之后结果还是有理数。而全体整数则不能构成域,因为两个整数相除不一定得到整数。

如果只能使用加、减、乘、除,那么我们无法给出(有理数系数,以下省略)二次方程的求根公式。为什么呢?从『域』的角度看,我们就可以给出答案了:因为二次方程的解却可能不在有理数域里(比如x^2-5=0),而无论在有理数域中怎么做加减乘除,我们仍然只能得到有理数。

这样看来,『域』就如同如来佛的手掌心——如果加减乘除是你全部的招数,那你永远无法离开这个『域』。

而这个时候,『开方』就是一个格外强大的技能:它能让我们离开原来的域,进行『域扩张』。

比如,在有理数域里对5开二次方根,我们就得到了\sqrt{5},而\sqrt{5}不是有理数——不在有理数域中。这时,我们再借助加减乘除,就可以得到一个同时包含有理数和\sqrt{5}的新的域,记作\mathbb{Q}(\sqrt{5}),而x^2-5=0的解正是在这个新的域里。所以,通过『开方』的操作,我们就可以得到x^2-5=0的解。

所以,要想给出一个五次方程的解,我们希望能通过『开方』不断地扩张我们的域,直到我们的域中包含该方程的解。然而伽罗瓦告诉我们,这往往是做不到的。

还记得之前我们说的多项式的根的对称性吗?我们之前考察了x^4-4x^2-5=(x^2+1)(x^2-5)的四个根的对称性——其对应的群正是『克莱因四元群』。这个多项式还是复杂了些,因为它可以被拆成两个次数更低的多项式的乘积——我们称其为『可约』多项式。

我们现在来单独考察它的一个因子x^2-5——它作为有理数系数多项式是『不可约』的,因为它没有办法再被拆成两个次数更低的多项式的乘积,除非引进\sqrt{5}

如前文所说,x^2-5的根是\pm \sqrt{5},均不在有理数域中。同时,这两根具有对称性:我们可以随意交换两根,它们满足的等式不会改变。

重点来了:如果我们把这两个根放在它们所在的域\mathbb{Q}(\sqrt{5})中考虑,那么根的对称性就转化为域的对称性——我们可以同时交换一切a+b\sqrt{5}a-b\sqrt{5},而域\mathbb{Q}(\sqrt{5})中所有的等式都不会改变!

举个例子:我们知道(2+\sqrt{5})(3-\sqrt{5})=1+\sqrt{5},现在我们交换一切a+b\sqrt{5}a-b\sqrt{5},得到(2-\sqrt{5})(3+\sqrt{5})=1-\sqrt{5},而这个等式依然是成立的!

也许这有些难以置信,但事实就是如此。你可以自己尝试更多的例子=w=

套用之前的比方,如果我现在造出一个机器,它有无穷多个按钮,对应了域\mathbb{Q}(\sqrt{5})的每一个数。它可以正确地计算域\mathbb{Q}(\sqrt{5})中的加减乘除(如之前一样,以亮灯的形式)。如果我同时交换一切a+b\sqrt{5}a-b\sqrt{5}的按钮标签,这个机器依然能够正确的计算加减乘除!

所以,如之前一样,这个『交换标签』的操作是域\mathbb{Q}(\sqrt{5})的『同构』。不仅如此,它还是一个『自同构』,因为它没有牵涉到任何『新的标签』,仅仅是把原有的标签换了位置

其实,我们在中学数学里早已接触过域的自同构了。

不知大家是否还记得,我们在解二次方程时,复数解一定是成对出现的——如果其中的一个解是复数,那么另一个解也是复数,并且这两个解一定共轭。

比如,x^2-2x+5=0的解是1+2i1-2i,它们是共轭的。

这是为什么呢?因为全体复数构成复数域\mathbb{C},其中的每个元素都可以写成a+bi的形式,而『同时交换一切a+bia-bi』是复数域\mathbb{C}的自同构。

我们把思路理一下。如果我们已经知道『同时交换一切a+bia-bi』是复数域\mathbb{C}的自同构,那么对于任何一个等式,比如(1+2i)^2-2(1+2i)+5=0,我们可以放心地交换1+2i1-2i,得到(1-2i)^2-2(1-2i)+5=0;前者意味着1+2ix^2-2x+5=0的解,后者意味着1-2ix^2-2x+5=0的解。

所以,二次多项式的复根一定是成对出现的。(实际上,我们完全不用局限于二次——任何次数的多项式的复根都是成对出现的,理由正是『交换共轭对』是复数域的自同构。)

接下来的一句话很重要!

『自同构』就是一个域的『对称操作』。

(其实我之前讲了这么多,就是为了说出这句话。不妨停下来想一想,确定自己理解这句话之后再继续往下读。)

所以,一个域的所有自同构构成了一个群——我们称之为『自同构群』。

那么域\mathbb{Q}(\sqrt{5})的自同构群是什么呢?

『同时交换一切a+b\sqrt{5}a-b\sqrt{5}』是一个对称操作(自同构),并且『恒等操作』也是一个对称操作(自同构),除此之外没有更多的对称操作(自同构)了。所以,其对称群就是S_2——还记得这个符号吗?回想一下排列纸杯的例子吧。

(其实这就相当于是在置换\pm \sqrt{5},因为它们的变动完全决定了域中每一个数的变动。)

为了避免大家迷失在众多的数学概念中,我们来简短地回顾一下:

我们的目的是寻找五次方程的根式解。由于五次方程的解往往不在有理数域中,所以我们只能寄希望于通过『开方』不断地扩张数域,直到数域包含五次方程的解。同时,方程的解具有对称性,并可以转化为所在的域的对称性,可以用『自同构群』来描述。

如果我们能说明『五次方程的解所在的域』具有的对称性与『可以通过开方扩张的数域』具有不同的对称性,那么就意味着『五次方程的解所在的域』不是『可以通过开方扩张的数域』,也就意味着五次方程没有求根公式。

所以,为了说明这一点,我们不仅需要研究『域』的对称性,还需要研究『域扩张』的对称性。域的对称性可以用『自同构群』来描述,而域扩张的对称性则可以用『伽罗瓦群』来描述。

有了之前这么多的铺垫,『伽罗瓦群』就不难理解了——它只是『自同构群』的『子群』罢了


===============第五节===============

【子群、域扩张的对称性、伽罗瓦群】

子群』的概念与『子集』类似,很简单。H是G的子群就意味着G包含了H中的所有对称操作。也就是说,H是G的『一部分』——当然,H也得是一个群

举个例子,回到最开始的正方形。如果不允许翻折,那么正方形具有四种对称操作,它们构成的群记作C_4;如果允许翻折,那么正方形据有八种对称操作,它们构成的群记作D_4. 显然,每一个C_4里的对称操作都在D_4里,所以C_4D_4的子群,记作C_4 \leq D_4 .

现在我们考虑从有理数域\mathbb{Q}到域\mathbb{Q}(\sqrt{5})的域扩张。

我们已经知道域\mathbb{Q}(\sqrt{5})的对称操作是『恒等操作』和『同时交换一切a+b\sqrt{5}a-b\sqrt{5}』,它们构成了\mathbb{Q}(\sqrt{5})的自同构群,同构于S_2群。

我们现在规定,这个域扩张的对称操作是:\mathbb{Q}(\sqrt{5})的自同构群中保持\mathbb{Q}不变的对称操作

域扩张的对称操作构成的群被称为『伽罗瓦群』。按照这个定义,『伽罗瓦群』自然是『自同构群』的子群。

更一般地来说,如果我们把域F扩张成域E,那么这个域扩张的对称操作就是E的自同构群中保持F不变的对称操作,它们构成了这个扩张的『伽罗瓦群』,记作Gal(E/F).

本例中,伽罗瓦群记作Gal(\mathbb{Q}(\sqrt{5})/\mathbb{Q}) .

那么这个伽罗瓦群到底包含了什么对称操作呢?

首先,『恒等操作』保持了\mathbb{Q}(\sqrt{5})不变,自然就保持了\mathbb{Q}不变——因为\mathbb{Q}(\sqrt{5})\mathbb{Q}的扩域,\mathbb{Q}\mathbb{Q}(\sqrt{5})的一部分。

接着我们发现,『同时交换一切a+b\sqrt{5}a-b\sqrt{5}』也保持了\mathbb{Q}不变——这个操作只影响到那些带有\sqrt{5}的数,对有理数完全没有影响。

所以,在这个例子里,『伽罗瓦群』不仅是『自同构群』的子群,而且它们完全一样!所以Gal(\mathbb{Q}(\sqrt{5})/\mathbb{Q})\cong S_2.

(为什么我们要这么定义域扩张的对称操作呢?因为在这个例子中,要想完成有理数域\mathbb{Q}到域\mathbb{Q}(\sqrt{5})的域扩张,我们既可以在\mathbb{Q}中加入\sqrt{5},也可以在\mathbb{Q}中加入-\sqrt{5},两者效果一样。

那有什么『伽罗瓦群』不是『自同构群』的例子吗?有的。

还记得我们之前讨论的多项式x^4-4x^2-5吗?它的四个根为\pm i\pm \sqrt{5},所以为了得到这个多项式的根,我们需要把有理数域\mathbb{Q}中加入\sqrt{5}i ,得到扩域\mathbb{Q}(\sqrt{5},i)——为什么总共四个根,我们只加入了两个?别忘了域对加减乘除都封闭,如果域里已经有了\sqrt{5},那么它乘上-1的结果(-\sqrt{5})也在域里,-i也是如此。

当然,这个扩张可以分两步进行:先把\mathbb{Q}扩张成\mathbb{Q}(\sqrt{5}),再把\mathbb{Q}(\sqrt{5})扩张成\mathbb{Q}(\sqrt{5},i).

我们现在考虑后一个扩张,即把\mathbb{Q}(\sqrt{5})扩张成\mathbb{Q}(\sqrt{5},i).

为了知道这个扩张的伽罗瓦群是什么,我们需要先知道\mathbb{Q}(\sqrt{5},i)的自同构群,然后再看其中哪些对称操作保持了\mathbb{Q}(\sqrt{5})不变。

在分析多项式x^4-4x^2-5的时候我们就说过, \pm\sqrt{5}可以被任意交换,\pm i也可以被任意交换。所以在域\mathbb{Q}(\sqrt{5},i)中,我们可以同时交换一切a+b\sqrt{5}a-b\sqrt{5},也可以同时交换一切a+bia-bi,也可以把它们都交换。

所以域\mathbb{Q}(\sqrt{5},i)的自同构群也同构于克莱因四元群,包含『恒等操作』、『同时交换一切a+b\sqrt{5}a-b\sqrt{5}』、『同时交换一切a+bia-bi』和『同时交换一切a+bia-bi以及一切a+b\sqrt{5}a-b\sqrt{5}』。

那么这四个对称操作中哪些保持了域\mathbb{Q}(\sqrt{5})不变呢?那就是没有牵涉到\sqrt{5}的操作,即『恒等操作』和『同时交换一切a+bia-bi』,它们构成了这个扩张的伽罗瓦群,同构于S_2群。

其实这很好理解:在域\mathbb{Q}(\sqrt{5},i)中我们有两组数可以交换,而为了保持\mathbb{Q}(\sqrt{5})不变,那么只剩一组数可以交换,所以就相当于是『两个纸杯』的情况,对应的群是S_2群。

所以,尽管\mathbb{Q}(\sqrt{5},i)的自同构群包含四个对称操作,但这个扩张的伽罗瓦群里只包含两个对称操作,它们是严格的子群关系。


===============第六节===============

【伽罗瓦对应(群与域的联系)】

为了对伽罗瓦群有更加形象的认识,我们可以画一个这样的图:

我们用一个圆来表示有理数域\mathbb{Q},而域扩张之后,圆的半径就变大了。那么域扩张的对称操作就可以看成是『保持小圆不变,只转动大圆内小圆外的一层』——就像转动圆形门把手一样。

比如,从E到K的域扩张的对称操作就可以看成是『保持E不变(所以F也不变),转动图中K的最外面一层』。

再比如,从F到K的域扩张的对称操作就可以看成是『保持F不变,转动图中K的外面两层』。

这样一来,我们可以很自然地看出Gal(K/E)Gal(K/F)的子群——在K的对称操作中,保持E不变的操作肯定也保持了F不变,因为F在E里面。

一个小问题:从K到K的域扩张对应的伽罗瓦群是什么?再往下看之前不妨先自己想一想=w=

换句话说,这是一个假扩张,域并没有变大。于是我们就要问自己:K的对称操作中保持K不变的有哪些?

那就只有『恒等操作』啦——那个假对称操作

所以,这个假扩张对应的伽罗瓦群Gal(K/K)只包含这个假对称操作,是一个一阶群。为了跟之前的记号统一起来,我们把这个一阶群记作S_1. 注意,与之前的理由一样,Gal(K/K)自然是Gal(K/E)Gal(K/F)的子群。

为了接下来方便叙述,在这里提一句:如果E是F的扩域,那么我们就说F是E的『子域』。

好的,现在我们可以来看一看伽罗瓦理论的核心思想了。看下图:

左边一列是域,右边一列是群,它们有一一对应关系。箭头的起点是子群或子域,指向更大的群或域。

这个对应关系我们称之为『伽罗瓦对应』。到底是怎样对应的呢?

对于一个域来说,它对应了『使它保持不变的对称操作』构成的群。

对于一个群来说,它对应了『在群中对称操作下保持不变的』的域。

而且上述这两个『转换』是互逆的:一个域对应的群对应的域就是这个域本身;一个群对应的域对应的群也是这个群本身。

箭头相反(即包含关系相反)的原因也很好理解:群越大,包含的对称操作就越多,那么能够保持不变的域就越小;域越大,要让其保持不变就越『难』,那么满足要求的对称操作的集合就越小。

其实这个图我并没有画完整,因为我们还有一种扩张方法:先把\mathbb{Q}扩张成\mathbb{Q}(i),再把\mathbb{Q}(i)扩张成\mathbb{Q}(\sqrt{5},i). 如果我们把\mathbb{Q}(i)这个域记作D,我们就可以把图补全:

伽罗瓦理论的核心思想就是伽罗瓦对应——把域与群联系起来,让我们得以在域与群这两种语言中自由切换。伽罗瓦理论的力量无比强大,能帮我们解决很多问题,包括五次方程求根公式的存在性问题——但是先不谈这些『用处』,这个对应本身已经足够美丽。

由于作为例子,所以这个图还是比较简单的。放上一张稍微复杂一些的图:

在继续往下看之前,先对着这张图发一会儿呆吧=w=


===============第七节===============

【对称性缺失的原因与应对措施、伽罗瓦扩张(正规扩张、可分扩张)、根式扩张对应的群的性质——满足交换律】

接下来我有一个坏消息和一个好消息。

先说坏消息:并不是所有时候伽罗瓦对应的性质都这么好。有时候域和群不是一一对应的,或者说,『从域到群』和『从群到域』这两个转换不是互逆的。

比如有的时候,域扩张的对称操作只有『恒等操作』,哪怕这并不是一个假扩张。也就是说,有时域扩张并不具有我们所期待的对称性。

套用圆形门把手的比方来说就是,这个门把手拧不动——外面一层无法旋转。

在解释坏消息之前,我先把好消息也说了吧:

门把手拧不动的时候,我们总可以加一点润滑油让它能够正常旋转——啊,我是说,当域扩张的『缺少』我们期待的对称性时,我们总可以在域里加一些东西,让它获得本应具有的对称性。

我先给一个缺少对称性的例子:如果我们在\mathbb{Q}中加入\sqrt[3]{2},那么我们就得到了一个同时包含\mathbb{Q}\sqrt[3]{2}的域,记作\mathbb{Q}(\sqrt[3]{2}).

与之前一样,为了知道这个域扩张的伽罗瓦群Gal(\mathbb{Q}(\sqrt[3]{2})/\mathbb{Q}),我们需要先找到\mathbb{Q}(\sqrt[3]{2})的自同构(即对称操作)。

别忘了,域的对称操作会保持所有的等式不变。我们现在写一个等式:(\sqrt[3]{2})^3-2=0.

如果我们保持\mathbb{Q}不变(事实上,自同构一定会保持\mathbb{Q}不变),那么对称操作只可能把\sqrt[3]{2}换成其他的数。为了让这个等式依然成立,换上的数必须得是方程x^3-2=0 的解。由于这是自同构,所以换上的数必须在\mathbb{Q}(\sqrt[3]{2})中。

(换句话说,对于同一个多项式,自同构的效果是根的置换——就像之前换纸杯一样,如果一个纸杯被移走了,原有位置必须得换上某一个纸杯,而移走的纸杯必须被移到某个纸杯之前所在的位置。)

问题来了,所有\mathbb{Q}(\sqrt[3]{2})中的数都是实数,而x^3-2=0的实数解只有\sqrt[3]{2},另外两个解都是复数,不在\mathbb{Q}(\sqrt[3]{2})中。

也就是说,\sqrt[3]{2}无处可去,只能留在原地!由于\mathbb{Q}(\sqrt[3]{2})里每一个数可以被有理数与\sqrt[3]{2}表示出来,所以『有理数和\sqrt[3]{2}动不了』意味着\mathbb{Q}(\sqrt[3]{2})里所有的数都动不了!于是,\mathbb{Q}(\sqrt[3]{2})的自同构群以及这个域扩张的伽罗瓦群都只包含『恒等操作』,并没有什么『真正』的对称操作。

也就是说,门把手转不动:

出现这种情况怎么办呢?答案也很显然:把另外两个根也加进这个域里!

实际上,在这个域里加入另外两个根就等于加入了\omega,所以我们就得到了\mathbb{Q}(\sqrt[3]{2},\omega)这个域。于是,考虑从\mathbb{Q}\mathbb{Q}(\sqrt[3]{2},\omega)的域扩张,我们又有了之前的一一对应:

像这样拥有性质非常好的伽罗瓦对应的域扩张我们称之为『伽罗瓦扩张』。

(伽罗瓦扩张是既正规又可分的域扩张。正规扩张保证了多项式的每个根都被加进了域中,于是我们就有足够多的自同构把每个根送到它所有可能去到的位置;可分扩张保证了(不可约)多项式没有重根,就不会出现『两个根在同一个位置』而使得根可以去到的位置减少的情况。)

(域的特征为零时——有理数域就是这种情况——域扩张一定是可分的,所以伽罗瓦扩张等价于正规扩张。)

上述例子非常具有代表性:从\mathbb{Q}\mathbb{Q}(\sqrt[3]{2},\omega)是一个根式扩张(我们对\mathbb{Q}中的2 开了三次方根),如果根式扩张不是伽罗瓦扩张,那么我们总可以加入单位根使其变成伽罗瓦扩张。在上述例子中,\omega就是一个单位根。

有了单位根的帮忙,『根式扩张得到的域』与『群』之间就有非常好的一一对应关系。于是我们可以放心地用后者来研究前者的对称性了!

接下来我不加证明地给出一个结论:

『通过开n次方根进行的域扩张』和『通过加入单位根进行的域扩张』所对应的群都满足交换律——别忘了,一般的群只满足结合律,所以这两种群相当特殊。

(实际上它们都是有限循环群。这个结论其实很容易证明,但需要使用抽象代数的工具,故在此略去。)

于是,如果五次方程有求根公式,那么其方程的解所在的某个域(记作K)一定可以通过有理数域\mathbb{Q}的『根式扩张』得到,那么我们一定可以把从\mathbb{Q}到K的域扩张分为若干(有限)步,使得每一步扩张的伽罗瓦群都是满足交换律的。

如果K满足上述要求,那么我们就把从\mathbb{Q}到K的域扩张对应的伽罗瓦群称为『可解群』。

套用圆形门把手的比方来说就是,我们可以把只有一层的门把手分成若干(有限)层,每一层都可以转动,并且对应的伽罗瓦群都是满足交换律的。如下图:

所以,为了解决五次方程的问题,我们还需要知道最后一件事:如何把门把手分层——如何把域扩张(在不破坏伽罗瓦对应的情况下)分为若干步。

这,是最能体现伽罗瓦非同寻常的洞察力的地方。


===============第八节===============

【如何把域扩张分为若干步、正规子群、商群】

为了方便说明,我仍然使用门把手的图,但采用最开始的『换标签』的比方。

我们要想把域扩张分为若干步,只能『顺其自然』。什么意思呢?就是说,在哪里分割不是我们决定的,我们只是把原本就存在的分割线画出来。如下图所示:

只有原本就是分开的,我们才能把它分开。要不然即使画了分割线,标签还是会跑出来的。如下图所示:

那问题来了,我们如何知道原本是不是分开的呢?

换句话说,我们如何知道,对于每一种换标签的操作,虚线圆内的标签没有跑出来,外面的标签也没有跑进去呢?

我们来思考一个更加生活化的问题:

节日到了,每位同学都准备一个礼物,学校规定了A、B、C、D四种『全校范围内交换礼物』的方式。我们不知道也不关心这四种方式具体是什么,但我们想知道甲班的礼物是否会被这四种方式换到其他班级的同学手中。在可以对全校同学发号施令的情况下,我们可以怎么做呢?

方法如下:

我们先让全校同学按照A方式交换礼物,接着让『除甲班以外的所有同学』按照某种他们任意选择的方式交换礼物,然后再让全校同学把A方式反过来做。

如果甲班同学的礼物没有被A方式换到班级外的话,那么这样做下来,甲班同学应该拿到的是自己原先准备的礼物——因为第二步对甲班没有影响。

如果A方式把甲班中的小明同学的礼物换到了班级外,那么小明的礼物将会在第二步中再次被转手,所以第三步把A反过来做以后,小明拿到的一定不是自己的礼物。

请仔细思考上面三段话,确认自己明白再继续往下读。

按照这种方法,我们可以依次判断这四种方式是否会把甲班的礼物换到其他班级。问题解决!

回到之前『换标签』的比方,如下图:

图中虚线围成的圆也代表一个域,记为O.

为了判断虚分割线是否原本就存在,我们先对外边两层同时做『换标签』的操作(这个操作在从F到K的域扩张的伽罗瓦群Gal(K/F)里),接着对最外层做『换标签』的操作(这个操作在从O到K的域扩张的伽罗瓦群Gal(K/O)里,Gal(K/O)Gal(K/F)的子群),然后再把第一步反过来做(这个操作也在Gal(K/F)里,因为群内每个操作都有逆操作)。

如果这三个操作的复合操作保持了圆O内的标签不变(也就意味着这个复合操作在Gal(K/O)里),那么就说明虚分割线是存在的,我们就可以按照这条分割线来分割域扩张!

注意,第一个操作和第二个操作Gal(K/F)Gal(K/O)里『任选』的操作——这意味着我们实际上要确保Gal(K/F)Gal(K/O)里的每一个操作都能够通过上述检测!

如果确实如此,那么我们就说Gal(K/O)Gal(K/F)的『正规子群』,记作Gal(K/O)\lhd Gal(K/F) .

而按照虚分割线分开之后,我们就得到了一个新的伽罗瓦群Gal(O/F),它是Gal(K/F)Gal(K/O)的『商群』,记作Gal(O/F)\cong Gal(K/F)/Gal(K/O).

所有准备工作都已完毕,现在是时候给出最后一击了!


===============第九节===============

【正规子群链、可解群】

回顾一下之前所说的:

如果五次方程有求根公式,那么其方程的解所在的某个域(记作K)一定可以通过有理数域\mathbb{Q}的『根式扩张』得到,那么我们一定可以把从\mathbb{Q}到K的域扩张分为若干(有限)步,使得每一步扩张的伽罗瓦群都是满足交换律的。

现在,我们可以把这段话改为:

如果五次方程有求根公式,那么我们一定可以找到一条『正规子群链』:

G_1=S_1\lhd G_2\lhd G_3\lhd \cdots\lhd G_n,

其中G_1是一阶群,只包含『恒等操作』,而G_n是从\mathbb{Q}到K的域扩张所对应的伽罗瓦群;同时,每一个商群G_i/G_{i-1}都满足交换律。

满足上述条件的G_n就是『可解群』。

那么从\mathbb{Q}到K的域扩张所对应的伽罗瓦群是什么呢?

根据代数基本定理,我们知道五次方程有五个根。一般说来,我们可以任意交换它们——还记得『五个纸杯』的例子吗——所以从\mathbb{Q}到K的域扩张所对应的伽罗瓦群是S_5.

S_5的正规子群除了一阶群和它本身以外,只有A_5(这是S_5中的所有偶置换构成的群,解释见下一段,跳过解释并不影响阅读),所以我们顶多得到S_1\lhd A_5 \lhd S_5这样一条正规子群链。

(每一个置换都可以拆成若干个『两两交换』的复合,其中能被拆成偶数个『两两交换』的复合的置换就被称为『偶置换』。奇置换同理。显然偶置换与偶置换的复合仍是偶置换——因为偶数与偶数的和仍然是偶数——恒等操作是偶置换,并且偶置换的逆置换也是偶置换,所以一个置换群中的所有偶置换构成群A_5表示S_5中的所有偶置换构成的群。前者是后者的正规子群,因为对于任何一个置换\sigma来说,\sigma\sigma的逆置换奇偶性一样,于是『先做\sigma,再做偶置换,最后做\sigma的逆置换』仍是一个偶置换。而A_5的正规子群只有一阶群和它本身,所以被称为『单群』。不严谨地说,『单群』是一个与『可解群』相对的概念。有限可解单群只有素数阶循环群。)

S_1是一阶群。正如『任何数除以一等于其本身』,任何群与一阶群的商群也等于其本身,所以A_5/S_1\cong A_5 ,而A_5不满足交换律。(就算不知道A_5到底是什么,我们也应该知道『一般说来,群都不满足交换律』,所以这没什么可惊讶的。)

所以五次方程没有『加减乘除』和『开方』的求根公式。

Q. E. D.


===============关于伽罗瓦===============

不算构思的时间(更不谈学习这些知识的时间),这篇回答的累计写作时间大概是五十个小时。我知道,可能这篇回答写完后并不会有多少人看,看完之后很可能也收获甚微,但我还是想把自己的一些思考与理解写出来,万一对谁有一点点帮助呢?

愿意花这么多时间写这篇文章,也是出于我对伽罗瓦的尊敬、崇拜和感激。在我曾经无比痛苦和绝望的时候,伽罗瓦和他的理论给了我继续前行的动力。

伽罗瓦命途多舛:父亲被人害死、考巴黎理工大学两度失败、提交的论文两度石沉大海、被巴黎高师开除、两度入狱、自杀未遂,最终在二十岁时离开了人世,死于决斗——为了自己的心上人。

他在遗书中对革命党人与友人说:『我最终未能为自己的国家死去,希望爱国人士与我的朋友们不要为此责怪我……我将成为一桩风流韵事的受害者。啊!我为什么要死于这种琐碎而可怜的事呢……』

在决斗的前一晚,伽罗瓦匆匆写下了自己脑海中的数学思想,并且不断写着『我没有时间了』。

他把这些手稿夹在交给朋友Chevalier的信中,并在信的末尾嘱咐Chevalier:『请把我的手稿交给高斯和雅各比,听一听他们对这些理论的重要性(而非正确性)作何评价。我希望,未来的某一天,我这些杂乱的手稿会对世人有所帮助。

后人为了纪念伽罗瓦,将他开创的数学理论以他的名字命名。如今,伽罗瓦理论早已成为现代数学不可分割的一部分。伽罗瓦短暂的一生,犹如漆黑夜空中一颗耀眼的流星,照亮了数学家们前进的道路,也为世界带来了一份无与伦比的美丽。


===============其他===============

扩展阅读及参考资料:

Ian Stewart. Galois Theory

Nathan Carter. Visual Group Theory

Edward Frenkel. Love and Math

Thomas Hungerford. Algebra

Tom Leinster. Basic Category Theory

Galois Talk: youtube.com/playlist?

Introduction to Galois Theory: youtube.com/playlist?

以及Friedman教授的抽代课笔记

最后,分享一个我个人非常喜欢的视频,是我在YouTube上无意中看到的,我将它转到了优酷上。这个视频以x^3-2=0这个方程为例子,动态地展示了『伽罗瓦对应』。(还记得前文中的几张图吗?想知道它们『动起来』是什么样子吗=w=)

Visualize Galois Theory—在线播放—优酷网,视频高清在线观看 http://v.youku.com/v_show/id_XMTUwMzc0MzMzNg==.html?spm=a2hzp.8244740.userfeed.5!3~5~5~5!3~5~A

原视频地址:youtube.com/watch?

那么就这样=w=