非计算机专业理工科学生在 AI 的研究和应用中如何发挥自身优势?

转型时期,谁也不能例外!
关注者
212
被浏览
14,945
收录于 知乎圆桌 ·

我自己是理论背景,做过理论物理、计算物理相关研究,目前在从事人工智能在药物发现和开发中的应用研究。希望以下我的一些个人想法可以带来更多的讨论。

如果时间有限,可以直接看并拍我总结的结论:


-------- 脱水版 --------


AI本身是一个可能应用在多个领域中的技术,所以我们可以以各种姿势参与到AI的研究和应用中。


一句话概括:AI无常形,万物皆有戏。


  • 理工科学生所具备的优秀逻辑推理能力,抗打击能力,耐寂寞能力是在各个领域都不可多得的优势。
  • 研究方向而言:从算法发展,硬件发展来看,数学、统计学、材料学、电子学、生物学等等多个领域均有机会对AI研究产生意义深远的贡献。风险是如一切研究项目,可能长期看不到产出,也可能会失败。
  • 应用方向而言:追求快速入行发展的话,利用自己的编程经验/数据分析经验,进入AI应用的一线,比如开发,部署。长期看来,AI的落地离不开专业的产业理解。所以如果看好自己的专业方向,在加强自身专业技能的同时,加强管理、协作能力培养,同时像投资人一样去了解AI的技术特点和发展方向,作为AI和产业的连接者,在AI落地的关键步骤发挥巨大优势。


------- 以下是絮絮叨叨加水版---------

如问题所言,这个优势的发挥可以大致划分为在AI的研究和应用两个方面。


研究方向:

很多计算机方面的进展都不仅仅局限在计算机专业本身。原因有两个:

  1. 现在很多理工科学生在平时的研究中对于算法和编程语言的了解就已经有很高的造诣;
  2. 相当数量的计算机技术的发展依赖于数学、统计学,甚至在人工智能时代生物学等学科的进步。

对于第一点,我们自己的算法团队实际上就是一个计算机、化学、药学、数学、物理学、运筹学等多方面人才的一个综合体。我也认识一些朋友,在Github上维护一些开源的,在专业领域进行使用的AI算法。能这样做,同时也是需要这样做的原因是在一些专业领域中,比如结构生物学,化学等,AI算法研究需要研究者对于系统有充足的了解。有时候,我们要输入的数据可能不像一张图片,直接用像素表达就可以。举个例子,我们想要预测小分子毒性或者与蛋白质结合的能力(或者DNA/RNA的相关性质),我们可以以分子的二维拓扑结构作为输入,也可以以三维结构作为输入,再细致一点,可以以电子云的排布作为输入,究竟哪一个才是合适的,要看研究者对于问题的理解。这也是因为对于复杂的、微观的系统,人类的观察(数据采集)本身就是有偏差的,选择什么样的数据本身就成为了问题。而这些问题需要专业的知识来解决。

一段DNA的数据表示可以有多种方式

对于第二点,我们看几个例子。一个是Geoffrey Hinton,本科是实验心理学[1],现在头衔上也是兼有计算科学家和认知心理学家两个方面。Hinton近年又提出Capsule[2](这篇文章有很详尽的介绍:zhuanlan.zhihu.com/p/29),虽然结果如何尚且不知,大师寻求改变和坚持的精神还是非常值得学习的。

另一个是顾险峰老师等进行的关于GAN的研究[3],为神经网络的理解和算法优化,从数学的角度提供了思路。另外,前不久和一位神经科学的老师聊,他们也是观察到一些神经元的动力学性质,有可能可以应用到网络设计中,虽然还很早期,但是也是提供了不同的视角。所以,大家在各自的领域,也是可能直接参与到AI的研究中的。


应用方向:

AI的应用依赖于数据、硬件、算法实现、行业落地。那么我相信大多数理工科学生在编程上有不错的基础,数据处理上应该是有独特的优势。而硬件和材料学,电子学等也是密切相关。同时行业落地需要的是行业内既懂本专业知识,又懂AI的复合人才。

当然要补充的是,从物理的角度,任何问题的讨论都应该有它自己的时间尺度。那么对于这个发挥自身优势的问题也可以分为在短期来看和长期来看。如果追求短期内快速在AI这个具体的技术领域发挥优势,那就只能依靠自己多年严格理工科训练培养的一不怕苦二不怕累的精神,研究一下市面上现在哪些一线开发岗位缺人,需要什么样的技能,通过自学的方式(相信很多理工科学生从大学本科期间就开始自学能力的培养了),快速补充专业技术。然后在一线的开发中积累经验。如果能等得更长一些,就可以继续发挥自己的专业能力。因为AI在落地过程中一定会与相应专业发生关联。所以不断加深自己在专业领域的造诣,同时对AI技术和发展保持持续的关注,能做到AI到来时自己是专业领域中最了解自身技术和AI特点的人,也不失为一个好的选择。就我们自己在实践过程中,也是发现最高效的AI应用方式就是让算法开发团队与药学、化学团队紧密配合,才能做到集中有限资源,解决药物研发中的具体问题。


总的说来,在眼下AI发展的大潮中,我们除了关注技术本身以外,应该更多地思考这股大潮背后的原动力。在未来的几年中,几个驱动AI发展的因素将包括数据,算法,硬件,框架等。涉及到的领域会包括管理(实验室管理,数据管理等),数学,统计学,生物学,材料,电子工程,计算机等多个理工科领域。AI本身作为一个技术,只有在各个领域与现有积累进行融合才能发挥价值。


以上个人观点


May the force be with you.

(节日小礼物,给大家推荐一个适合phd阅读的漫画网站:phdcomics.com/,笑一笑,生活就很好了)


----------------------------------

参考资料:

[1]. en.wikipedia.org/wiki/G

[2]. Dynamic Routing Between Capsules, S. Sabour, N. Frosst, G. E. Hinton

[3]. 虚构的对抗,GAN with the wind