第52章 主编,我想做科研(求追读)(2/2)

虾皮小说【www.xpxs.net】第一时间更新《从信息学霸到神级科学家》最新章节。

况且,一个毕业两年的初级研究员,难道回到学术界就做出什么很厉害的成果了吗?

夕阳西斜,一束光线透过窗子在他桌前留下痕迹,下班的时间到了。

莫里森叹了口气,晃了晃脑袋,摒除那些乱七八糟的想法,正准备合上电脑下班。

忽然,伴随着提示音的响起,一篇论文卡着时间发了进来,出现在自然杂志的审稿系统上。

莫里森准备关电脑的手停了下来。

论文的标题深深吸引了他的目光。

《Solving Complex Decision-Making Problems with Policy Gradient Algorithm》

使用策略梯度算法解决复杂决策问题...这是什么领域的论文?

莫里森顿时来了兴趣。

不如,把这篇审完再走?反正也花不了太长时间。

他点开论文,轻读出声。

“在这篇开创性的论文中,我们首次提出了一种创新的策略梯度算法,该算法能够使机器自主训练并生成复杂的决策策略。在以往的研究中,机器的决策能力往往受限于人类预设的规则和边界,而我们的工作打破了这一局限,为机器赋予了自我学习和自我进化的能力...”

上帝啊,这是什么研究!

莫里森瞪大了眼睛,从未听说过有研究是能让机器自我学习策略的。

而且,这似乎,是信息学领域的?

莫里森继续往下阅读,发现这篇文章他是完全可以看得懂的。

作者在论文的第一部分introduction里就简明扼要地抛出了自己对策略是什么这个问题的理解。

“策略是一个函数么...”,莫里森顿时有种恍然之感,这么来看作者的想法就很合理了,如果用神经网络来拟合函数,似乎真行得通!

“不过,你要怎么去训练呢?”,莫里森一边思索,一边喃喃自语。

他似乎没有发现,自己已经顺着论文的思路逐渐往下看下去了,完全超过了平日里初审所需要的阅读范围。

莫里森继续往后阅读,后面的内容简直堪称惊世骇俗。

竟然是让由神经网络构成的智能体自行探索,逐渐学习策略。

莫里森初看到的时候只觉得异想天开,但是随着后面作者的公式推导与证明,他发现这似乎真行得通!

而后面的详尽的实验验证也证明了,这个技术是实实在在可以应用的。

莫里森的脸都因为兴奋而发红,如同喝醉了一般,如痴如醉地把整篇论文前前后后读了两遍。

直到他缓过神来,才发现天色已经黑了,整个自然杂志社就只剩下他一人。

莫里森看了看表,天,竟然已经是晚上九点了。、

自己就这样因为一篇论文,坐在位置上看了整整三个小时。

他赶忙操作系统,把论文通过了初审,然后,从列表里找到了蓝星几所顶尖大学的著名研究员,把论文发给了他们。

发出论文后,莫里森仍然坐在位置上深深回味着。

他仿佛下定了什么决心似的,快速编辑了一篇邮件,深吸一口气,发给了杂志社主编。

那标题为辞职信的邮件中,只有短短一行字。

“主编,我想做科研。”