第52章 主编,我想做科研(求追读)(2/2)
虾皮小说【www.xpxs.net】第一时间更新《从信息学霸到神级科学家》最新章节。
况且,一个毕业两年的初级研究员,难道回到学术界就做出什么很厉害的成果了吗?
夕阳西斜,一束光线透过窗子在他桌前留下痕迹,下班的时间到了。
莫里森叹了口气,晃了晃脑袋,摒除那些乱七八糟的想法,正准备合上电脑下班。
忽然,伴随着提示音的响起,一篇论文卡着时间发了进来,出现在自然杂志的审稿系统上。
莫里森准备关电脑的手停了下来。
论文的标题深深吸引了他的目光。
《Solving Complex Decision-Making Problems with Policy Gradient Algorithm》
使用策略梯度算法解决复杂决策问题...这是什么领域的论文?
莫里森顿时来了兴趣。
不如,把这篇审完再走?反正也花不了太长时间。
他点开论文,轻读出声。
“在这篇开创性的论文中,我们首次提出了一种创新的策略梯度算法,该算法能够使机器自主训练并生成复杂的决策策略。在以往的研究中,机器的决策能力往往受限于人类预设的规则和边界,而我们的工作打破了这一局限,为机器赋予了自我学习和自我进化的能力...”
上帝啊,这是什么研究!
莫里森瞪大了眼睛,从未听说过有研究是能让机器自我学习策略的。
而且,这似乎,是信息学领域的?
莫里森继续往下阅读,发现这篇文章他是完全可以看得懂的。
作者在论文的第一部分introduction里就简明扼要地抛出了自己对策略是什么这个问题的理解。
“策略是一个函数么...”,莫里森顿时有种恍然之感,这么来看作者的想法就很合理了,如果用神经网络来拟合函数,似乎真行得通!
“不过,你要怎么去训练呢?”,莫里森一边思索,一边喃喃自语。
他似乎没有发现,自己已经顺着论文的思路逐渐往下看下去了,完全超过了平日里初审所需要的阅读范围。
莫里森继续往后阅读,后面的内容简直堪称惊世骇俗。
竟然是让由神经网络构成的智能体自行探索,逐渐学习策略。
莫里森初看到的时候只觉得异想天开,但是随着后面作者的公式推导与证明,他发现这似乎真行得通!
而后面的详尽的实验验证也证明了,这个技术是实实在在可以应用的。
莫里森的脸都因为兴奋而发红,如同喝醉了一般,如痴如醉地把整篇论文前前后后读了两遍。
直到他缓过神来,才发现天色已经黑了,整个自然杂志社就只剩下他一人。
莫里森看了看表,天,竟然已经是晚上九点了。、
自己就这样因为一篇论文,坐在位置上看了整整三个小时。
他赶忙操作系统,把论文通过了初审,然后,从列表里找到了蓝星几所顶尖大学的著名研究员,把论文发给了他们。
发出论文后,莫里森仍然坐在位置上深深回味着。
他仿佛下定了什么决心似的,快速编辑了一篇邮件,深吸一口气,发给了杂志社主编。
那标题为辞职信的邮件中,只有短短一行字。
“主编,我想做科研。”