前言
本文内容总结自【斯坦福大学】科学论文写作(Writing in the Sciences)(全)课程,也结合了一些自己的思考。
写作阶段
对于科研论文写作来说,最重要的原则是:清晰高效地传递想要表达的思想。这要求,文字要尽量质朴、易于理解、易于阅读,不必追求修辞、用词的花哨。
在写作之前,需要把所有的数据和结果都跑出来——数据来自于其它论文,结果来自于实验。其实,在写论文的时候,不一定要把全部的数据结果都跑出来,可以跑出来一部分写一部分,先把框架搭好,然后再向里填充具体的内容。最基本的框架当然来自于具体投稿的会议/期刊的模板。
在开始写作的时候,需要决定每一个section要写什么,进一步来说,每一段的主题句也要想好。其实,每个section都是确定的内容,需要打磨的是——每一个subsection,subsection中的每一段需要写什么。
在实际写作的时候,首先要写出来一个草稿——将大概的意思表达出来即可,追求逻辑的流畅性,而非文本的华丽性。一个可以参考的写作顺序是:图表、结果分析、使用的方法、引言、相关工作、摘要和结论。
对于图表来说,包括两个组分——表格和图片。具体的结果分析需要放在正文中进行,不要放在图题、表题中。
对于表格来说,最重要的是精准、简洁。表格中的数据必须是准确的数据,格式必须是三线表的格式。
对于图片来说,其意义在于给出视觉冲击、展示变化的趋势并且迅速地传递想要输出的观点。每个图片都需要有图题、必要的实验条件说明、符号的含义、子图的含义解释(有子图时)。
结果分析部分需要总结数据。这部分切忌重复表中重复的数据,可以通过以下几个方式行文:
- 纵向对比:表现最好的和第二名相比好了多少?和平均值相比好了多少?表现不好的也可以用同样的方法。
- 横向对比:同一个模型,不同任务上的表现有何不同?能够说明什么?
这部分的时态通常用过去式和一般现在时:we found that
以及the tables show
,规避被动语态的使用。
方法部分,要给出清晰的流程以及足够的信息。不仅仅是主方法的部分,分析性实验同样要按照这个原则写。流程是什么?选了哪些模型?为什么这么选择?
引言部分通常以三个自然段形式展开:
- 背景、现有技术的不足之处
- 依靠的假设/提出的方法
- 提出的方法/优点在哪里
这部分需要说明,在这个领域中,什么是已知的?什么是未知的(现有方法不足之处在哪里)?要解决什么问题?为什么你的方法更好?
相关工作要清晰呈现已有的标志性工作,需要注意引用。
摘要部分需要给出工作的简介。可以参考的结构:
- 背景
- 要解决的问题/目标
- 实验总结
- 结果是什么
- 结论
- 未来展望
审阅阶段
审阅可以从两个方面简述——段落审阅、句子审阅。
段落审阅即从段落粒度进行审阅。重要的原则是:
- 简单:一段阐述一个观点,这个观点需要在主题句中被陈述。
- 有逻辑:段落需要按照逻辑流来组织。可以遵循时间顺序、总分顺序(从一般到具体)、推理顺序(由因到果)。需要说明的是,当反驳某个论点是,需要按照“原论点-反驳的观点”结构来陈述。
句子审阅的粒度即为一个个句子,这一步主要挑阅读观感上的问题。
第一步就是“删除冗余”,加快阅读速度:
- 删除没有意义的形容词/副词:比如“Model A is quite important in our work because …”,这里的“quite important”就可以删掉。是个人就知道方法中的模块都重要,要阐述“为什么重要”,比如“Model A bridges the gap between visual signal and textual signal.”就是一个很好的句子。
- 移除没有用的短句:比如“As far as we all know, LLMs are broadly used in visual understanding tasks.”就完全可以变成“ LLMs are broadly used in visual understanding tasks.”。
- 以短替长:用尽可能短的表达替换长的表达方法,比如用“many”替换“a number of”。
- 替换掉所有的“There be”,因为这颠倒了正常的主谓宾语序,不利于阅读。
第二步是“考量动词的使用方法”,优化文章观感:
- 用主动语态:被动语态不利于理解。
- 用动词替换名词:动词更有力量。在阅读过程中,读者往往等待着动词的出现。
第三步是“考量标点的使用方法”:
- 分号:连接两个独立的句子。
- 括号:对括号前的概念进行解释。
- 冒号:为冒号前的概念增添用于解释、结论、强调的独立句。
- and/or/but:严格来说,这两个单词并不算做标点,但是它们能起到标点的作用,需要注意的是,依靠这几个单词连接的句子,需要按照平行结构来写。