分类目录归档:生物信息学

用Word写学术论文:公式及参考文献

关键字:Word;学术论文;公式;参考文献

对于这个题目,我相信大多数已经发表过至少一篇国际刊物论文的人的回答是:你tmd用什么word啊,latex才是正道啊。

这回答没错。不过问题是,对于相当多非CS/EE专业的人来说,玩转latex不是那么容易,然后很快就有人说,不是有模板吗,不是[……]

继续阅读

发表在 生物信息学, 软件使用与程序设计 | 用Word写学术论文:公式及参考文献已关闭评论

数FASTQ文件中的序列数量

这个事情有一点点tricky的味道,经过若干实验,发现比较靠谱的办法是这么办

cat test.fq | grep "^+$"| wc -l

第三行看来是个不错的标记啊。[……]

继续阅读

发表在 生物信息学 | 数FASTQ文件中的序列数量已关闭评论

计算FASTA/FASTQ文件中序列的GC Content

在处理生物序列数据的过程中,有些时候需要知道某个数据集的GC Content,如果手边有专门的软件最好,如果没有,其实大可以用简单的Linux命令行工具来大致的进行计算。

1. 计算FASTA文件中的总符号数量

cat test.fas | grep -v "^>" | tr[......]

继续阅读

发表在 生物信息学 | 计算FASTA/FASTQ文件中序列的GC Content已关闭评论

使用命令行工具求文本的行补集

在处理生物信息学数据的过程中,有时会遇到这样的需求,需要从一个文件中剔除一部分满足条件的行,举例来说,在文件test中有很多的id,每行一个,我们希望把这些id中有重复的那些都彻底的除去,一个不留。这至少有两种办法,可以在完全不写程序的条件下来完成。

方法一:如果你不想要这些有重复的id的列表[……]

继续阅读

发表在 生物信息学 | 使用命令行工具求文本的行补集已关闭评论

生物信息学科研项目中的文件管理

生物信息学的科研实际上就是在计算机上进行的科研。各种文件的管理其实是个很重要的事情。乱七八糟的文件不但会影响研究进度和效率,还有可能造成意想不到的错误和损失。在过去六年的科研过程中,我逐渐总结出了一套适用于自己的文件管理方式。这套玩意不一定适用每一个人,不过,我想,给别人看看无伤大雅吧。

对于[……]

继续阅读

发表在 生物信息学 | 生物信息学科研项目中的文件管理已关闭评论