查找
类别
关于这个博客的几点说明
1. 这个博客只讨论技术,以及与技术有关的评论。也许,还有一些生活杂感及琐碎的杂务记录。
2. 这个博客的内容保证原创性,凡是特别的使用了网络上其他人的博客或者文章的地方,会进行引用。被引用的页面通常并不会被链接,而是会被作为PDF格式的附件置于本博客文章的尾部。这是因为被链接的网页内容可能被变更或删除,不利于阅读参考。
3. 这个博客的更新很慢很慢,博主没有时间经常关注它,尽管每个月有一篇文章还是有可能的。
4. 文章的技术内容仅供参考,如果有人照着做了,然后产生了任何损失,本博主概不负责。
5. 本博客仅仅是个人的技术经验记录,所以不接受任何评论。
6. 如果这个博客在你的屏幕上看起来乱七八糟的话,请试试用FireFox打开它。
分类目录归档:生物信息学
用Word写学术论文:公式及参考文献
关键字:Word;学术论文;公式;参考文献
对于这个题目,我相信大多数已经发表过至少一篇国际刊物论文的人的回答是:你tmd用什么word啊,latex才是正道啊。
这回答没错。不过问题是,对于相当多非CS/EE专业的人来说,玩转latex不是那么容易,然后很快就有人说,不是有模板吗,不是[……]
数FASTQ文件中的序列数量
发表在 生物信息学
数FASTQ文件中的序列数量已关闭评论
计算FASTA/FASTQ文件中序列的GC Content
在处理生物序列数据的过程中,有些时候需要知道某个数据集的GC Content,如果手边有专门的软件最好,如果没有,其实大可以用简单的Linux命令行工具来大致的进行计算。
1. 计算FASTA文件中的总符号数量
cat test.fas | grep -v "^>" | tr[......]
发表在 生物信息学
计算FASTA/FASTQ文件中序列的GC Content已关闭评论
使用命令行工具求文本的行补集
在处理生物信息学数据的过程中,有时会遇到这样的需求,需要从一个文件中剔除一部分满足条件的行,举例来说,在文件test中有很多的id,每行一个,我们希望把这些id中有重复的那些都彻底的除去,一个不留。这至少有两种办法,可以在完全不写程序的条件下来完成。
方法一:如果你不想要这些有重复的id的列表[……]
发表在 生物信息学
使用命令行工具求文本的行补集已关闭评论
生物信息学科研项目中的文件管理
生物信息学的科研实际上就是在计算机上进行的科研。各种文件的管理其实是个很重要的事情。乱七八糟的文件不但会影响研究进度和效率,还有可能造成意想不到的错误和损失。在过去六年的科研过程中,我逐渐总结出了一套适用于自己的文件管理方式。这套玩意不一定适用每一个人,不过,我想,给别人看看无伤大雅吧。
对于[……]
发表在 生物信息学
生物信息学科研项目中的文件管理已关闭评论