查找
类别
关于这个博客的几点说明
1. 这个博客只讨论技术,以及与技术有关的评论。也许,还有一些生活杂感及琐碎的杂务记录。
2. 这个博客的内容保证原创性,凡是特别的使用了网络上其他人的博客或者文章的地方,会进行引用。被引用的页面通常并不会被链接,而是会被作为PDF格式的附件置于本博客文章的尾部。这是因为被链接的网页内容可能被变更或删除,不利于阅读参考。
3. 这个博客的更新很慢很慢,博主没有时间经常关注它,尽管每个月有一篇文章还是有可能的。
4. 文章的技术内容仅供参考,如果有人照着做了,然后产生了任何损失,本博主概不负责。
5. 本博客仅仅是个人的技术经验记录,所以不接受任何评论。
6. 如果这个博客在你的屏幕上看起来乱七八糟的话,请试试用FireFox打开它。
作者归档:Pu-Feng Du
Ubuntu下的Apache服务器日志文件大小的控制
近日忽然发现Ubuntu Server登录以后提示根文件系统容量即将耗竭。经过查找之后发现 /var/log/apache2/error.log.1居然达到了惊人的70GB……。进一步发现,某些不知什么原因批量提交错误数据的家伙造成了这个结果,随直接封IP。
问题是,apache怎么可[……]
发表在 软件使用与程序设计
Ubuntu下的Apache服务器日志文件大小的控制已关闭评论
误删除了.bashrc后如何恢复
发表在 软件使用与程序设计
误删除了.bashrc后如何恢复已关闭评论
数FASTQ文件中的序列数量
发表在 生物信息学
数FASTQ文件中的序列数量已关闭评论
计算FASTA/FASTQ文件中序列的GC Content
在处理生物序列数据的过程中,有些时候需要知道某个数据集的GC Content,如果手边有专门的软件最好,如果没有,其实大可以用简单的Linux命令行工具来大致的进行计算。
1. 计算FASTA文件中的总符号数量
cat test.fas | grep -v "^>" | tr[......]
发表在 生物信息学
计算FASTA/FASTQ文件中序列的GC Content已关闭评论
使用命令行工具求文本的行补集
在处理生物信息学数据的过程中,有时会遇到这样的需求,需要从一个文件中剔除一部分满足条件的行,举例来说,在文件test中有很多的id,每行一个,我们希望把这些id中有重复的那些都彻底的除去,一个不留。这至少有两种办法,可以在完全不写程序的条件下来完成。
方法一:如果你不想要这些有重复的id的列表[……]
发表在 生物信息学
使用命令行工具求文本的行补集已关闭评论