Overview 做项目时出现过某些蛋白质序列出现O或者X等情况,导致计算出的PSSM矩阵也有问题。今天又遇到这种情况,在比对文件的时候,用到了两条文件操作的linux命令,记录一下。其他更多的内容参考之前Chris写的另一篇文章生物信息中常用的Linux命令。 1. 按顺序合并文件 普通的合并文件可以直接用一个cat命令,而按顺序合并多个文件必须遍历这些文件,逐个合并。命令如下: for...阅读全文>>
您正在查看: 标签 shell 下的文章
生物信息中常用的Linux命令
Overview 一直想把常用的命令搜集起来,以便平时用到的时候查阅,可惜一直没抽出来时间专门整理下。最近在做序列的特征提取和多个特征文件合并时,频繁使用到了一些命令,干脆一并整理到这里,以后边用边添加整理新的命令。 这里的linux命令主要在MAC 10.9.5和Ubuntu 14.04下测试,涉及到平台差异性的时候,会尽量指出来,没有区分的话就表示两种平台下都可以使用。如果仍有没涉及到...阅读全文>>
蛋白质序列特征提取方法之——CKSAAP
Overview 在CKSAAP(Compositon of k-spaced Amino Acid Pairs)方法中,利用在蛋白质序列片断中k个间隔距离的残基对(residue pairs)在该序列中的组成比例,建立数学模型,提取出特征向量,从而达到预测泛素(Ubiquitin)的目的。 残基(residue)和泛素(Ubiquitin)信息详见维基百科:残基和泛素,这里就不赘述了。 ...阅读全文>>
Java程序调用Shell命令及脚本文件
Overview 最近需要用到数个Python程序处理蛋白质序列以输出特征值,而这些Python文件需要在Shell脚本中传入文本文件(该文本文件记录了某些蛋白质序列)做参数,进而依次被Shell调用。我们在Java程序中建立Shell脚本的运行时环境Runtime,这其中用到了一个类,即java.lang.Runtime,下面对该类进行探讨和记录。 1.直接运行Shell命令 java....阅读全文>>
最新文章
Windows10环境安装Python的Zipline包TensorFlow 2.0实战Deep&CrossTensorFlow 2.0实战DeepFM增量学习的主流实现内容相似推荐实现TensorFlow 2.0使用RNN和LSTM进行文本分类PySpark笔记之五:lightGBM调参之PySpark + mmlspark + HyperoptPySpark笔记之四:lightGBM调参之PySpark + mmlspark + Grid SearchPySpark笔记之三:lightGBM调参之PySpark + Grid SearchPySpark笔记之二:PySpark环境LightGBM训练
最新回复
Kai: 作者您好,
我在databricks运行代码,这...
Xiaoyang Zhang: 您好 我是mac m1芯片 已经替换里其中的blast...
buy viagra soft tabs: 生物化学基础知识简介 - noHup
yuki: 我git mathjax下来找不到mathjax.js...
amoxil capsules 500 mg: amoxil 250 mg suspension pe...
PSSM(一)-什么是PSSM R11; Ayanokouji Monki的博客: [...]1.构建PSSM的步骤[...]
一条生物狗: 超感谢,有学到东西。找到这儿是为了读博憋文章在学PTM...
Google: Check beneath, are some com...
wendao: 赞!
Mars: 在版本么有问题的情况下,安装mmlspark等包后,引...
归档
January 2024May 2020April 2020March 2020October 2019September 2019August 2019July 2019October 2018April 2018March 2018October 2017April 2017March 2017December 2016September 2016July 2016June 2016May 2016April 2016March 2016February 2016January 2016December 2015November 2015October 2015September 2015August 2015June 2015January 2015December 2014