Overview 我在之前写的一篇博客中谈到整理那些混乱的数据源,发现有pssm fts文件夹中的子文件夹和文件并不清楚来龙去脉,这个问题困扰了我一段时间。最近在研究PSSM算法时,与Chris交流了一下,恍然大悟:这个文件夹中的t3pssm,t4pssm,t6pssm三个子文件夹中的形如t6_12.pssm的文件族,是由t3,t4,t6这三个文件夹中的形如t6_12.fasta的文件族经...阅读全文>>
您正在查看: 标签 python 下的文章
蛋白质序列处理—总体步骤
蛋白质序列处理程序之前得到的数据源太乱,这些天整理并重新摆放了一下,每一步的输入文件夹后缀都有一个-in,处理程序文件夹后缀为-run,输出文件夹后缀为-out,这样条理清晰了很多,今日记录,以方便日后查阅使用。 数据处理部分共分5步: 下载并分类(set class) 多步CD-hit 正负样本1:1平衡(Dataset balance) 特征计算(feature calculation...阅读全文>>
蛋白质序列特征向量计算—数据处理第(4)步
该步骤为数据处理的第(4)步,共包含6小步。 其中前三步: 1. AAC,Amino acid composition(AminoAcidC.py) 2. SEQ,Sequence(Seq.py) 3. eft3,amino acids combination properties(involving kmp algorithm)(Eft3.py) 这前三步用到feature_calc.s...阅读全文>>
Mac上安装Python机器学习库scikit-learn
Overview 因为最近需要用到一些机器学习算法,Python的scikit-learn提供很多机器学习算法实现,可以很方便地用来做实验。今天在自己的电脑上安装了scikit-learn,并在此记录了安装的步骤。 安装pip 由于scikit-learn官方给的步骤是使用pip安装,所以要先安装pip。我是用了pip官方提供的安装页面 但是没有成功。因此想使用homebrew安装pip。使...阅读全文>>
最新文章
Windows10环境安装Python的Zipline包TensorFlow 2.0实战Deep&CrossTensorFlow 2.0实战DeepFM增量学习的主流实现内容相似推荐实现TensorFlow 2.0使用RNN和LSTM进行文本分类PySpark笔记之五:lightGBM调参之PySpark + mmlspark + HyperoptPySpark笔记之四:lightGBM调参之PySpark + mmlspark + Grid SearchPySpark笔记之三:lightGBM调参之PySpark + Grid SearchPySpark笔记之二:PySpark环境LightGBM训练
最新回复
Kai: 作者您好,
我在databricks运行代码,这...
Xiaoyang Zhang: 您好 我是mac m1芯片 已经替换里其中的blast...
buy viagra soft tabs: 生物化学基础知识简介 - noHup
yuki: 我git mathjax下来找不到mathjax.js...
amoxil capsules 500 mg: amoxil 250 mg suspension pe...
PSSM(一)-什么是PSSM R11; Ayanokouji Monki的博客: [...]1.构建PSSM的步骤[...]
一条生物狗: 超感谢,有学到东西。找到这儿是为了读博憋文章在学PTM...
Google: Check beneath, are some com...
wendao: 赞!
Mars: 在版本么有问题的情况下,安装mmlspark等包后,引...
归档
January 2024May 2020April 2020March 2020October 2019September 2019August 2019July 2019October 2018April 2018March 2018October 2017April 2017March 2017December 2016September 2016July 2016June 2016May 2016April 2016March 2016February 2016January 2016December 2015November 2015October 2015September 2015August 2015June 2015January 2015December 2014