python统计下列五行字符串中字符a、c、g、t出现的频数。
数据集:
1.aggcacggaaaaacgggaataacggaggaggacttggcacggcattacacggagg
2.cggaggacaaacgggatggcggtattggaggtggcggactgttcgggga
3.gggacggatacggattctggccacggacggaaaggaggacacggcggacataca
4.atggataacggaaacaaaccagacaaacttcggtagaaatacagaagctta
5.cggctggcggacaacggactggcggattccaaaaacggaggaggcggacggaggc
将上面的数据集存入到data.txt文件中,源码如下:
import numpy as np
a=[]
with open('data.txt') as f:
for (i, s) in enumerate(f):
a.append([s.count('a'), s.count('c'),
s.count('g'),s.count('t')])
b=np.array(a);
print(b)
运行结果: 1、其中enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。 2、count() 方法用于统计字符串里某个字符或子字符串出现的次数 3、append()函数是在列表a最后(末尾)添加我们统计的元素个数[a,c,g,t],添加5个列表。
|