1.多行pandas DataFrame在jupyter中完整显示?
import pandas as pd
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)
显示部分行
pd.set_option('display.min_rows', 100)
2、统计某列中每个值出现的频率
df['time'].value_counts()
3、统计dataframe中某个字段特定值的数据
c_ip_223=faceB_data_v4.query("c_ip =='*'")
df.query("A==1 & B==4")
c_ip_223.query("sni=='*'| sni=='*'|sni=='*'")
4、jupyter备注字体标成红色
<font color = red>***</font>
<font color=
5、对字段进行分组数量统计
steam_s_ip_count=pd.DataFrame({"sum":steamC_data_v4.groupby(['s_ip','hour_minute']).size()}).reset_index()
steam_s_ip_count.shape[0]
steam_s_ip_count.sort_values(by="sum",ascending=False).head(20)
6、统计Dataframe中每一列独立值/唯一值的个数
len(time_top['client_ip'].unique())
|