取数据

ipython 查看加载变量

%who_ls

获取数据框中数据

当使用loc获得一个数据框的时候,要想遍历这个数据集中的内容

  • iterrows按照行获取数据,每次获得一行数据

iterrows是一个生成器,每个返回的生成器中包含两个内容:

  • 改行的索引

  • 改行的数据list,并且list的下标是从0开始的

>>>df = pd.DataFrame([[1, 1.5]], columns=['int', 'float'])
>>>row = next(df.iterrows())[1]
>>>row
int      1.0
float    1.5
Name: 0, dtype: float64
>>>print(row['int'].dtype)
float64
>>>print(df['int'].dtype)
int64

遍历一行中的列

  • 使用索引进行遍历iloc[:0]

  • 使用列名进行遍历loc['chr']

使用映射函数,批量处理

对数据库进行批量处理

  • map

  • apply

多条件筛选

筛选符合多个条件的行

筛选chr列为"Ghir_A01"同时"start"列为8076的行

获取多行多列

去除行名中的重复

合并两个数据框

修改行名与列名

调整列的顺序

按照指定列进行排序

Last updated

Was this helpful?