Pandas 提供了多种工具来帮助我们方便地进行数据集合并:
层次化索引(Hierarchical / Multi-level Indexing)是pandas的一项重要功能,它使你能在一个轴上拥有多个(两个以上)索引级别。抽象点说,它使你能以低维度形式处理高维度数据。
以下图为例,这里有两个索引级别,level 0 表示第一个索引级别,level 1 表示第二个索引级别。组合各个索引级别上的标签则可以构成一个索引项,例如 (‘bar’, ‘one’)、(‘foo’, ‘two’) 等。
Pandas 提供了很多用于将表格型数据读取为 DataFrame 对象的函数,下表列举出了其中一些常用的函数及其说明。其中一些函数,比如pandas.read_csv,有类型推断功能,因为列数据的类型不属于数据类型。也就是说,你不需要指定列的类型到底是数值、整数、布尔值,还是字符串。其它的数据格式,如 HDF5、Feather 和 msgpack,会在格式中存储数据类型。
Pandas 中最基本的数据类型包括 Series、DataFrame 和 Index: