Pandas 数据集合并(2)

Read More

Pandas 数据集合并(1)

Pandas 提供了多种工具来帮助我们方便地进行数据集合并:

  • pandas.concat 方法可以沿着一条轴将多个对象堆叠到一起。
  • pandas.merge 方法可以根据一个或多个键将不同 DataFrame 中的行连接起来,它实现的就是 SQL 或其他关系型数据库的 join 操作。

Read More

Pandas 层次化索引

层次化索引(Hierarchical / Multi-level Indexing)是pandas的一项重要功能,它使你能在一个轴上拥有多个(两个以上)索引级别。抽象点说,它使你能以低维度形式处理高维度数据。

以下图为例,这里有两个索引级别,level 0 表示第一个索引级别,level 1 表示第二个索引级别。组合各个索引级别上的标签则可以构成一个索引项,例如 (‘bar’, ‘one’)、(‘foo’, ‘two’) 等。

Read More

Pandas 索引方法

Pandas

索引返回的是复制还是视图

loc 方法

loc 方法是纯基于轴标签的索引方法,即使传入的是参数是数字类型,也会被用于和索引值进行比对,而不是索引位置。可以是以下:

Read More

Pandas IO 工具

Pandas 提供了很多用于将表格型数据读取为 DataFrame 对象的函数,下表列举出了其中一些常用的函数及其说明。其中一些函数,比如pandas.read_csv,有类型推断功能,因为列数据的类型不属于数据类型。也就是说,你不需要指定列的类型到底是数值、整数、布尔值,还是字符串。其它的数据格式,如 HDF5、Feather 和 msgpack,会在格式中存储数据类型。

Read More

Pandas 数据结构

Pandas 中最基本的数据类型包括 Series、DataFrame 和 Index:

  • Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。
  • DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等),但同一列中的数据类型相同。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。

Read More

搭建 Hexo 部署服务器

前言

为了方便地对日常工作中遇到的问题进行分析、总结,我在本地使用 Hexo 博客框架以及 Wixo 主题搭建了一个 Wiki 进行记录和查询。然而由于本地的 Windows 机器经常会自动更新重启,导致 Wiki 挂掉,同时也不方便分享给别人,因此想尝试将其部署到远程服务器上,并且可以通过 hexo deploy 命令快捷地进行部署更新,实现类似 GitHub Pages 的效果。

Read More