yyhhyy's blog

yyhhyy

最新文章

5.7 高级处理-缺失值处理

本文介绍了处理数据中缺失值的高级方法,包括使用isnull和notnull判断缺失值,fillna填充缺失值,dropna删除缺失值,以及replace替换特定值。通过实际案例展示了如何处理电影数据中的缺失值,并讨论了非NaN标记缺失值的处理方法。
51
0
0
2023-06-09

5.6 文件读取与存储

Pandas支持多种文件格式的读取和存储,包括CSV、HDF5和JSON。CSV文件通过`read_csv`和`to_csv`函数进行读写,HDF5文件使用`read_hdf`和`to_hdf`,而JSON文件则通过`read_json`和`to_json`。HDF5文件支持压缩,适合大数据存储和跨平台迁移。JSON文件读取时需指定格式(如'records'),并可选择按行读取。
64
0
0
2023-06-09

5.5 Pandas画图

本文介绍了Pandas库中的画图功能,包括DataFrame和Series的画图函数。DataFrame.plot()支持多种图表类型,如线图、柱状图、直方图、饼图和散点图。Series.plot()提供了对Series数据绘图的详细说明。
73
0
0
2023-06-09

5.4 DataFrame运算

本文介绍了如何使用Pandas进行DataFrame运算,包括算术运算(如加法和减法)、逻辑运算(如筛选和查询)、统计运算(如描述性统计、最大值、最小值、中位数等)以及自定义运算。通过示例代码展示了如何应用这些运算函数来处理和分析数据。
63
0
0
2023-06-09

5.3 基本数据操作

文章介绍了Pandas中的基本数据操作,包括索引操作、赋值操作和排序。索引操作涵盖了直接使用行列索引、结合loc或iloc使用索引以及使用ix组合索引。赋值操作展示了如何对DataFrame中的列进行重新赋值。排序部分则讲解了如何使用sort_values和sort_index对DataFrame和Series进行排序。
76
0
0
2023-06-09

5.2 Pandas数据结构

Pandas提供了三种主要数据结构:Series、DataFrame和MultiIndex。Series是一维数据结构,包含数据和索引;DataFrame是二维表格型数据结构,具有行和列索引。MultiIndex是三维数据结构,支持多级索引。文章详细介绍了这些数据结构的创建方法和属性,如Series的创建和索引操作,DataFrame的行列索引设置和属性访问,以及MultiIndex的多级索引功能。
48
0
0
2023-06-09

5.1Pandas介绍

Pandas是一个于2008年由Wes McKinney开发的数据挖掘开源Python库,基于Numpy并利用其高性能计算优势。它不仅简化了数据展示,增强了图表可读性,还提供了便捷的数据处理能力,方便文件读取,并封装了Matplotlib和Numpy的绘图与计算功能。
68
0
0
2023-06-09

数组间运算

文章介绍了数组间运算的基本概念,包括数组与数的运算、数组与数组的运算以及广播机制。广播机制允许形状不同的数组进行运算,通过扩展维度使数组的形状相等。文章还提到了矩阵乘法的API,如np.matmul和np.dot,并解释了它们的区别。
20
0
0
2023-06-09

ndarray运算

文章介绍了ndarray运算的基本操作,包括逻辑运算、通用判断函数和统计运算。通过示例展示了如何使用np.where进行三元运算,以及如何应用np.all()和np.any()进行条件判断。此外,还介绍了常用的统计函数如np.max()、np.min()、np.mean()等,并展示了如何在ndarray中进行数据统计和分析。
73
0
0
2023-06-09

Numpy基本操作

本文介绍了Numpy的基本操作,包括数组的生成、索引、维度变换、类型变换和转换。重点讲解了生成0和1的数组、从现有数组生成、生成固定范围的数组以及生成随机数组的方法。此外,还讨论了正态分布和均匀分布的生成方式,并通过实例展示了如何生成符合特定分布的数组数据。
85
0
0
2023-06-09