yyhhyy
yyhhyy
Nice to meet you~ 😃
首页
大模型学习
Langchain-Chatchat
DB-GPT
文章
归档
分类
标签
Tools
About
首页
大模型学习
Langchain-Chatchat
DB-GPT
文章
归档
分类
标签
Tools
About
最新文章
5.9 高级处理-合并
文章介绍了在数据分析中使用`pd.concat`和`pd.merge`进行数据合并的方法。`pd.concat`可以按行或列合并数据,`pd.merge`则支持多种连接方式(如内连接、左连接、右连接和外连接),并允许指定连接的键值。这些方法适用于多表数据的合并与分析,帮助用户更高效地处理复杂数据集。
pandas
51
0
0
2023-06-09
5.8 高级处理-数据离散化
数据离散化是将连续属性值划分为若干离散区间的过程,旨在简化数据结构并减少属性值的数量。通过使用`cut`和`qcut`工具,可以实现数据的区间分组,而`get_dummies`则用于生成one-hot编码矩阵。离散化方法在数据挖掘中广泛应用,例如将股票涨跌幅数据分组并转换为哑变量矩阵,便于进一步分析。
pandas
24
0
0
2023-06-09
5.7 高级处理-缺失值处理
本文介绍了在数据处理中如何处理缺失值,包括使用isnull和notnull判断缺失值的存在,通过dropna删除缺失值,使用fillna填充缺失值,以及利用replace替换特定值。文章还详细说明了如何处理标记为NaN的缺失值,以及如何处理非NaN标记的缺失值,如将“?”替换为NaN后再进行处理。最后,文章总结了判断、删除、填充和替换缺失值的基本方法。
pandas
57
0
0
2023-06-09
5.6 文件读取与存储
文章介绍了Pandas库中文件读取与存储的操作,重点讲解了CSV、HDF5和JSON三种格式的使用方法。通过示例代码展示了如何读取和存储CSV文件,并详细说明了HDF5文件的压缩存储优势及其跨平台特性。此外,文章还探讨了JSON格式的读取与存储,特别是如何通过指定`orient`和`lines`参数来处理JSON数据。HDF5因其高效压缩和跨平台特性被推荐为优先选择的存储格式。
pandas
74
0
0
2023-06-09
5.5 Pandas画图
5.5 Pandas画图介绍了如何使用Pandas库中的DataFrame和Series进行数据可视化。通过学习,可以掌握DataFrame.plot和Series.plot函数的使用方法,了解不同图形类型的绘制,如折线图、柱状图、水平柱状图、直方图、饼图和散点图。默认图形类型为折线图,用户可以通过指定kind参数选择其他图形类型。更多详细信息和示例可参考官方文档链接。
pandas
75
0
0
2023-06-09
5.4 DataFrame运算
本文介绍了DataFrame的多种运算方法,包括算术运算、逻辑运算、统计运算和自定义运算。算术运算涉及add和sub等操作,逻辑运算通过逻辑符号和函数如query、isin进行数据筛选。统计运算包括使用describe进行综合分析,以及max、min、mean等函数进行统计计算。自定义运算通过apply函数实现数据的个性化处理。这些方法帮助用户高效处理和分析数据。
pandas
73
0
0
2023-06-09
5.3 基本数据操作
本节介绍了Pandas中DataFrame和Series的基本数据操作,包括索引、赋值和排序。索引操作涵盖直接索引、loc、iloc和ix的使用方法,强调先列后行的索引顺序。赋值操作展示了如何修改DataFrame中的列数据。排序部分详细说明了如何通过sort_values和sort_index对DataFrame和Series进行排序,支持单键或多键排序,并可指定升序或降序。这些操作为数据处理提供了基础工具。
pandas
86
0
0
2023-06-09
5.2 Pandas数据结构
Pandas提供了三种主要数据结构:Series、DataFrame和MultiIndex。Series是一维数组,包含数据和索引;DataFrame是二维表格,具有行和列索引;MultiIndex支持三维数据,允许多级索引。文章详细介绍了如何创建和操作这些数据结构,包括索引设置、属性访问和数据展示方法。
pandas
56
0
0
2023-06-09
5.1Pandas介绍
Pandas是一个由Wes McKinney于2008年开发的开源Python库,专门用于数据挖掘。它以Numpy为基础,结合了Numpy的高性能计算能力和Matplotlib的绘图功能,提供了独特的数据结构。Pandas的优势包括增强图表可读性、便捷的数据处理能力、方便的文件读取以及封装了Matplotlib和Numpy的画图和计算功能。相比Numpy,Pandas在处理和展示数据时更具可读性和易用性。
pandas
78
0
0
2023-06-09
数组间运算
数组间运算涉及数组与数、数组与数组之间的操作,重点在于理解广播机制。广播机制允许形状不同的数组进行运算,通过扩展维度小的数组使其与维度大的数组形状匹配。常见的运算包括加、减、乘、除等,矩阵乘法可通过 `np.matmul` 和 `np.dot` 实现,两者在矢量运算中无区别。
numpy
28
0
0
2023-06-09
上一页
下一页