提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:鲍佳佳|2021-03-04 10:40:31.320|阅读 134 次
概述:当您开始使用Python进行数据分析和数据科学时,Pandas是您将学习的第一个库之一。其可帮助您处理数据集,转换和清理数据以及获取统计信息。在本教程中,我们将回答人们在使用熊猫时遇到的10个最常见的问题。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
相关链接:
PyCharm是一种Python IDE,其带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具。此外,该IDE提供了一些高级功能,以用于Django框架下的专业Web开发。PyCharm现已加入在线订购,点击此处了解价格详情。
Pandas教程:Python数据框架的10个常见问题
当您开始使用Python进行数据分析和数据科学时,Pandas是您将学习的第一个库之一。其可帮助您处理数据集,转换和清理数据以及获取统计信息。
在本教程中,我们将回答人们在使用熊猫时遇到的10个最常见的问题。
数据集
在本教程的第一部分中,我们将使用包含城市人口样本数据以及有关土地面积和人口密度的一些信息的数据集。
Pandas Loc和iloc
pandas.loc[] 有助于通过标签或布尔数组切片访问一组行和列。
让我们选择墨西哥城的人口。
下面我们仅打印墨西哥城的人口。
使用,.iloc[]您可以使用数字整数索引选择列。
请记住以下几点:
重命名列
接下来,我们将重命名这些列,以使它们将来更易于访问。
有几种方法可以做到这一点:
在pandas DataFrame中选择多个列
让我们将DataFrame分为两个包含以下内容的DataFrame:
我们可以通过几种方式做到这一点:
熊猫按列合并两个表
接下来,我们将垂直连接我们创建的两个表。这些表具有相同的City列,因此我们将使用该pd.merge函数来连接两个表。
该left_on和right_on参数指示列名在第一和第二个表合并上。
使用pandas更改pandas中的列类型
与数据帧的工作进一步,我们需要转变Population,Area以及Density从字符串列转换为数字。
为此,我们将:
分组并变成一个DataFrame
现在,让我们对DataFrame进行分组,Country并计算此数据样本中每个国家/地区的人口。
困难之pd.groupby处在于它返回一个groupby对象,而不是DataFrame。在下面的示例中,我们将展示如何从groupby对象创建DataFrame。
我们将对进行分组Country,同时计算Population和Area列的总和。我们将删除密度列,因为我们不再需要它。
如何在Pandas中的DataFrame中的行上进行迭代
尽管遍历行可能不是最快的解决方案,但有时仍然可以派上用场。您可以使用循环.iterrows()功能来做到这一点。
考虑尝试对applyPandas DataFrame的函数或向量化表示执行相同的操作。在大型数据集上,这将提高计算速度。
在下面,我们将Population列除以1000,并以千为单位获得人口数。下面有3个替代代码示例。
如何根据列值从DataFrame中选择行
让我们选择人口超过1000万人,面积不到2000平方公里的国家。
您可以通过在中输入逻辑约束来做到这一点[]。
如何更改DataFrame列的顺序
您可以简单地通过以不同顺序切片现有的DataFrame来做到这一点。
用Pandas清理数据
要开始使用数据,您需要清理数据。
首先的基本步骤是:
让我们下载带有网球比赛结果的数据集。
我们将降大任于重复使用pd.drop_duplicates,以inplace = True将更改应用到数据帧。
现在,让我们找出DataFrame中是否存在NaN值。
df.isna().any() 当该列包含NaN值时为True。
在此minutes列中,我们具有91%的NaN值,因此将其删除,因为它不包含任何有用的信息。
在winner_age,loser_age,loser_rank,和winner_rank列没有太多的NaN值,所以我们会用中位数代替NaN值。
有了df.describe我们,我们可以获得有关数字列数据的统计信息。
这就是我们的Pandas教程。你学会了吗?立即下载体验吧!您有任何疑问或意见欢迎评论!
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn
文章转载自:本文探讨 SQL Server 中 NULL 和空值之间的区别,并讨论如何有效地处理它们。
Unity 是一款功能极其丰富的游戏引擎,允许开发人员将各种媒体集成到他们的项目中。但是,它缺少最令人兴奋的功能之一 - 将 Web 内容(例如 HTML、CSS 和 JavaScript)直接渲染到 3D 场景中的纹理上的能力。在本文中,我们将介绍如何使用 DotNetBrowser 在 Unity3D 中将 Web 内容渲染为纹理。
DevExpress v24.2帮助文档正式发布上线了,请按版本按需下载~
本教程将向您展示如何用MyEclipse构建一个Web项目,欢迎下载最新版IDE体验!
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@cahobeh.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢