[Python] pandas_profiling DataFrame 详细资料分析视觉化

大家使用Pandas DataFrame分析不外乎就是使用内建的describe(),如果要其他分析就需要再手动进行,再利用绘图package视觉化。

今天分享一个好用套件,pandas-profiling 能够使用DataFrame自动生成详细的数据报告,其中包括Dataset基本资讯、变数型态、栏位警告(常数、相依)、变数分析(统计、分布、极值),比起Describe 要详细许多。

快速安装
pip install pandas-profiling

以sklearn 的波士顿房价资料为例

载入所需套件

import pandas as pdimport matplotlib.pyplot as pltimport pandas_profiling as pdppd.set_option('display.max_columns', 500)

载入资料,并利用pandas_profiling 进行详细分析

from sklearn.datasets import load_bostondata = load_boston()df_boston = pd.DataFrame(data = data.data , columns= data.feature_names)pdp.ProfileReport(df_boston)

也可以将report 档案汇成html

pfr = pdp.ProfileReport(df_boston)pfr.to_file('report.html')

关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章