【Python工具包/库推荐系列】- Pandas(数据处理)
有大量的Python软件包设计用于处理复杂的数据集。但是可以说,Pandas是最重要的。Pandas可以帮助您处理和分析大量数据,而无需学习专门的数据处理语言(例如R)。Pandas有其局限性,因为它不适合用于高级统计建模(在这种情况下,您可能想学习R或使用statsmodels之类的Python包)。但是,如果您需要执行诸如处理时间序列数据或对数据集进行统计分析之类的工作,Pandas可以为您服务。[code]
In [5]: dates = pd.date_range("20130101", periods=6)
In [6]: dates
Out[6]:
DatetimeIndex(['2013-01-01', '2013-01-02', '2013-01-03', '2013-01-04',
'2013-01-05', '2013-01-06'],
dtype='datetime64[ns]', freq='D')
In [7]: df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list("ABCD"))
In [8]: df
Out[8]:
A B C D
2013-01-01 0.469112 -0.282863 -1.509059 -1.135632
2013-01-02 1.212112 -0.173215 0.119209 -1.044236
2013-01-03 -0.861849 -2.104569 -0.494929 1.071804
2013-01-04 0.721555 -0.706771 -1.039575 0.271860
2013-01-05 -0.424972 0.567020 0.276232 -1.087401
2013-01-06 -0.673690 0.113648 -1.478427 0.524988
[/code] 【Python工具包/库推荐系列】- Pandas专栏:[url]http://qhlt.club/forum-1078-1.html[/url]
页:
[1]