利用Python进行数据分析

时间:2022-08-09 10:50:18 来源:网友投稿

下面是小编为大家整理的利用Python进行数据分析,供大家参考。

利用Python进行数据分析

 

 利用Python进行数据分析python_for_data_analysis-文前.indd

  12013.10.21

  11:00:27 AM

 利用Python进行数据分析Wes McKinney 著

 唐学韬 等译机械工业出版社O’Reilly Media, Inc.授权机械工业出版社出版Beijing

 •

 Cambridge

 •

 Farnham

 •

 Köln

 •

 Sebastopol

 •

 Tokyo

  python_for_data_analysis-文前.indd

  22013.10.21

  11:00:28 AM

 图书在版编目(CIP)数据利用Python进行数据分析 /(美)麦金尼(McKinney, W.)著;唐学韬等译. —北京:机械工业出版社,2013.9(O’Reilly精品图书系列)书名原文:Python for Data AnalysisISBN 978-7-111-43673-7I. 利…

  II. ①麦… ②唐…

  III.①统计分析-应用软件

 IV. C819中国版本图书馆CIP数据核字(2013)第187885号北京市版权局著作权合同登记图字:01-2013-4246号Copyright © 2013 by Wes McKinney.Simplified Chinese Edition, jointly published by O’Reilly Media, Inc. and China Machine Press, 2013. Authorized translation of the English edition, 2013 O’Reilly Media, Inc., the owner of all rights to publish and sell the same. All rights reserved including the rights of reproduction in whole or in part in any form.英文原版由O’Reilly Media, Inc. 出版2013。简体中文版由机械工业出版社出版 2013。英文原版的翻译得到O’Reilly Media, Inc.的授权。此简体中文版的出版和销售得到出版权和销售权的所有者 —— O’Reilly Media, Inc.的许可。版权所有,未得书面许可,本书的任何部分和全部不得以任何形式重制。封底无防伪标均为盗版本书法律顾问北京市展达律师事务所书 名/ 利用Python进行数据分析书 号/ ISBN 978-7-111-43673-7责任编辑/ 秦健封面设计/ Karen Montgomery,张健出版发行/ 机械工业出版社地 址/ 北京市西城区百万庄大街22号(邮政编码 100037)印 刷/ 开 本/ 178毫米×233毫米

 16开本

  29印张

 版 次/ 2014年1月第1版

 2014年1月第1次印刷定 价/ 89.00元(册)凡购本书,如有缺页、倒页、脱页,由本社发行部调换客服热线:(010)88378991;88361066购书热线:(010)68326294;88379649;68995259投稿热线:(010)88379604读者信箱:hzjsj@hzbook.compython_for_data_analysis-文前.indd

  32013.10.21

  11:00:28 AM

 O’Reilly Media, Inc.介绍O’Reilly Media通过图书、杂志、在线服务、调查研究和会议等方式传播创新知识。自1978年开始,O’Reilly一直都是前沿发展的见证者和推动者。超级极客们正在开创着未来,而我们关注真正重要的技术趋势——通过放大那些“细微的信号”来刺激社会对新科技的应用。作为技术社区中活跃的参与者,O’Reilly的发展充满了对创新的倡导、创造和发扬光大。O’Reilly为软件开发人员带来革命性的“动物书”;创建第一个商业网站(GNN);组织了影响深远的开放源代码峰会,以至于开源软件运动以此命名;创立了Make杂志,从而成为DIY革命的主要先锋;公司一如既往地通过多种形式缔结信息与人的纽带。O’Reilly的会议和峰会集聚了众多超级极客和高瞻远瞩的商业领袖,共同描绘出开创新产业的革命性思想。作为技术人士获取信息的选择,O’Reilly现在还将先锋专家的知识传递给普通的计算机用户。无论是通过书籍出版,在线服务或者面授课程,每一项O’Reilly的产品都反映了公司不可动摇的理念——信息是激发创新的力量。业界评论“O’Reilly Radar博客有口皆碑。”——Wired“O’Reilly凭借一系列(真希望当初我也想到了)非凡想法建立了数百万美元的业务。”——Business 2.0“O’Reilly Conference是聚集关键思想领袖的绝对典范。”——CRN“一本O’Reilly的书就代表一个有用、有前途、需要学习的主题。”——Irish Times“Tim是位特立独行的商人,他不光放眼于最长远、最广阔的视野并且切实地按照Yogi Berra的建议去做了:‘如果你在路上遇到岔路口,走小路(岔路)。’回顾过去Tim似乎每一次都选择了小路,而且有几次都是一闪即逝的机会,尽管大路也不错。”——Linux Journalormintro.indd

  12013.10.21

  11:01:28 AM

 说句真心话,我非常感谢有机会翻译这本书,所以这可算是第一篇我自己真正想写的译者序。虽然之前也翻译过好几本书,但都没有这次的感悟这么多、这么深!这本书是我花精力和时间最多,同时也是最不满意的一本,就是因为这些感悟 —— 我始终觉得,如果再多点时间的话,我还可以翻译得更好。本书的内容非常好,至少有一点非常好 —— 集中火力对付特定的应用领域。市面上介绍编程的书多如牛毛,但几乎没有几本书是针对特定应用场景的。这本书对新手来说绝对是福音,因为每看完一点就可以马上将自己手上的工作直接拿来当例子练手,这种立竿见影的学习效果,绝对会增强新手的学习信心。本书内容虽好,但由于作者是编辑界牛人,平时的工作肯定不少,写书方面的精力自然就不可能太多。加之美式英语本来就很口语化,导致原书口水话非常多,有些地方的从句跟绕口令似的。我在翻译的过程中尽量排除了一些,两次校稿的过程中又删除或大幅修改了一些废话,虽然这种“口水话”还存在不少,但至少不会对阅读造成太大影响。如果实在觉得语言不通顺,请随时发邮件给我,欢迎大家的善意指导(tonytang1999@126.com)。此外,在翻译的过程中发现了不少小问题,用词方面的错误几乎都是直接改的(小部分写了译者注,因为编辑要求我尽量标出一些来以便核对),而其他错误则几乎全部采用译者注的形式说明,还有一些原文有歧义或不详尽的地方也通过译者注的形式给出了简单 说明。本书共12章,除非你已经什么都会了,否则我建议全部阅读。如果没有学过Python,建议先看看本书后面的附录。本书所用到的Python编程基础知识很少,所以只看那个附录完全 译者序python_for_data_analysis-译者序.indd

  12013.10.11

  1:42:18 PM

 足够了。但是,如果你一点儿编程基础都没有的话,可能需要再看一本有关Python入门的书才行(比如《Python编程实践》编注1)。对了,还有几件事情需要说明一下:每章的代码示例最好在一个IPython会话中完成,否则可能会出现一些不必要的麻 •烦,比如“xxx未定义”。如果在Windows里面用IPython,复制代码的时候建议使用cpaste,这个不多解释了。

 •有关地图的那段代码可能需要找英文资料看才行,我在译者注中也说明了。这可能 •需要花不少时间和精力。由于原文各种说法不统一(甚至包括术语),虽然我尽量做了统一处理,但由于 •精力和时间有限,无法完全修改,所以译文中的“xxx接受yyy”、“将yyy传入xxx”说的都是“xxx函数有yyy这么个参数”;“选项”、“位置参数”、“关键字参数”、“形参”、“实参”说的都是“参数”……还有不少,我也记不清了。“金融和经济数据”那一章翻译得非常痛苦,因为我根本不了解那个行业,原文 •的术语又不标准,于是我基本都是用wikipedia和bing查英文资料,看懂之后再到baidu找中文资料,并最终确定译文。因此,可能会有不准确的情况,如果您发现了,请及时通过邮件告诉我,万分感谢。此外,我必须感谢华章公司的编辑们。非常感谢他们能够给我这样的机会,也非常感谢他们在整个过程中给予我的各种支持和理解。希望以后还能有更加愉快的合作。本书大部分内容的翻译工作以及全书的统稿工作由我完成,参与本书翻译校对工作的还有黄惠庄、卢彦良、蒲巧惠、陈丽丽、胡元江、张杨、赵杰、吴斌、郭敏、林丹、王跃等。由于译者水平有限,书中肯定会存在一些错误或不妥之处,因此,在阅读过程中发现有任何问题,请随时联系我们(tonytang1999@126.com)或机械工业出版社,我们将及时更新本书的勘误表。当然,也非常欢迎大家对本书提出宝贵的意见和建议。唐学韬2013年6月于广州编注1:本书已由机械工业出版社出版,ISBN:978-7-111-36478-8。python_for_data_analysis-译者序.indd

  22013.10.11

  1:42:19 PM

 i目录前言 ...............................................................................1第1章 准备工作 ..............................................................5本书主要内容 ..........................................................................................................5为什么要使用Python进行数据分析 .........................................................................6重要的Python库 .......................................................................................................7安装和设置 ............................................................................................................10社区和研讨会 ........................................................................................................16使用本书 ...............................................................................................................16致谢 .......................................................................................................................18第2章 引言 ...................................................................20来自bit.ly的1.usa.gov数据 .....................................................................................21MovieLens 1M数据集 ............................................................................................291880—2010年间全美婴儿姓名 ..............................................................................35小结及展望 ............................................................................................................47第3章 IPython:一种交互式计算和开发环境 ..................48IPython基础 ...........................................................................................................49内省 .......................................................................................................................51使用命令历史 ........................................................................................................60python_for_data_analysis-table.indd

  12013.10.11

  1:43:11 PM

 ii

  |

  目录与操作系统交互 ....................................................................................................63软件开发工具 ........................................................................................................66IPython HTML Notebook .......................................................................................75利用IPython提高代码开发效率的几点提示 ..........................................................77高级IPython功能 ...................................................................................................79致谢 .......................................................................................................................81第4章 NumPy基础:数组和矢量计算 .............................82NumPy的ndarray:一种多维数组对象 ..................................................................83通用函数:快速的元素级数组函数 ......................................................................98利用数组进行数据处理 .......................................................................................100用于数组的文件输入输出 ...................................................................................107线性代数 .............................................................................................................109随机数生成 ..........................................................................................................111范例:随机漫步 ..................................................................................................112第5章 pandas入门 ...................................................... 115pandas的数据结构介绍 ........................................................................................116基本功能 .............................................................................................................126汇总和计算描述统计 ...........................................................................................142处理缺失数据 ......................................................................................................148层次化索引 ..................................................

推荐访问:python数据分析心得体会 利用Python进行数据分析 利用 分析 数据

版权所有:聚席文档网 2017-2024 未经授权禁止复制或建立镜像[聚席文档网]所有资源完全免费共享

Powered by 聚席文档网 © All Rights Reserved.。 沪ICP备17057996号-1