简介:数据分析作为一种常见技能,越来越多地应用于各种工作中。归根结底,掌握数据分析可以让您形成数据驱动的视角并利用大数据思维,同时提高业务响应能力。思考各种问题。
作者:老A
如需转载,请联系华章科技。
Excel 数据透视表无疑是数据分析的一项基本技能。数据透视表可以让您轻松了解不同类型数据的直观特征,并从更高的角度看待它们。对于高级步骤,Excel 的内置函数、各种插件和VBA 也是很棒的工具。
但是,如果你的数据量很大,在Excel中打开需要很长时间,或者打开文件时电脑死机,那么它就不适合用作办公工具,或者如果你想进一步提高功能很完美。您需要学习一些重要的技能,例如使用编程语言进行数据分析。
这里有两个主要的思想流派:R 和Python。我个人推荐Python。 Python代码简单、易于理解、易于使用。另一方面,有很多学习资料。对于Python学习材料,我们推荐《利用Python进行数据分析》。本书涵盖了使用Python进行数据清理、数据可视化和分析的技能。你可以把它当作参考书、工具书,或者使用书中的例子。做实际练习。
受这本书的启发,我创建了以下处理Excel的小程序,作为学习数据分析和从Excel检索数据的参考。使用Python 读写Excel 的主要格式包括xlrd、xlwt、xlutils、openpyxl 和xlsxwriterp。具体安装方法可以网上查一下,导入Python使用。
1. xlrd主要是用来读取excel文件
import xlrdworkbook=xlrd.open_workbook(u'Python test.xls'用于数据分析)sheet_names=workbook.sheet_names()forsheet_names: Sheet2=workbook.sheet_by_name(sheet_name) printsheet_name rows=sheet2.row_values(1 ) Column=sheet2.col_values(1) 打印行打印列
2. xlwt主要是用来写excel文件
import xlwtwbk=xlwt.Workbook()sheet=wbk.add_sheet('sheet 1')sheet.write(0,1,'测试文本') # 写入将内容复制到第0行第一列wbk.save('test.xls')
3. xlutils结合xlrd可以达到修改excel文件目的
import xlrdfrom xlutils.copy import copyworkbook=xlrd.open_workbook(u'用于数据分析的Python测试.xls')workbooknew=copy ( workbook)ws=workbooknew.get_sheet(0)ws.write(3, 0, 'changed!')workbooknew.save(u'Python copy.xls'用于数据分析和测试)
4. openpyxl可以对excel文件进行读写操作
from openpyxl import Workbookfrom openpyxl import load_workbookfrom openpyxl .writer.excel import ExcelWriter workbook_=load_workbook(u'Python.xlsx'用于数据分析测试')sheetnames=workbook_.get_sheet_names() printsheetnamessheet=workbook_.get_sheet_by_name(sheetnames[0])printsheet.cell(row=3) , column=3).valuesheet['A1']='47' workbook_.save(u'Python new.xlsx'用于数据分析和测试') wb=Workbook()ws=wb.activews['A1' ]=4wb .save( 'Search.xlsx') 最后介绍一下这本书《利用Python进行数据分析》的内容。本书包含许多实际示例,说明如何使用各种Python库(NumPy、pandas、matplotlib等)。 (例如IPython)有效解决各种数据分析问题。
作者Wes McKinney 是pandas 库的主要作者,因此本书也可以作为使用Python 实现数据密集型应用程序的实用指南。也适合刚接触Python 的分析师和Python 程序员。我是科学计算的初学者。
让IPython(一个交互式shell)成为您的主要开发环境。学习NumPy(数值Python)的基础知识和高级知识。从pandas库中的数据分析工具开始。利用高性能工具加载、清理、转换、合并和重塑数据。使用matplotlib 创建散点图和静态或交互式可视化。使用pandas 的groupby 函数对数据集进行切片、切块和汇总。处理各种时间序列数据。通过详细的案例研究,了解如何解决网络分析、社会科学、金融、经济学等领域的问题。作者简介:老A,项目经理,专业研究兴趣:大数据、计算机软件、通信工程。我个人的爱好是研究建造无人机以及评估和收集银币。本文为“大数据”内容合作伙伴“图书评书团”活动读书笔记,由微信公众号大数据爱好者原创。
扩展读取《利用Python进行数据分析(原书第2版)》
推荐:Python数据分析经典畅销书全新升级,第一本中文版累计销量10万册。针对Python 3.6 进行了全面修订和更新,涵盖了Pandas、NumPy、IPython 和Jupyter 的新版本。
版权声明:本文由今日头条转载,如有侵犯您的版权,请联系本站编辑删除。