Python 数据分析与展示笔记目录

python数据分析与展示 – 第三周/单元八/Pandas数据特征分析

和单元七一样,直接从课件中整理笔记。

数据排序

  • .sort_index()方法在指定轴上根据索引进行排序,默认升序
    • .sort_index(axis=0, ascending=True)
    • For DataFrame, first argument is some index or columns by which data is sorted.
    • NaN统一放在排序末尾

Continue reading “python数据分析与展示 – 第三周/单元八/Pandas数据特征分析”

python数据分析与展示 – 第二周/单元六/实例2:引力波的绘制

English Version: No translation yet

产生时间序列

从配置文档中读取时间相关数据

Continue reading “python数据分析与展示 – 第二周/单元六/实例2:引力波的绘制”

python数据分析与展示 – 第二周/单元五/Matplotlib基础绘图函数示例

English Version: No translation yet

pyplot基础图表函数概述

函数 说明
plt.plot(x,y,fmt,…) 绘制一个坐标图
plt.boxplot(data,notch,position) 绘制一个箱型图
plt.bar(left,height,width,bottom) 绘制一个条形图
plt.barh(width,bottom,left,height) 绘制一个横向条形图
plt.polar(theta,r) 绘制极坐标图
plt.pie(data,explode) 绘制饼图
plt.psd(x,NFFT=256,pad_to,Fs) 绘制功率谱密度图
plt.specgram(x, NFFT=256,pad_to,F) 绘制谱图
plt.cohere(x,y,NFFT=256,Fs) 绘制X-Y的相关性函数
plt.scatter(x,y) 绘制散点图,其中,x和y长度相同
plt.step(x,y,where) 绘制步阶图
plt.hist(x,bins,normed) 绘制直方图
plt.contour(X,Y,Z,N) 绘制等值图
plt.vlines() 绘制垂直图
plt.stem(x,y,linefmt,markerfmt) 绘制柴火图
plt.plot_date() 绘制数据日期

Continue reading “python数据分析与展示 – 第二周/单元五/Matplotlib基础绘图函数示例”

python数据分析与展示 – 第二周/单元四/Matplotlib库入门

English Version: No translation yet

介绍

  • 可视化数据
  • 效果: http://matplotlib.org/gallery.html
  • 使用
    • 由各种可视化类构成,内部结构复杂,受Matlab启发
    • matplotlib.pyplot是绘制各类可视化图形的命令子库,相当于快捷方式
      import matplotlib.pyplot as plt
  • 示例在Spyder中使用,编写代码后F5运行

Continue reading “python数据分析与展示 – 第二周/单元四/Matplotlib库入门”

python数据分析与展示 – 第一周/单元三/实例1:图像的手绘效果

English Version: https://today2tmr.com/en/2017/08/29/hand-drawing-effect/

图像的数组表示

  • RGB,每个像素点由红绿蓝组成
  • 每个颜色通道取值为0-255

PIL库

  • Python Image Library
  • 第三方库,需要安装
  • pip install pillow
  • from PIL import Image
  • Image类为基础类,一个对象即代表一个图像
  • 图像是由像素组成的二维矩阵,每个元素为RGB值

  • 三维数组,高度、宽度和RBG值

Continue reading “python数据分析与展示 – 第一周/单元三/实例1:图像的手绘效果”

python数据分析与展示 – 第一周/单元二/numpy数据存取与函数

English Version: https://today2tmr.com/en/2017/08/29/python-data-storage-and-functions/

数据的CSV文件存取

  • CSV(Comma-Separated Value,逗号分隔值)文件
  • CSV是一种常见的文件格式,用来存储批量数据。
  • 存取一维、二维数据

写入CSV

  • np.savetxt(frame, array, fmt='%.18e', delimiter=None)
    • frame: 文件、字符串或产生器,可以是.gz或.bz2的压缩文件。
    • array: 存入文件的数组。
    • fmt: 写入文件的格式,例如:%d, %2.f, %.18e
    • delimiter: 分隔字符串,默认是任何空格,CSV中为逗号


     

Continue reading “python数据分析与展示 – 第一周/单元二/numpy数据存取与函数”

python数据分析与展示 – 第一周/单元一/NumPy库入门

English Version: https://today2tmr.com/en/2017/08/16/python-data-unit-one/

数据的维度

  • 一组数据的组织形式,表达特定关系
  • 一维数据 -> 对等关系 -> 列表/数组/集合等
    • 列表和数组:一组数据的有序结构
      • 列表: 数据类型可以不同
      • 数组: 数据类型相同
  • 二维数据 -> 一维数据的组合形式
    • 多维列表
  • 多维数据 -> 一维或二维数据在新维度上扩展(如时间)
    • 多维列表
  • 高维数据 -> 仅利用最基本的二元关系展示数据间的复杂结构 -> 用键值对组织(如Json)
    • 字典或数据表示格式(Json/XML/YAML)

Continue reading “python数据分析与展示 – 第一周/单元一/NumPy库入门”

python数据分析与展示 第〇周 数据分析的前奏

English Version: https://today2tmr.com/en/2017/08/16/python-data-week-zero/

课堂主页:http://www.icourse163.org/course/0809BIT021B-1001870002

导学

介绍

  • 掌握表示、清晰、统计和展示数据的能力
  • Numpy ndarray
  • Matplotlib pyplot
  • Pandas series DataFrame
  • 一个数据,一个含义
  • 一组数据,表达一个或多个含义
  • 如何理解一组数据表达的含义
  • 摘要:有损地提取数据特征的过程
    • 基本统计(含排序)
    • 分布/累计统计
    • 数据特征
      • 相关性,周期性等
    • 数据挖掘(形成知识)

工具

  • Anaconada IDE集成开发工具
  • conda Spyder IPython

Continue reading “python数据分析与展示 第〇周 数据分析的前奏”