四、数据分析:
1、数据分析具有极广泛的应用,典型的数据分析可能包含以下三步:
(1)搜索性数据分析:当数据刚取得时,可能杂乱无章,看不出规律,通过作图,造表,用各种形式的方程拟合,计算某些特征量等手段探寻规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性
(2)模型选定分析:在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型
(3)推断分析:通常使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断
2、数据分析主要包括:
(1)简单的数学运算(Simple Math)
(2)统计(Statistics)
(3)快速傅里叶变换(FFT)
(4)平滑和滤波(Smoothing and Filtering)
(5)基线和峰值分析(Baseline and Peak Analysis)
3、scatter():散点图
k-means算法/k均值算法(聚类算法中典型算法)
k-means算法也称为k均值算法。K-means算法以k为参数,把n个对象分成k个簇,使簇内具有较高的相似度,而簇间的相似度较低。
(1)随机选取k个聚类中心 k=3(分为几类:)可以随机产生三个坐标 聚类公式(欧式定理)d=(x1-x2)*(x1-x2)+(y1-y2)*(y1-y2)开根号
(2)做分类
因为:da1
4、KNN最近邻算法原理:
(1)计算已知类别数据集中的点与当前点之间的距离;
(2)按照距离递增次序排序;
(3)选择与当前距离最小的K个点;
(4)确定前k个点所在类别的出现概率;
(5)返回前k个点出现频率最高的类别作为当前点的预测分类;
五、python面向对象设计
概括知识点如下:
(1)初始化将需要的属性赋予它;
(2)在python中,构造函数称为初始化函数。
(3)简易网络爬虫原理与设计
相关推荐:
>>本文地址:https://www.ujiuye.com/dxs/2018/45187.html
声明:本站稿件版权均属中公教育优就业所有,未经许可不得擅自转载。
1 您的年龄
2 您的学历
3 您更想做哪个方向的工作?