算法得出的三个方框形便是聚类中心质点,能够看到他们消费周期差不多,但是蓝色消费金额最高,所以说他那一簇就是超级VIP。绿色则是VIP。
另外还有近邻算法(KNN),算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。我们的应用场景是影片分类,先进行维度的距离求值,然后排序,然后取最近的几个样本,频率最高的类型就是该影片所属的类型。
算法在处理数据时可以让我们更加便捷,更能够准确判断出数据给我们的提示。从而做出正确的判断,在这个大数据时代,对数据敏感很重要,而这个敏感更多的是需要算法来帮助我们理解数据。
最后是网络爬虫,所谓爬虫,就是通过代码下载网上我们需要的信息。其实也很简单,说起来不过就是,打开网页,读取数据,筛选数据。但是实现还是需要一定动手能力的,因为网络的原因,这次我们还用python提供的WSGI接口供我们开启本地服务器,能和真正上网一样测试我们的爬虫。但是很遗憾,以为版本问题,我的服务器使用程序开启的时候出现了问题,但是在2.x版本时刻一正常运行的。但是我也自学了一个更简单的爬虫语句,那就是 you-get ,这句代码能轻松下载我们需要的视频信息等。更为简单方便,除此,还有很多的爬虫框架我们要可以使用,以后还有机会再去深入研究。
在最后,通过半个月的实习,学到了很多东西,掌握了基本的python语言,主要是发现这门语言似乎很适合我,激发了自己极大的兴趣,学到了一些算法的思维,以及加强了逻辑思维的学习,学会了如何把问题分割解决等等。也了解到了未来的人工智能发展,未来是个智慧的城市,我们赋予机器智能,是我们智慧的结晶。
最后,要感谢师傅和同事在这段时间的帮助,让我们在这里轻松地实习,在这里学到知识,开阔自己的眼界。
相关推荐:
>>本文地址:https://www.ujiuye.com/dxs/2018/44796.html
声明:本站稿件版权均属中公教育优就业所有,未经许可不得擅自转载。
1 您的年龄
2 您的学历
3 您更想做哪个方向的工作?