服务热线:

021-51085186

021-51085186
2015-04-09

如何对互联网金融数据进行数据挖掘?

您现在的位置:首页 » 文章中心 » 行业动态

     首先,不要被「大数据」这三个字迷惑到,数据挖掘就是数据挖掘,弄再好听的词也是从大量数据中发掘隐含规律。

     其次,数据挖掘最重要的是知道要分析挖掘什么,只有知道了目的,才能够根据目的选择合适的算法。至于是不是互联网金融数据,这个都不是要点,因为互联网金融数据也是数据,最后都会依据数据本身的特征选择相应算法。

    下面,是时候祭出这张经典的图了。

 

    从另一个方面说,只有知道了上面各种方法的特性,才能够将合适的算法与合适的数据对应上。

    所以,回答你的问题「请问如何将数据挖掘技术应用与互联网金融?」,一共有三步:

    弄清楚行业数据的特征,在你的预设下,也就是互联网金融;

    搞清楚常用数据挖掘算法的适用范围;

    将两者配对。

    当然了,上面也就是说个大概,你还会花很多时间清洗数据,根据行业知识选择合适的特征,然后分析出结果之后要进行可视化,做 slides 将你的结果呈现给你的老板,以及中间无数次的推倒重来。这些花的时间大概占整个流程的 80% 吧,反倒是中间分析的过程只会占 20% 甚至更少的时间。

   有人如果把上面的步骤都做全了,那么这个人肯定不会再费尽心思把整个流程告诉你,因为一来数据清洗啊什么的是很「蓝领」的活,跟「大数据」这么高大上的概念配不上,自然也就选择不说;二来金融数据或多或少都会涉及商业机密吧;三来,既然都分析出来了,那么得到的要么是价值连城的别人都没发现的规律,那么自然马上会用来赚钱,哪有时间跟你分享,要么得到的是垃圾,那也就灰头土脸的去接着回去改算法了。