连着几天每天都写blog写烦了,词穷,还耽误时间。直接放整理的笔记吧,再说一遍ipython notebook真是好东西啊!

jupyter nbviewer

忽然意识到这样用script标签来加载内容其实很不利于SEO,但是我懒,算了。

作为民科的研究计划

这里连着两篇博文,虽然生成了图表让人很有成就感,但是一直和股票无关,所以我下面打算折腾下和股价相关的东西了,其实已经有了一个想法:论坛发帖数量和股价之间的关系。我是这样想的,在牛市或者熊市正在进行的时候,人们可能会有两种表现:

  1. 发帖会大幅增加,因为难以抑制激动or羡慕嫉妒或者沮丧or幸灾乐祸的心情而导致强烈的倾诉欲
  2. 回帖会大幅增加,因为看到楼主牛逼或者傻逼的样子而不由自主的想要表达敬仰or不屑或者嘲笑or同病相怜

那么实际上是哪一种呢,统计一下发帖回帖数量和股价对比一下看出来了,而且这个实现起来似乎也不难的样子,下回就开始试试这个吧。

数学限制了我的想象力

写到这里,我已经敏锐的发现了一个严重的问题,那就是对于这些数据,目前我自己能想到的玩法也就那么几种,复杂度的上限就是我能写出的最复杂的SQL而已。换句话说,就算是玩法的复杂度达到了我能力的极限,分析出来的结果对于一个思维能力正常的人来说依然是直观的,容易理解的。他会这样对我说:“哦,你用工具节省了统计的时间。“而不是像这样:”咦,这个结论你是怎么得到的?“原因也显而易见:数学限制了我的想象力,因此趁着寒假要买书来看看了。