307 字

Sir Arthur Conan Doyle对统计建模的指导

昨天看”Quotes of the Day”,很吃惊地发现原来《福尔摩斯探案集》中还出现过这样的话:

… “I never guess. It is a capital mistake to theorize before one has data. Insensibly one begins to twist facts to suit theories, instead of theories to suit facts.”…

— Sir Arthur Conan Doyle

我拿出中文版的书找了一下,在《波希米亚丑闻》那篇中还的确出现过类似意思的话。

……“我尚无任何可以作出推断的根据。在得到根据之前就妄加推测,是大错而特错的事。有的人在不知不觉中歪曲事实以适应得出的推测,而不是以推测来适应事实。而我们现在手头上只有一纸便条。看你能从中推断出什么来?”……

— 《冒险史·波希米亚丑闻》 武铁民 雷春英译

在探案中,这是对推理的理性要求,在统计中,这就是对建模的道德要求:扭曲数据来适合模型还是改变模型去拟合数据?