您当前的位置: 首页 > 旅游

可以用机器研究历史吗

2019-03-13 02:16:59

大概在四五十年以前,美国历史学界曾经出现过一种崇尚以统计数据来撰写论文的热潮。这一风潮之下出现了一些比较机械的研究,简单介绍情况就开始堆数据,仿佛“数据覆盖面有多广,写出来的历史覆盖面就有多广”,而历史的本质:经验、感觉、物质或情感的联系、媒介等则受到轻视。这些工作本身不一定切题,又或许作者的“统计”完全是建立在对历史实践一知半解的基础上。其结果是,生产了不少空有一堆数据、底层框架或问题出发点却错误的研究。

当然,也应该看到历史研究是在演进的,人习得的知识可以教给机器。特别是近些年出现的大文本方法,对文本的吸收能力比单凭数据肯定是要强。然而,历史研究的本质是通过表象(史料)寻找过去的本相,而这种本相只能在人的意识中感知,而不会出现在另一种表象中。事实上,现在的大文本方法,也仍然有这种问题:通过文本方法能捕捉一些“联系”、抓出许多数据,但这些东西背后所蕴含的非文本因素,既然其价值与影响决定于人类阅读获知它们时的情感,那么对历史的判断和把握,也就不能舍弃人工。

这并不是说量化历史无意义。事实上,随着定量社会科学研究的兴起,历史学研究当中有许多领域早已“社科化”进而变为定量研究,这一部分的量化乃至机器自动处理都是可以做到的。笔者之前听过一个报告,

可以用机器研究历史吗

基于当地报纸数量、销量等研究两次大战之间德国和波兰两座城市的公民政治参与问题,这种研究显然机器化就很容易。然而更多的领域没有被剥离出来,往往更像“人文”而非“社科”。比如说研究18世纪中国部分省份的粮政筹划,这种研究里没有数据,文本也多是只言片语,含义必须结合语境来理解,这种东西即便未来有机器学习前景,大概也得很久以后了。

总而言之,机器学习可以简化历史研究,但它还不能实现历史研究。历史学工作层的一部分,恰恰就是把那些关于过去的、混沌不明的记忆转化为今天的人们可以理解的知识——这一步其实是在机器之前的。

■ 知乎ID:司马亮 中国古代史在读博士生

推荐阅读
图文聚焦